Будинки Вперед мислення Розумні помічники: що відбувається після сирі?

Розумні помічники: що відбувається після сирі?

Відео: рекламный ролик про пеностекло (Вересень 2024)

Відео: рекламный ролик про пеностекло (Вересень 2024)
Anonim

Розумні помічники - Сірі, Google Асистент, Кортана тощо - перейшли від курйозів та прийомів салону лише кілька років тому до найважливіших інструментів, якими користуються багато людей у ​​повсякденному житті. Минулого тижня я відмовився від конференції «Інтелектуальні помічники» у Нью-Йорку, представленої Opus Research, і був вражений прогресом програмного забезпечення в різних галузях, включаючи прогрес фінансових, страхових та медичних компаній у створенні конкретних агентів .

Засновник Opus Research Ден Міллер пояснив, що багато основних технологій, таких як розпізнавання мови, існують вже більше 20 років. Незважаючи на те, що останнім часом він бачив значні вдосконалення, а не революцію, він сказав, що "ми на еволюційному шляху", з безліччю продуктів на континуумі з різними можливостями. Він зазначив, що є сотні розумних помічників підприємств, яких можна використовувати для простої текстової розмови простою англійською мовою за допомогою фіксованого набору даних та для таких речей, як навігація по веб-сайту чи поширені запитання. На іншому кінці спектру, мабуть, є лише кілька десятків "динамічних програм, що відчувають почуття людини", які мають більше розмов і контекст.

Міллер вказав на заявки, які виграли нагороди на конференції. Джулі Amtrak розпочала роботу як агент інтерактивного голосового відгуку по телефону, але зараз перетворилася на агент, який працює на веб-сайті, щоб направляти мандрівників по Amtrak.com на базі агента Next IT. Telefonica Mexico має агента на ім’я Ніко, який має аватар, а також надає підтримку через Twitter та Facebook, базуючись на платформі AgentBot. ING Нідерланди має Inge - додаток, який дозволяє перевіряти баланс банківського рахунку або переказувати гроші за допомогою голосу, використовуючи голосову біометричну технологію від Nuance, щоб підтвердити свою особу.

Почесні згадки включають додатки для охорони здоров’я, наприклад, додаток, який допоможе вам вибрати план охорони здоров’я. Інші програми, про які я чув на виставці, включають Pizza Domino, в якому є додаток під назвою Dom, що дозволяє використовувати голос для замовлення піци; та BMW, який має віртуального агента як частину своєї фінансової групи Up2drive.

Нуретс Бретт Беранек розповів про те, як розвиток нейронних мереж з глибоким навчанням покращив такі речі, як розуміння природних мов, а також розпізнавання голосу, і як це зараз поєднується, щоб забезпечити набагато більший інтерес у цій галузі. Помічник Ніни Нюанс був раннім прикладом, і з тих пір він перетворився на безліч конкретних програм, починаючи від інтерактивних систем голосового реагування в страхових компаніях і закінчуючи торговими програмами. Кожне з цих додатків має різну індивідуальність, залежно від того, що він намагається допомогти вам зробити.

Ще одна нова особливість, яку він обговорював, - це голосова біометрія, в якій ваш голос замінює пароль. Він розповів про те, як такі компанії, як ING в Європі, розробляють агенти, які не тільки використовують розпізнавання голосу та природну обробку мови, але й починають використовувати голос для розпізнавання людини, яка телефонує. Він сказав, що це і безпечніше, і природніше, ніж традиційний пароль.

Хоча останні дослідження стурбовані тим, що звукозаписи можуть обдурити подібні системи, Нуанс зазначив, що сьогоднішня технологія включає функції, спрямовані на підбір аномалій із записаного голосу, і вказав на інші дослідження, які займали іншу точку зору. Крім того, за його словами, дизайнери можуть використовувати різні рівні голосової біометрики для різних функцій, як-от використання простого розпізнавання для перевірки залишку на рахунку або прохання повторити випадкову послідовність слів для значних грошових переказів.

Звичайно, голосова біометрика набирає особливої ​​тяги. На минулому тижні на симпозіумі Gartner на сесії "круті випадки клієнтів" у фінансових послугах було включено додаток Citibank, який використовував цю функцію.

У MyWave є помічник, який називається Frank, який призначений для ввімкнення кількох підприємств, що дозволяє вам спілкуватися з ними більш розмовно, а не кожен бізнес розвивати свій власний. До перших застосувань належать банк Нової Зеландії та додаток під назвою Saveawatt, який допоможе вам вибрати постачальника електроенергії.

Генеральний директор Джералдін МакБрайд пояснила, що компанія намагається створити помічників, які б подолали розрив між клієнтами та сервісними програмами, з тим, що це називає "відносинами з клієнтами" або CMR, що стосується традиційних CRM-додатків. Велика різниця, за її словами, полягає в тому, що замовник відповідає за всі свої дані, а не про бізнес.

Інша відносно нова компанія, Expect Labs, має продукт під назвою MindMeld, який працює в якості доповнення для ряду компаній, які хочуть запропонувати голосовий інтерфейс для заміни традиційних інтерфейсів та обробляти питання та відповіді. Це може бути використано для різних застосунків, таких як перегляд телепередач, просто запитуючи ім'я та запитуючи систему на кілька систем. (Fire TV Amazon має деякі з цих функцій, але він не інтегрований з вашою кабельною телеприставкою, тоді як одним з інвесторів в Expect Labs є кабельна компанія Liberty Global.)

Генеральний директор Тім Таттл пояснив, що MindMeld прагне використовувати розпізнавання мовлення, яке вже доступне в більшості пристроїв, і замість цього фокусується на розумінні природної мови та побудові графіка знань з наявної інформації. За його словами, фірма намагається розширити масштаб системи, щоб включити більше інформації з різних джерел, та розбити ієрархії різних категорій інформації, що входять до складу більшості таких систем. Дійсно розуміти питання означає вміти розуміти наміри в різних категоріях, сказав він.

Одне, що я чув від кількох присутніх, - це статистика, яка дозволяє стверджувати, що приблизно 10 відсотків усіх пошукових запитів в Інтернеті зараз здійснюються за допомогою розвідувальних агентів. (Піонер А.І. Ендрю Нг сказав, що це було правдою для голосового пошуку в Baidu в минулому році, і кілька людей сказали, що це зараз правда і в Google, але я не чув жодного підтвердження з перших рук.)

Забігаючи наперед, Міллер Opus Research сказав, що ще належить зробити багато роботи. Основна точність систем має багато можливостей для вдосконалення, зокрема, переходячи від того, що ви говорите, до того, що ви маєте на увазі, і що робити в результаті. Він згадав на конференції генерального директора Xerox PARC Стівена Гувера, який сказав, що сьогодні системи до 90 відсотків точні в розумінні того, що ми маємо на увазі, але 10 відсотків все ще є проблемою, тому що це те, що більшість людей пам'ятають, коли мають справу з система. І Міллер сказав, що є місце для кращої персоналізації, оскільки якщо система знає, з ким вона розмовляє, вона може дати кращі результати. Наприклад, він зазначив, що Facebook знає, хто використовує систему, оскільки ви ввійшли в систему; і сказав, що безперебійно це робити з більшою кількістю агентів стане важливішим.

Це, безумовно, захоплююча категорія, і я сподіваюся, що всі ми будемо витрачати набагато більше часу на спілкування з нашими телефонами та комп’ютерами та взаємодію з агентами, які не зовсім люди. Я вважаю це однією з найбільш інтригуючих тенденцій в обчислювальній роботі в наші дні.

Розумні помічники: що відбувається після сирі?