ChatGPT представив голосовий диктант, але є причина, чому він ніколи не запрацює
Ключові висновки
- Нещодавно OpenAI оголосила, що ChatGPT зможе спілкуватися з користувачами за допомогою голосу.
- Технологія голосового диктування має недоліки, які перешкоджають її широкому впровадженню. Навіщо мати справу з довгими відповідями голосових помічників, коли можна швидко знайти відповіді самостійно?
- Конфіденційність також є основною проблемою голосових помічників через відсутність безпеки та ризик постійного прослуховування мікрофонів.
- Ексклюзивні пристрої з голосовим керуванням навряд чи стануть реальністю через практичні міркування та переваги користувачів. Хоча голосові помічники можуть бути корисними доповненнями, технологія для розуміння користувачів уже досягла задовільного рівня точності.
Серед потрясінь в OpenAI, компанія оголосила, що незабаром ChatGPT зможе спілкуватися з користувачами за допомогою їхніх голосів на Android та iOS. Користувач може не тільки спілкуватися з ChatGPT, але й отримувати звукову відповідь. Незважаючи на те, що на перший погляд це круто, є причина, чому голосовий диктант, технологія, яка здебільшого була зрілою протягом багатьох років, насправді не набула популярності. Звичайно, майже кожна велика екосистема має свою власну версію, від Amazon Alexa до Siri, але технологія має так багато недоліків, що навіть ChatGPT не може зробити її цікавою.
Ніхто не хоче мати справу з преамбулою
Просто дайте мені відповідь!
Одне з моїх найбільших роздратувань з голосовими помічниками пов’язане з тим, що я мав справу з першою частиною розмови та отриманням відповіді. Часто я можу шукати це швидше сам, і коли в мене зайняті руки, я вважаю, що найкраще використовувати ці типи помічників – це встановити таймери, не відповідати на повідомлення чи шукати запитання в Google. OpenAI нещодавно поділився прикладом розмови, яку ви могли б мати з ChatGPT.
Хоча технічно вражаюча, демонстрація трохи смішна. По-перше, питання про те, скільки 16-дюймових піц замовляти, абсурдне. Я розумію, що він існує, щоб продемонструвати здатність ChatGPT мати справу зі складними розмовами, але не лише відповідь є надмірно складною, але й доставка також. Якщо я задаю математичне запитання ШІ, я просто хочу отримати відповідь. Спочатку назвіть мені номер, а потім поясніть. Якщо мені байдуже пояснення, я можу просто скасувати відтворення.
Однак цього недостатньо змінити, тому що штучний інтелект може це зробити вже робити. Можливо, контекстний характер кількості шматочків піци та кількості людей вимагає від ШІ "дослідження", але в якийсь момент я впевнений, що такі функції з’являться в усіх інших голосових помічниках ШІ, теж. Як тільки це станеться, ми повернемося на круги своя, коли навіть найкращий Amazon Echo пристрої можуть робити те, до чого OpenAI рухається шаленою швидкістю.
Якщо я користуюся своїм смартфоном, мені легко швидко вводити текст і щось шукати. Я можу робити це будь-де, щоб мене не чули, а потім можу читати відповіді на дозвіллі. Якщо я попрошу голосового помічника знайти щось для мене, швидше за все, я шукаю це сам після факту, щоб побачити, які є інші варіанти. Голосові помічники занадто багатослівні, і ними завжди будуть.
Конфіденційність також викликає занепокоєння з двох сторін
Ніхто не хоче чути, які дурні мої запитання
Яка кінцева мета голосового помічника? Вони ніколи не замінять смартфони (як би цього не хотіли компанії на зразок Humane) з кількох ключових причин, найважливішою з яких є конфіденційність. Вхід у служби, надсилання особистих повідомлень або навіть пошук у Google тих дурних, дурних запитань, для яких ви використовуєте режим анонімного перегляду, насправді неможливо зробити приватно за допомогою голосового пристрою.
Як наслідок, за межами дуже нішевих контекстів приватного використання голосові помічники ніколи не можуть замінити смартфон чи пристрій приватного користування, і я не бачу, щоб це колись змінилося. Без фундаментальних змін у тому, як люди бачать власну конфіденційність і що вони готові сказати вголос, важко переконати людей, що вони хочуть використовувати свій голос для постійного керування своїми пристроями.
Нам не потрібно, щоб одне й те саме повідомлення читали в 15 різних місцях або щоб одна людина постійно запитувала, скільки 16-дюймових піц їм потрібно для 778 людей.
Уявіть собі світ, де замість того, щоб усі користувалися своїми телефонами в переповненому метро, вони використовують голосовий пристрій. Уявіть собі, наскільки це буде неспокійно, не кажучи вже про гучний звук. Вашим власним пристроям було б важко розрізняти голоси, а переповнене метро теоретично було б якофонією шуму. Метро досить погане. Для цього не потрібно, щоб той самий звіт читали в 15 різних місцях або щоб одна людина неодноразово запитувала, скільки 16-дюймових піц їм потрібно для 778 людей.
Також досить важко переконати людей, оскільки ваші пристрої не слухають вас цілодобово, без вихідних, але люди вже насторожені тим, що поруч із ними є мікрофони, які постійно прослуховують. З пристроями, якими можна керувати лише голосом, це буде важко ні відчувати, що до вас завжди прислухаються.
Лише голосові пристрої – мрія, яка ніколи не стане реальністю
І я в порядку з цим
Джерело: Humane
Я ентузіаст технологій, але думаю, що це на краще, що пристроями ще довго не керуватимуться виключно голосом. Це майже неможливо з причин, описаних тут. У той час як такі компанії, як Humane, розширюють межі, вони зрештою не зможуть захопити жодного розумного ринку за допомогою пристрою, який покладається на голос як основний спосіб керування.
Голосові помічники назавжди залишаться корисним доповненням до пристроїв, якими ми користуємося щодня, але технологія, щоб розуміти нас, уже давно достатньо хороша.