ЦхатГПТ је увео гласовно диктирање, али постоји разлог зашто то никада неће заиста заживети
Кључне Такеаваис
- ОпенАИ је недавно најавио да ће ЦхатГПТ моћи да комуницира са корисницима путем гласа.
- Технологија гласовног диктирања има недостатке који су ометали њено широко усвајање. Зашто се бавити дугим одговорима гласовних асистената када сами можете брзо да пронађете одговоре?
- Приватност је такође главна брига за гласовне асистенте због недостатка сигурности и ризика од сталног слушања микрофона.
- Ексклузивни уређаји којима се управља гласом вероватно неће постати стварност због практичних разлога и преференција корисника. Док гласовни асистенти могу бити корисни додаци, технологија за разумевање корисника је већ достигла задовољавајући ниво тачности.
Усред превирања у ОпенАИ, компанија је објавила да ће ЦхатГПТ ускоро моћи да комуницира са корисницима путем њихових гласова на Андроид-у и иОС-у. Не само да корисник може да разговара са ЦхатГПТ-ом, већ ће сада добити и звучни одговор. Иако је то на први поглед кул, постоји разлог зашто гласовни диктирање, технологија која је углавном зрела већ дуги низ година, није заиста узела маха. Наравно, скоро сваки велики екосистем има своју верзију, од Амазон Алека до Сири, али технологија има толико недостатака да чак ни ЦхатГПТ не може да је учини занимљивом.
Нико не жели да се бави преамбулом
Само ми дај одговор!
Једна од мојих највећих сметњи са гласовним асистентима долази због тога што се бавим преамбулом и иницирања разговора и добијања одговора. Често и сам могу брже да га потражим, а у тренуцима када су ми руке пуне, најбоља употреба коју налазим за ове врсте помоћника је подешавање тајмера, а не одговарање на поруке или питања у гуглању. ОпенАИ је недавно поделио пример разговора који бисте могли да имате са ЦхатГПТ-ом.
Иако је технички импресивна, демонстрација је помало смешна. Прво, питање - колико пица од 16 инча наручити - је апсурдно. Разумем да је ту да покаже способност ЦхатГПТ-а да се носи са сложеним разговорима, али не само да је одговор непотребно сложен, већ је и испорука. Ако постављам математичко питање вештачкој интелигенцији, само желим одговор. Прво ми реци број, па онда објасни. Ако ме није брига за објашњење, могу само да откажем репродукцију.
Међутим, то није довољно, јер то је нешто што АИ може већ урадите. Можда контекстуална природа броја кришки пице и броја људи захтева да вештачка интелигенција „истраживање“, али у неком тренутку, сигуран сам да ће такве функције доћи до свих других гласовних помоћника АИ, такође. Када се то деси, враћамо се на почетак када се изједначи најбољи Амазон Ецхо уређаји могу да ураде оно ка чему се ОпенАИ кретао вртоглавим темпом.
Ако користим паметни телефон, лако ми је да брзо куцам и тражим нешто. То могу да урадим било где, а да ме не чују, а онда могу да прочитам одговоре у слободно време. Ако замолим гласовног асистента да пронађе нешто за мене, велике су шансе да то сам потражим накнадно да видим које друге опције постоје. Гласовни асистенти су превише речити, и увек ће бити.
Приватност је такође забринутост на два фронта
Нико не жели да чује колико су моја питања глупа
Шта је крајњи циљ гласовног асистента? Они никада неће заменити паметне телефоне (колико то желе компаније као што је Хумане) из неколико кључних разлога, од којих је најважнији приватност. Пријављивање на услуге, слање приватних порука или чак гуглање тих глупих, глупих питања за која користите анонимни режим није заиста могуће урадити приватно помоћу уређаја заснованог на гласу.
Као резултат тога, ван веома нишних контекста за приватну употребу, гласовни асистенти никада не могу заменити паметни телефон или уређај који се користи у приватној употреби, и не видим да ће се то икада променити. Без суштинске промене у томе како људи виде своју приватност и шта су спремни да кажу наглас, тешко је убедити људе да желим да користе свој глас за управљање својим уређајима све време.
Не треба нам да се исти извештај чита на 15 различитих места или да се једна особа стално пита колико пица од 16 инча им треба за 778 људи.
Замислите свет у коме, уместо да сви користе своје телефоне у препуном метроу, они користе уређај са гласовним напајањем. Замислите колико би то постало ужурбано, да не кажем гласно. Ваши сопствени уређаји би имали проблема да разазнају гласове, а препуна подземна железница би теоретски била какофонија буке. Метро је довољно лош. Није потребно да се исти извештај чита на 15 различитих места или да се једна особа стално пита колико пица од 16 инча им треба за 778 људи.
Такође је довољно тешко убедити људе јер вас уређаји не слушају 24 сата дневно, 7 дана у недељи, али људи су већ нервозни због тога што у близини имају микрофоне који увек слушају. Са уређајима којима се може управљати само гласом, биће тешко не да се осећа слушано у сваком тренутку.
Уређаји само за глас су сан који никада неће постати стварност
И ја сам ОК са тим
Извор: Хумане
Ја сам технолошки ентузијаста, али мислим да је најбоље што се уређајима неће дуго управљати искључиво гласом. Готово је немогуће да то буде случај из разлога који су овде наведени. Док компаније као што је Хумане померају оквире, оне на крају неће успети да заузму било какво разумно тржиште са уређајем који се ослања на глас као главни начин управљања њиме.
Гласовни асистенти ће заувек бити користан додатак уређајима које свакодневно користимо, али технологија да нас разуме већ дуго је довољно добра.