ChatGPT je uveo glasovno diktiranje, ali postoji razlog zašto nikada neće istinski zaživjeti
Ključni zahvati
- OpenAI je nedavno najavio da će ChatGPT moći komunicirati s korisnicima putem glasa.
- Tehnologija glasovnog diktiranja ima nedostatke koji su spriječili njezino široko usvajanje. Zašto se baviti dugim odgovorima glasovnih asistenata kada sami možete brzo pronaći odgovore?
- Privatnost je također glavna briga kod glasovnih asistenata zbog nedostatka sigurnosti i rizika od mikrofona koji stalno slušaju.
- Ekskluzivni uređaji s glasovnim upravljanjem vjerojatno neće postati stvarnost zbog praktičnih razloga i preferencija korisnika. Iako glasovni pomoćnici mogu biti korisni dodaci, tehnologija za razumijevanje korisnika već je dosegla zadovoljavajuću razinu točnosti.
Usred previranja u OpenAI-ju, tvrtka je najavila da će ChatGPT uskoro moći komunicirati s korisnicima putem njihovih glasova na Androidu i iOS-u. Ne samo da korisnik može razgovarati s ChatGPT-om, već će sada primiti i zvučni odgovor. Iako je to naizgled cool, postoji razlog zašto glasovno diktiranje, tehnologija koja je već godinama uvelike zrela, nije baš zaživjela. Naravno, gotovo svaki veliki ekosustav ima svoju verziju, od Amazon Alexa do Siri, ali tehnologija ima toliko nedostataka da je čak ni ChatGPT ne može učiniti zanimljivom.
Nitko se ne želi baviti preambulom
Samo mi daj odgovor!
Jedna od mojih najvećih smetnji s glasovnim pomoćnicima dolazi od bavljenja preambulom pokretanja razgovora i dobivanja odgovora. Često to i sam mogu brže potražiti, au trenucima kada su mi pune ruke posla, ovu vrstu pomoćnika najbolje mogu iskoristiti za postavljanje mjerača vremena, ne odgovaranje na poruke ili guglanje pitanja. OpenAI je nedavno podijelio primjer razgovora koji biste mogli voditi s ChatGPT-om.
Iako je tehnički impresivna, demonstracija je pomalo smiješna. Kao prvo, pitanje - koliko pizza od 16 inča naručiti - je apsurdno. Razumijem da je tu kako bi pokazao sposobnost ChatGPT-a da se nosi sa složenim razgovorima, ali ne samo da je odgovor nepotrebno složen, već i isporuka. Ako postavljam matematičko pitanje umjetnoj inteligenciji, samo želim odgovor. Prvo mi reci broj, a onda objasni. Ako me nije briga za objašnjenje, mogu jednostavno prekinuti reprodukciju.
Promjena toga nije dovoljna, jer to je nešto što umjetna inteligencija može već čini. Možda kontekstualna priroda broja kriški pizze i broja ljudi zahtijeva da AI "istraživanje", ali u jednom trenutku, siguran sam da će takve značajke doći u sve druge AI glasovne asistente, isto. Jednom kada se to dogodi, vraćamo se na početak kada čak i najbolji Amazon Echo uređaji mogu učiniti ono prema čemu se OpenAI vrtoglavom brzinom kreće.
Ako koristim svoj pametni telefon, lako mi je brzo tipkati i tražiti nešto. To mogu učiniti bilo gdje, a da me nitko ne čuje, a zatim mogu čitati odgovore u slobodno vrijeme. Ako zamolim glasovnog asistenta da pronađe nešto za mene, velika je vjerojatnost da ću to sam potražiti naknadno da vidim koje druge opcije postoje. Glasovni pomoćnici su previše riječi i uvijek će biti.
Privatnost je također problem, i to na dva fronta
Nitko ne želi čuti koliko su moja pitanja glupa
Koji je krajnji cilj glasovnog asistenta? Nikada neće zamijeniti pametne telefone (koliko god tvrtke poput Humane to žele) iz nekoliko ključnih razloga, a najvažniji je privatnost. Prijavljivanje na servise, slanje privatnih poruka ili čak googlanje onih glupih, glupih pitanja za koja koristite anonimni način rada zapravo nije moguće učiniti privatno s uređajem koji se temelji na glasovnom načinu rada.
Kao rezultat toga, izvan vrlo nišnih konteksta za privatnu upotrebu, glasovni pomoćnici nikada ne mogu zamijeniti pametni telefon ili uređaj za privatnu upotrebu, i ne vidim da će se to ikada promijeniti. Bez temeljne promjene u tome kako ljudi gledaju na vlastitu privatnost i što su voljni reći naglas, teško je uvjeriti ljude da željeti koristiti svoj glas za upravljanje svojim uređajima cijelo vrijeme.
Ne treba nam da se ista vijest čita na 15 različitih mjesta ili da jedna osoba više puta pita koliko pizza od 16 inča treba za 778 ljudi.
Zamislite svijet u kojem, umjesto da svi koriste svoje telefone u prepunoj podzemnoj, koriste uređaj s glasovnim napajanjem. Zamislite koliko bi to bilo užurbano, a da ne spominjemo glasno. Vaši bi uređaji imali problema s razaznavanjem glasova, a prepuna podzemna željeznica teoretski bi bila kakofonija buke. Podzemna je dovoljno loša. Ne treba da se ista vijest čita na 15 različitih mjesta ili da jedna osoba više puta pita koliko pizza od 16 inča treba za 778 ljudi.
Također je dovoljno teško uvjeriti ljude jer vas vaši uređaji ne slušaju 24 sata dnevno, 7 dana u tjednu, ali ljudi su već ljuti oko toga da u svojoj blizini imaju mikrofone koji uvijek slušaju. S uređajima kojima se može upravljati samo glasom, bit će teško ne osjećati se uslišanim u svakom trenutku.
Uređaji samo za glas su san koji nikada neće postati stvarnost
I slažem se s tim
Izvor: Humano
Zaljubljenik sam u tehnologiju, ali mislim da je najbolje što se uređajima još dugo neće moći upravljati isključivo glasom. Gotovo je nemoguće da to bude slučaj zbog ovdje navedenih razloga. Dok tvrtke kao što je Humane guraju granice, u konačnici neće uspjeti osvojiti nikakvo razumno tržište s uređajem koji se oslanja na glas kao glavni način upravljanja.
Glasovni pomoćnici zauvijek će biti koristan dodatak uređajima koje svakodnevno koristimo, ali tehnologija koja nas razumije već je dugo dovoljno dobra.