ChatGPT zaviedol hlasové diktovanie, ale existuje dôvod, prečo sa nikdy skutočne nerozbehne
Kľúčové informácie
- OpenAI nedávno oznámila, že ChatGPT bude môcť komunikovať s používateľmi prostredníctvom hlasu.
- Technológia hlasového diktovania má nedostatky, ktoré bránia jej širokému prijatiu. Prečo sa zaoberať zdĺhavými odpoveďami hlasových asistentov, keď odpovede môžete rýchlo nájsť sami?
- Súkromie je tiež hlavným problémom hlasových asistentov z dôvodu nedostatočnej bezpečnosti a rizika neustáleho počúvania mikrofónov.
- Exkluzívne hlasom ovládané zariadenia sa z praktických dôvodov a preferencií používateľov pravdepodobne nestanú realitou. Aj keď hlasoví asistenti môžu byť užitočnými doplnkami, technológia na pochopenie používateľov už dosiahla uspokojivú úroveň presnosti.
Uprostred nepokojov na OpenAI, spoločnosť oznámila, že ChatGPT bude čoskoro môcť komunikovať s používateľmi prostredníctvom ich hlasov v systémoch Android a iOS. Používateľ môže nielen hovoriť s ChatGPT, ale teraz dostane aj počuteľnú odpoveď. Aj keď je to na prvý pohľad cool, existuje dôvod, prečo sa hlasové diktovanie, technológia, ktorá je už mnoho rokov väčšinou vyspelá, skutočne nepresadila. Iste, takmer každý veľký ekosystém má svoju vlastnú verziu, od Amazon Alexa po Siri, ale táto technológia má toľko nedostatkov, že ani ChatGPT ju nedokáže urobiť zaujímavým.
Nikto sa nechce zaoberať preambulou
Len mi daj odpoveď!
Jedna z mojich najväčších nepríjemností s hlasovými asistentmi pochádza z toho, že sa zaoberám preambulou začatia konverzácie a získaním odpovede. Sám to často dokážem vyhľadať rýchlejšie a v časoch, keď mám plné ruky práce, najlepšie využitie týchto asistentov je pre nastavovanie časovačov, neodpovedanie na správy alebo googlovanie otázok. OpenAI nedávno zdieľal príklad konverzácie, ktorú by ste mohli viesť s ChatGPT.
Aj keď je ukážka technicky pôsobivá, je trochu smiešna. Po prvé, otázka - koľko 16-palcových pizze si objednať - je absurdná. Rozumiem, že je to na to, aby demonštrovala schopnosť ChatGPT riešiť zložité konverzácie, ale nielenže je zbytočne zložitá odpoveď, ale aj dodanie. Ak sa pýtam umelej inteligencie na matematickú otázku, chcem len odpoveď. Najprv mi povedz to číslo a potom to vysvetli. Ak mi na vysvetleni nezáleží, môžem jednoducho zrušiť prehrávanie.
Prepnúť to však nestačí, pretože to je niečo, čo AI dokáže už robiť. Možno si to vyžaduje kontextová povaha počtu plátkov pizze a počtu ľudí „výskum“, ale som si istý, že v určitom okamihu sa takéto funkcie dostanú aj do všetkých ostatných hlasových asistentov AI, tiež. Akonáhle sa to stane, sme späť na začiatku, keď dokonca najlepšie Amazon Echo zariadenia dokážu to, k čomu sa OpenAI približuje závratným tempom.
Ak používam svoj smartfón, je pre mňa ľahké rýchlo niečo napísať a vyhľadať. Môžem to urobiť kdekoľvek, bez toho, aby ma niekto počul, a potom si môžem prečítať odpovede vo svojom voľnom čase. Ak požiadam hlasového asistenta, aby mi niečo našiel, je pravdepodobné, že to potom sám vyhľadám, aby som zistil, aké sú ďalšie možnosti. Hlasoví asistenti sú príliš rozvláčni a vždy budú.
Súkromie je tiež problémom na dvoch frontoch
Nikto nechce počuť, aké hlúpe sú moje otázky
Aký je konečný cieľ hlasového asistenta? Nikdy nenahradia smartfóny (ako to chcú spoločnosti ako Humane) z niekoľkých kľúčových dôvodov, z ktorých najdôležitejším je súkromie. Prihlasovanie sa do služieb, posielanie súkromných správ alebo dokonca googlovanie tých hlúpych, hlúpych otázok, na ktoré používate režim inkognito, nie je naozaj možné robiť súkromne pomocou hlasového zariadenia.
Výsledkom je, že mimo veľmi úzkych kontextov súkromného použitia hlasoví asistenti nikdy nemôžu nahradiť smartfón alebo súkromne používané zariadenie a nevidím, že by sa to niekedy zmenilo. Bez zásadnej zmeny v tom, ako ľudia vnímajú svoje súkromie a čo sú ochotní povedať nahlas, je ťažké presvedčiť ľudí, že chcieť používať svoj hlas na neustále ovládanie svojich zariadení.
Nepotrebujeme, aby sa tie isté správy čítali na 15 rôznych miestach, alebo aby sa jedna osoba opakovane pýtala, koľko 16-palcových pizze potrebuje pre 778 ľudí.
Predstavte si svet, kde namiesto toho, aby všetci používali svoje telefóny v preplnenom metre, používajú hlasové zariadenia. Predstavte si, aké hektické by to bolo, nehovoriac o tom nahlas. Vaše vlastné zariadenia by mali problém rozoznať hlasy a preplnené metro by teoreticky bolo kakofóniou hluku. Metro je dosť zlé. Nepotrebuje, aby sa tie isté správy čítali na 15 rôznych miestach, ani sa jedna osoba opakovane pýtala, koľko 16-palcových pizze potrebuje pre 778 ľudí.
Je tiež dosť ťažké presvedčiť ľudí, pretože je to tak, že vaše zariadenia vás nepočúvajú 24 hodín denne, 7 dní v týždni, ale ľudia sú už teraz znepokojení tým, že majú blízko seba neustále počúvajúce mikrofóny. So zariadeniami, ktoré sa dajú ovládať len hlasom, to bude ťažké nie cítiť sa vždy vypočutý.
Zariadenia s iba hlasovým ovládaním sú snom, ktorý sa nikdy nestane realitou
A som s tým v poriadku
Zdroj: Humane
Som technologický nadšenec, ale myslím si, že najlepšie bude, keď sa zariadenia už dlho nebudú ovládať výlučne hlasom. Je takmer nemožné, aby to tak bolo z dôvodov, ktoré sú tu uvedené. Zatiaľ čo spoločnosti ako Humane posúvajú hranice, nakoniec sa im nepodarí zachytiť žiadny rozumný trh so zariadením, ktoré sa spolieha na hlas ako hlavný spôsob prevádzky.
Hlasoví asistenti budú navždy užitočným doplnkom zariadení, ktoré používame denne, ale technológia, ktorá nám porozumie, je už dlho dosť dobrá.