„ChatGPT“ įdiegė balso diktavimą, tačiau yra priežastis, kodėl jis niekada nepasieks
Key Takeaways
- „OpenAI“ neseniai paskelbė, kad „ChatGPT“ galės bendrauti su vartotojais balsu.
- Diktavimo balsu technologija turi trūkumų, trukdančių ją plačiai taikyti. Kam spręsti ilgus balso padėjėjų atsakymus, kai atsakymus galite greitai rasti patys?
- Privatumas taip pat kelia didelį susirūpinimą balso padėjėjams dėl saugumo trūkumo ir rizikos, kad mikrofonai visada klausosi.
- Išskirtiniai balsu valdomi įrenginiai vargu ar taps realybe dėl praktinių priežasčių ir vartotojų pageidavimų. Nors balso asistentai gali būti naudingi papildymai, naudotojų supratimo technologija jau pasiekė patenkinamą tikslumo lygį.
Tarp sumaišties OpenAI, bendrovė paskelbė, kad „ChatGPT“ netrukus galės bendrauti su vartotojais jų balsais „Android“ ir „iOS“. Naudotojas ne tik gali kalbėti su „ChatGPT“, bet ir gaus garsinį atsakymą. Nors iš pirmo žvilgsnio tai šaunu, yra priežastis, dėl kurios balso diktavimas – technologija, kuri jau daugelį metų buvo brandi, iš tikrųjų nepasitvirtino. Žinoma, beveik kiekviena pagrindinė ekosistema turi savo versiją, nuo „Amazon Alexa“ iki „Siri“, tačiau ši technologija turi tiek daug trūkumų, kad net „ChatGPT“ negali padaryti jos įdomios.
Niekas nenori nagrinėti preambulės
Tiesiog duok man atsakymą!
Vienas didžiausių mano susierzinimų dėl balso padėjėjų kyla dėl pokalbio inicijavimo ir atsakymo gavimo preambulės. Aš pats dažnai galiu greičiau jį surasti, o kai mano rankos yra pilnos, tokius pagalbininkus geriausia naudoti nustatydamas laikmačius, neatsakydamas į žinutes ar „Google“ klausimus. „OpenAI“ neseniai pasidalino pokalbio su „ChatGPT“ pavyzdžiu.
Nors techniškai įspūdinga, demonstracija yra šiek tiek juokinga. Visų pirma, klausimas – kiek 16 colių picų užsisakyti – absurdiškas. Suprantu, kad tai yra tam, kad pademonstruotų ChatGPT gebėjimą susidoroti su sudėtingais pokalbiais, bet ne tik atsakymas yra bereikalingai sudėtingas, bet ir pristatymas. Jei užduodu matematinį AI klausimą, aš tiesiog noriu atsakymo. Pirmiausia pasakykite man numerį, o tada paaiškinkite. Jei man nerūpi paaiškinimas, galiu tiesiog atšaukti atkūrimą.
Tačiau to pakeisti neužtenka, nes tai gali AI jau daryti. Galbūt dirbtinis intelektas reikalauja kontekstinio picos gabalėlių skaičiaus ir žmonių skaičiaus „tyrimas“, bet esu tikras, kad tam tikru momentu tokios funkcijos bus prieinamos visiems kitiems AI balso padėjėjams, taip pat. Kai tai pavyks, grįšime į pradinę padėtį, kai net geriausias „Amazon Echo“. įrenginiai gali padaryti tai, ko link OpenAI žengė didžiuliu tempu.
Jei naudoju išmanųjį telefoną, man lengva greitai ką nors įvesti ir ieškoti. Galiu tai padaryti bet kur, nebūdamas išgirstas, o tada laisvalaikiu galiu perskaityti atsakymus. Jei paprašau balso asistento, kad man ką nors surastų, gali būti, kad po to pats to ieškau, kad pamatyčiau, kokių dar yra galimybių. Balso padėjėjai yra per daug kalbūs ir visada bus.
Privatumas taip pat kelia susirūpinimą dviem aspektais
Niekas nenori girdėti, kokie kvaili yra mano klausimai
Koks galutinis balso asistento tikslas? Jie niekada nepakeis išmaniųjų telefonų (kaip to nori tokios įmonės kaip Humane) dėl kelių pagrindinių priežasčių, kurių svarbiausia yra privatumas. Prisijungimas prie paslaugų, privačių žinučių siuntimas ar net tų kvailų, kvailų klausimų, kuriems sprendžiate inkognito režimą, paieška iš tikrųjų neįmanoma privačiai naudojant balso įrenginį.
Dėl to už labai nišų asmeninio naudojimo kontekstų balso padėjėjai niekada negali pakeisti išmaniojo telefono ar privačiai naudojamo įrenginio, ir nemanau, kad tai kada nors keistųsi. Jei iš esmės nepasikeis žmonių požiūris į savo privatumą ir tai, ką jie nori pasakyti garsiai, sunku įtikinti žmones, kad jie nori kad visą laiką naudotų savo balsą prietaisams valdyti.
Mums nereikia, kad tas pats naujienų reportažas būtų skaitomas 15 skirtingų vietų arba vienas žmogus nuolat klaustų, kiek 16 colių picų reikia 778 žmonėms.
Įsivaizduokite pasaulį, kuriame užuot visi, kurie naudotųsi savo telefonais sausakimšame metro, jie naudojasi balsu valdomu įrenginiu. Įsivaizduokite, koks audringas tai būtų, jau nekalbant apie garsų. Jūsų pačių prietaisams būtų sunku atskirti balsus, o sausakimšas metro teoriškai būtų triukšmo kakofonija. Metro pakankamai blogas. Nereikia, kad tas pats naujienų reportažas būtų skaitomas 15 skirtingų vietų arba vienas žmogus nuolat klaustų, kiek 16 colių picų reikia 778 žmonėms.
Taip pat pakankamai sunku įtikinti žmones, nes jūsų įrenginiai jūsų neklauso 24 valandas per parą, 7 dienas per savaitę, bet žmonės jau nerimauja, kad šalia jų visada yra klausymosi mikrofonai. Su įrenginiais, kuriuos galima valdyti tik balsu, bus sunku ne kad visą laiką jaustųsi išklausytas.
Tik balso įrenginiai yra svajonė, kuri niekada netaps realybe
Ir man viskas gerai
Šaltinis: Humane
Esu technologijų entuziastas, bet manau, kad geriausia, kad įrenginiai ilgą laiką nebus valdomi tik balsu. Beveik neįmanoma, kad taip būtų dėl čia išdėstytų priežasčių. Nors tokios įmonės kaip „Humane“ veržiasi į priekį, galiausiai joms nepavyks užimti jokios pagrįstos rinkos su įrenginiu, kuris yra pagrindinis jo valdymo būdas.
Balso asistentai visada bus naudingas kasdien naudojamų įrenginių priedas, tačiau technologija, leidžianti mus suprasti, jau seniai buvo pakankamai gera.