ChatGPT ir ieviesusi balss diktēšanu, taču ir iemesls, kāpēc tas nekad īsti nedarbosies
Key Takeaways
- OpenAI nesen paziņoja, ka ChatGPT varēs sazināties ar lietotājiem, izmantojot balsi.
- Balss diktēšanas tehnoloģijai ir trūkumi, kas ir kavējuši tās plašu ieviešanu. Kāpēc risināt balss palīgu garās atbildes, ja atbildes varat ātri atrast pats?
- Privātums ir arī liela problēma ar balss palīgiem drošības trūkuma un vienmēr klausīšanās mikrofonu riska dēļ.
- Ekskluzīvas ar balsi darbināmas ierīces, visticamāk, nekļūs par realitāti praktisku iemeslu un lietotāju vēlmju dēļ. Lai gan balss palīgi var būt noderīgi papildinājumi, tehnoloģija lietotāju izpratnei jau ir sasniegusi apmierinošu precizitātes līmeni.
Starp OpenAI satricinājumiem, uzņēmums paziņoja, ka ChatGPT drīzumā varēs sazināties ar lietotājiem, izmantojot viņu balsis operētājsistēmās Android un iOS. Lietotājs ne tikai var runāt ar ChatGPT, bet tagad arī saņems dzirdamu atbildi. Lai gan ārēji tas ir forši, ir iemesls, kāpēc balss diktēšana — tehnoloģija, kas lielākoties ir nobriedusi jau daudzus gadus, tā īsti nav sākusies. Protams, gandrīz katrai lielākajai ekosistēmai ir sava versija, sākot no Amazon Alexa līdz Siri, taču tehnoloģijai ir tik daudz trūkumu, ka pat ChatGPT nevar padarīt to interesantu.
Neviens nevēlas nodarboties ar preambulu
Vienkārši sniedziet man atbildi!
Viens no maniem lielākajiem kairinājumiem saistībā ar balss palīgiem ir saistīts ar preambulu gan sarunas uzsākšanai, gan atbildes saņemšanai. Bieži vien es pats varu to meklēt ātrāk, un brīžos, kad manas rokas ir pilnas, šāda veida palīgus vislabāk var izmantot taimera iestatīšanai, neatbildēšanai uz ziņojumiem vai googlēšanas jautājumiem. OpenAI nesen kopīgoja piemēru sarunai, kuru varētu veikt ar ChatGPT.
Lai gan tehniski iespaidīgs, demonstrācija ir mazliet smieklīga. Pirmkārt, jautājums par to, cik 16 collu picas pasūtīt, ir absurds. Es saprotu, ka tas ir paredzēts, lai parādītu ChatGPT spēju risināt sarežģītas sarunas, taču atbilde ir ne tikai nevajadzīgi sarežģīta, bet arī piegāde. Ja es uzdodu matemātisko jautājumu par AI, es tikai vēlos saņemt atbildi. Vispirms pasakiet man numuru un pēc tam paskaidrojiet. Ja man ir vienalga par skaidrojumu, es varu vienkārši atcelt atskaņošanu.
Tomēr ar tās pārslēgšanu nepietiek, jo AI var to izdarīt jau darīt. Varbūt picas šķēles un cilvēku skaita kontekstuālais raksturs prasa AI "pētniecība", bet kādā brīdī esmu pārliecināts, ka tādas funkcijas tiks izmantotas visiem citiem AI balss palīgiem, arī. Kad tas ir izdarīts, mēs atgriezīsimies sākotnējā stāvoklī, kad pat labākā Amazon Echo ierīces var paveikt to, uz ko OpenAI ir virzījies milzīgā tempā.
Ja izmantoju viedtālruni, man ir viegli ātri kaut ko ierakstīt un meklēt. Es varu to darīt jebkur, nesadzirdot, un pēc tam varu izlasīt atbildes brīvajā laikā. Ja es palūdzu balss asistentam kaut ko atrast, iespējams, es pats to meklēju, lai redzētu, kādas ir citas iespējas. Balss asistenti ir pārāk daudz vārdu, un viņi vienmēr būs.
Arī privātums rada bažas divās jomās
Neviens negrib dzirdēt, cik stulbi ir mani jautājumi
Kāds ir balss asistenta gala mērķis? Viņi nekad neaizstās viedtālruņus (ciktāl tādi uzņēmumi kā Humane to vēlas) vairāku galveno iemeslu dēļ, no kuriem vissvarīgākais ir privātums. Pieteikšanos pakalpojumos, privātu ziņojumu sūtīšanu vai pat muļķīgo, muļķīgo jautājumu googlēšanu, kuriem izmantojat inkognito režīmu, nav iespējams veikt privāti, izmantojot balss ierīci.
Tā rezultātā ārpus ļoti nišas, privātas lietošanas kontekstiem balss palīgi nekad nevar aizstāt viedtālruni vai privāti lietotu ierīci, un es neredzu, ka tas kādreiz mainītos. Bez būtiskām izmaiņām tajā, kā cilvēki uztver savu privātumu un ko viņi ir gatavi teikt skaļi, ir grūti pārliecināt cilvēkus, ka viņi gribu lai visu laiku izmantotu savu balsi, lai darbinātu savas ierīces.
Mums nav nepieciešams, lai viens un tas pats ziņu ziņojums tiktu nolasīts 15 dažādās vietās vai viena persona atkārtoti jautā, cik 16 collu picu viņiem nepieciešams 778 cilvēkiem.
Iedomājieties pasauli, kurā tā vietā, lai visi lietotu tālruņus pilnā metro, viņi izmanto ar balsi darbināmu ierīci. Iedomājieties, cik drudžains tas kļūtu, nemaz nerunājot par skaļu. Jūsu ierīcēm būtu grūti atšķirt balsis, un pārpildīts metro teorētiski būtu trokšņa kakofonija. Metro ir pietiekami slikts. Nav nepieciešams, lai viens un tas pats ziņu ziņojums tiktu nolasīts 15 dažādās vietās vai viena persona atkārtoti jautā, cik 16 collu picas viņiem nepieciešams 778 cilvēkiem.
Ir arī pietiekami grūti pārliecināt cilvēkus, jo jūsu ierīces neklausās jūs 24 stundas diennaktī, 7 dienas nedēļā, bet cilvēki jau ir satraukušies par to, ka viņu tuvumā vienmēr ir klausīšanās mikrofoni. Ar ierīcēm, kuras var vadīt tikai ar balsi, tas būs grūti nē lai vienmēr justos uzklausīts.
Tikai balss ierīces ir sapnis, kas nekad nekļūs par realitāti
Un ar to man viss ir kārtībā
Avots: Humane
Es esmu tehnoloģiju entuziasts, bet es domāju, ka tas ir labākais, ka ierīces ilgu laiku netiks vadītas tikai ar balsi. Šeit izklāstīto iemeslu dēļ tas gandrīz nav iespējams. Lai gan uzņēmumi, piemēram, Humane, virzās uz priekšu, viņiem galu galā neizdosies iegūt nevienu saprātīgu tirgu, izmantojot ierīci, kuras galvenais darbības veids ir balss.
Balss palīgi uz visiem laikiem būs noderīgs papildinājums ierīcēm, kuras lietojam ikdienā, taču tehnoloģija, kas mūs izprot, ir bijusi pietiekami laba jau ilgu laiku.