ChatGPT on ottanut käyttöön äänisanelun, mutta siihen on syynsä, miksi se ei koskaan todellakaan nouse
Key Takeaways
- OpenAI ilmoitti äskettäin, että ChatGPT voi olla vuorovaikutuksessa käyttäjien kanssa puheen avulla.
- Äänesanelutekniikassa on puutteita, jotka ovat estäneet sen laajan käyttöönoton. Miksi käsitellä puheavustajien pitkiä vastauksia, kun voit löytää vastaukset nopeasti itse?
- Yksityisyys on myös suuri huolenaihe puheavustajien kanssa turvallisuuden puutteen ja aina kuuntelevien mikrofonien riskin vuoksi.
- Ainutlaatuisista ääniohjatuista laitteista ei todennäköisesti tule todellisuutta käytännön syistä ja käyttäjien mieltymyksistä johtuen. Vaikka puheavustajat voivat olla hyödyllisiä lisäyksiä, käyttäjiä ymmärtävä tekniikka on jo saavuttanut tyydyttävän tarkkuustason.
OpenAI: n myllerryksen keskellä, yhtiö ilmoitti, että ChatGPT pystyy pian olemaan vuorovaikutuksessa käyttäjien kanssa heidän äänellään Android- ja iOS-laitteissa. Käyttäjä ei voi vain puhua ChatGPT: lle, vaan hän saa nyt myös äänivastauksen. Vaikka se onkin pinnalla siistiä, on syytä, miksi äänisanelu, tekniikka, joka on ollut enimmäkseen kypsä jo useiden vuosien ajan, ei ole todellakaan saanut nousua. Toki melkein jokaisella suurella ekosysteemillä on oma versio Amazon Alexasta Siriin, mutta tekniikassa on niin paljon puutteita, että edes ChatGPT ei voi tehdä siitä mielenkiintoista.
Kukaan ei halua käsitellä johdantoa
Anna vain vastaus!
Yksi suurimmista kiusauksistani puheavustajien kanssa johtuu keskustelun aloittamisesta ja vastauksen saamisesta. Pystyn usein etsimään sen itse nopeammin, ja aikoina, kun käteni ovat täynnä, löydän tämän tyyppisille avustajille parhaiten ajastimen asettamisen, ei vastaa viesteihin tai googlaa. OpenAI jakoi äskettäin esimerkin keskustelusta, jonka voisit käydä ChatGPT: n kanssa.
Vaikka esitys on teknisesti vaikuttava, se on hieman naurettava. Ensinnäkin kysymys - kuinka monta 16 tuuman pizzaa tilataan - on absurdi. Ymmärrän, että se on olemassa osoittamaan ChatGPT: n kykyä käsitellä monimutkaisia keskusteluja, mutta vastaus ei ole vain tarpeettoman monimutkainen, vaan myös toimitus on. Jos kysyn matemaattisen kysymyksen tekoälystä, haluan vain vastauksen. Kerro ensin numero ja selitä se sitten. Jos en välitä selityksestä, voin vain peruuttaa toiston.
Sen vaihtaminen ei kuitenkaan riitä, koska tekoäly pystyy siihen jo tehdä. Ehkä pizzaviipaleiden ja ihmisten määrän kontekstuaalinen luonne vaatii tekoälyä "tutkimus", mutta jossain vaiheessa olen varma, että tällaisia ominaisuuksia tulee kaikille muille tekoälyn ääniavustajille, liian. Kun se on tehty, palaamme alkupisteeseen, kun jopa paras Amazon Echo laitteet voivat tehdä sen, mihin OpenAI on edennyt huimaa vauhtia.
Jos käytän älypuhelinta, minun on helppo kirjoittaa ja etsiä jotain nopeasti. Voin tehdä sen missä tahansa ilman, että minua kuullaan, ja voin sitten lukea vastaukset läpi rauhassa. Jos pyydän puheavustajaa löytämään jotain minulle, todennäköisesti etsin sen itse jälkikäteen nähdäkseni mitä muita vaihtoehtoja on. Ääniavustajat ovat liian sanallisia, ja tulevat aina olemaan.
Yksityisyys on myös huolenaihe kahdella rintamalla
Kukaan ei halua kuulla kuinka typeriä kysymykseni ovat
Mikä on ääniavustajan lopullinen tavoite? Ne eivät koskaan korvaa älypuhelimia (niin paljon kuin Humanen kaltaiset yritykset haluavat niitä) useista keskeisistä syistä, joista tärkein on yksityisyys. Palveluihin kirjautuminen, yksityisviestien lähettäminen tai edes tyhmien kysymysten googaaminen, joihin käytät incognito-tilaa, ei todellakaan ole mahdollista yksityisesti puhepohjaisella laitteella.
Tämän seurauksena ääniavustajat eivät voi koskaan korvata älypuhelinta tai yksityisesti käytettyä laitetta erittäin kapean yksityisen käytön ulkopuolella, enkä näe sen muuttuvan koskaan. Ilman perustavanlaatuista muutosta siinä, miten ihmiset näkevät oman yksityisyytensä ja mitä he ovat valmiita sanomaan ääneen, on vaikea vakuuttaa ihmisiä siitä, että he haluta käyttää ääntään laitteidensa ohjaamiseen koko ajan.
Emme tarvitse samaa uutisraporttia luettavana 15 eri paikassa tai yhden henkilön toistuvasti kysyvän, kuinka monta 16 tuuman pizzaa he tarvitsevat 778 hengelle.
Kuvittele maailma, jossa sen sijaan, että kaikki käyttäisivät puhelimiaan täpötäydessä metrossa, he käyttävät äänikäyttöistä laitetta. Kuvittele kuinka hektistä siitä tulee, puhumattakaan äänekkäästä. Omilla laitteillasi olisi vaikeuksia erottaa ääniä, ja pakattu metro olisi teoriassa melun kakofonia. Metro on tarpeeksi huono. Se ei vaadi samaa uutisraporttia luettavaksi 15 eri paikassa tai yhden henkilön toistuvasti kysyvän, kuinka monta 16 tuuman pizzaa he tarvitsevat 778 hengelle.
Ihmiset on myös tarpeeksi vaikeaa vakuuttaa, koska laitteesi eivät kuuntele sinua 24/7, mutta ihmiset ovat jo nyt vihaisia siitä, että heidän lähellään on aina kuuntelevia mikrofoneja. Laitteilla, joita voidaan ohjata vain ääniohjauksella, se on vaikeaa ei tuntea olevansa kuunneltu aina.
Vain puhelaitteet ovat unelma, josta ei koskaan tule totta
Ja minä olen kunnossa sen kanssa
Lähde: Humane
Olen tekniikan ystävä, mutta mielestäni on parasta, että laitteet eivät tule olemaan pitkään aikaan yksinomaan puheohjattuja. On lähes mahdotonta, että näin olisi tässä kuvatuista syistä. Vaikka Humanen kaltaiset yritykset ponnistelevat, ne eivät lopulta pysty valloittamaan mitään järkeviä markkinoita laitteella, joka käyttää ääntä pääasiallisena tapana käyttää sitä.
Ääniavustajat ovat ikuisesti hyödyllinen lisä päivittäin käyttämiimme laitteisiin, mutta tekniikka ymmärtää meitä on ollut riittävän hyvä jo pitkään.