De stembediening van ChatGPT laat zien dat stemassistenten je smartphone nooit zullen vervangen

ChatGPT heeft spraakdictatie geïntroduceerd, maar er is een reden waarom het nooit echt van de grond zal komen

Belangrijkste leerpunten

OpenAI heeft onlangs aangekondigd dat ChatGPT via spraak met gebruikers kan communiceren.
Spraakdictatietechnologie kent tekortkomingen die de wijdverbreide acceptatie ervan hebben belemmerd. Waarom omgaan met de lange reacties van stemassistenten als je zelf snel antwoorden kunt vinden?
Privacy is ook een groot probleem bij stemassistenten vanwege het gebrek aan beveiliging en het risico van altijd luisterende microfoons.
Vanwege praktische redenen en gebruikersvoorkeuren is het onwaarschijnlijk dat exclusieve spraakgestuurde apparaten werkelijkheid zullen worden. Hoewel stemassistenten nuttige toevoegingen kunnen zijn, heeft de technologie om gebruikers te begrijpen al een bevredigend nauwkeurigheidsniveau bereikt.

Te midden van onrust bij OpenAI, kondigde het bedrijf aan dat ChatGPT binnenkort via hun stem met gebruikers zou kunnen communiceren op Android en iOS. Een gebruiker kan niet alleen met ChatGPT praten, maar krijgt nu ook een hoorbaar antwoord. Hoewel dat op het eerste gezicht cool is, is er een reden waarom stemdictatie, een technologie die al jaren grotendeels volwassen is, nog niet echt van de grond is gekomen. Zeker, bijna elk groot ecosysteem heeft zijn eigen versie, van Amazon Alexa tot Siri, maar de technologie heeft zoveel tekortkomingen dat zelfs ChatGPT het niet interessant kan maken.

Niemand wil zich met de preambule bezighouden

Geef mij gewoon het antwoord!

Een van mijn grootste ergernissen met stemassistenten komt voort uit het omgaan met de inleiding van zowel het starten van het gesprek als het krijgen van het antwoord. Ik kan het zelf vaak sneller opzoeken, en in tijden dat ik mijn handen vol heb, kan ik dit soort assistenten het beste gebruiken voor het instellen van timers, het niet reageren op berichten of het googlen van vragen. OpenAI deelde onlangs een voorbeeld van een gesprek dat je zou kunnen voeren met ChatGPT.

Hoewel technisch indrukwekkend, is de demonstratie een beetje belachelijk. Ten eerste is de vraag – hoeveel 16-inch pizza’s je moet bestellen – absurd. Ik begrijp dat het er is om het vermogen van ChatGPT aan te tonen om met complexe gesprekken om te gaan, maar niet alleen is het antwoord nodeloos complex, maar de levering ook. Als ik een wiskundige vraag aan een AI stel, wil ik alleen het antwoord. Vertel me eerst het nummer en leg het dan uit. Als de uitleg mij niets kan schelen, kan ik het afspelen gewoon annuleren.

Dat omschakelen is echter niet genoeg, want dat is iets wat AI wel kan al Doen. Misschien vereist de contextuele aard van het aantal plakjes pizza en het aantal mensen dat de AI dit doet "onderzoek", maar ik ben er zeker van dat dit soort functies op een gegeven moment naar alle andere AI-stemassistenten zullen komen, te. Als dat eenmaal het geval is, zijn we terug bij af wanneer zelfs de beste Amazon-echo apparaten kunnen in een razend tempo doen waar OpenAI naar op weg is.

Als ik mijn smartphone gebruik, kan ik gemakkelijk snel iets typen en zoeken. Dat kan ik overal doen, zonder gehoord te worden, en dan kan ik op mijn gemak de antwoorden doorlezen. Als ik een stemassistent vraag om iets voor mij te zoeken, is de kans groot dat ik er achteraf zelf naar op zoek ga om te kijken welke andere opties er zijn. Stemassistenten zijn te veelbetekenend, en dat zal altijd zo blijven.

Privacy is ook een punt van zorg, op twee fronten

Niemand wil horen hoe stom mijn vragen zijn

Wat is het einddoel van een stemassistent? Ze zullen smartphones nooit vervangen (zo graag als bedrijven als Humane dat willen) om verschillende belangrijke redenen, waarvan de belangrijkste privacy is. Inloggen bij services, privéberichten verzenden of zelfs die gekke, domme vragen googlen waarvoor je de incognitomodus gebruikt, is niet echt mogelijk om privé te doen met een spraakgestuurd apparaat.

Als gevolg hiervan kunnen stemassistenten, buiten zeer niche-contexten voor privégebruik, nooit een smartphone of een particulier gebruikt apparaat vervangen, en ik zie dat nooit veranderen. Zonder een fundamentele verandering in de manier waarop mensen hun eigen privacy zien en wat ze hardop willen zeggen, is het moeilijk mensen ervan te overtuigen dat ze wil om hun stem voortdurend te gebruiken om hun apparaten te bedienen.

Het is niet nodig dat hetzelfde nieuwsbericht op vijftien verschillende plaatsen wordt voorgelezen of dat één persoon herhaaldelijk vraagt hoeveel 16-inch pizza's hij nodig heeft voor 778 mensen.

Stel je een wereld voor waarin, in plaats van dat iedereen zijn telefoon gebruikt in een volle metro, een spraakgestuurd apparaat wordt gebruikt. Stel je voor hoe hectisch dat zou worden, en niet te vergeten luid. Je eigen apparaten zouden moeite hebben met het onderscheiden van stemmen, en een volle metro zou in theorie een kakofonie van lawaai zijn. De metro is al erg genoeg. Het is niet nodig dat hetzelfde nieuwsbericht op 15 verschillende plaatsen wordt voorgelezen of dat één persoon herhaaldelijk vraagt hoeveel 16-inch pizza's ze nodig hebben voor 778 mensen.

Het is ook al moeilijk genoeg om mensen te overtuigen, omdat je apparaten niet 24/7 naar je luisteren, maar mensen zijn al ongerust over het hebben van altijd luisterende microfoons in de buurt. Met apparaten die alleen spraakbediend zijn, zal dat lastig zijn niet om zich altijd gehoord te voelen.

Apparaten met alleen spraak zijn een droom die nooit werkelijkheid zal worden

En daar ben ik oké mee

Bron: Humaan

Ik ben een technologieliefhebber, maar ik denk dat het het beste is dat apparaten voorlopig niet uitsluitend spraakgestuurd zullen zijn. Om de hier uiteengezette redenen is dat vrijwel onmogelijk. Hoewel bedrijven als Humane de grenzen verleggen, zullen ze er uiteindelijk niet in slagen een redelijke markt te veroveren met een apparaat dat afhankelijk is van spraak als belangrijkste manier om het te bedienen.

Stemassistenten zullen voor altijd een nuttige aanvulling zijn op apparaten die we dagelijks gebruiken, maar de technologie om ons te begrijpen is al lange tijd goed genoeg.