ChatGPT ha introdotto la dettatura vocale, ma c'è un motivo per cui non decollerà mai veramente
Punti chiave
- OpenAI ha annunciato di recente che ChatGPT sarà in grado di interagire con gli utenti tramite voce.
- La tecnologia di dettatura vocale presenta difetti che ne hanno ostacolato l’adozione diffusa. Perché affrontare le lunghe risposte degli assistenti vocali quando puoi trovare rapidamente le risposte da solo?
- Anche la privacy è una delle principali preoccupazioni per gli assistenti vocali a causa della mancanza di sicurezza e del rischio di microfoni sempre in ascolto.
- È improbabile che dispositivi esclusivi a comando vocale diventino realtà per ragioni pratiche e preferenze degli utenti. Sebbene gli assistenti vocali possano rappresentare un’utile aggiunta, la tecnologia per comprendere gli utenti ha già raggiunto un livello di precisione soddisfacente.
Nel mezzo del tumulto a OpenAI, la società ha annunciato che presto ChatGPT sarà in grado di interagire con gli utenti tramite la loro voce su Android e iOS. Non solo un utente può parlare con ChatGPT, ma ora riceverà anche una risposta sonora. Anche se in superficie è interessante, c'è una ragione per cui la dettatura vocale, una tecnologia che è per lo più matura ormai da molti anni, non è davvero decollata. Certo, quasi tutti i principali ecosistemi hanno la propria versione, da Amazon Alexa a Siri, ma la tecnologia ha così tanti difetti che nemmeno ChatGPT riesce a renderla interessante.
Nessuno vuole occuparsi del preambolo
Dammi solo la risposta!
Uno dei miei più grandi fastidi con gli assistenti vocali deriva dal dover gestire il preambolo sia per avviare la conversazione che per ottenere la risposta. Spesso riesco a cercarlo più velocemente da solo e, nei momenti in cui ho le mani occupate, l'uso migliore che trovo per questo tipo di assistenti è impostare i timer, non rispondere ai messaggi o cercare su Google domande. OpenAI ha recentemente condiviso un esempio di conversazione che potresti avere con ChatGPT.
Anche se tecnicamente impressionante, la dimostrazione è un po' ridicola. Prima di tutto, la domanda su quante pizze da 16 pollici ordinare è assurda. Capisco che sia lì per dimostrare la capacità di ChatGPT di gestire conversazioni complesse, ma non solo la risposta è inutilmente complessa, ma lo è anche la consegna. Se faccio una domanda matematica a un'intelligenza artificiale, voglio solo la risposta. Dimmi prima il numero e poi spiegamelo. Se non mi interessa la spiegazione, posso semplicemente annullare la riproduzione.
Tuttavia, cambiarlo non è sufficiente, perché è qualcosa che l’intelligenza artificiale può fare Già Fare. Forse la natura contestuale del numero di fette di pizza e del numero di persone richiede che l'intelligenza artificiale lo faccia "ricerca", ma ad un certo punto, sono sicuro che funzionalità del genere saranno disponibili in tutti gli altri assistenti vocali IA, pure. Una volta fatto, torniamo al punto di partenza quando anche il il miglior Amazon Eco i dispositivi possono fare ciò verso cui OpenAI si sta muovendo a un ritmo vertiginoso.
Se utilizzo il mio smartphone, è facile per me digitare e cercare rapidamente qualcosa. Posso farlo ovunque, senza essere ascoltato, e poi posso leggere le risposte a mio piacimento. Se chiedo a un assistente vocale di trovare qualcosa per me, è probabile che lo cerco io stesso dopo averlo fatto per vedere quali altre opzioni ci sono. Gli assistenti vocali sono troppo prolissi e lo saranno sempre.
Anche la privacy è una preoccupazione su due fronti
Nessuno vuole sentire quanto siano stupide le mie domande
Qual è l'obiettivo finale di un assistente vocale? Non sostituiranno mai gli smartphone (per quanto aziende come Humane lo vogliano) per diversi motivi chiave, il più importante dei quali è la privacy. Accedere ai servizi, inviare messaggi privati o anche cercare su Google quelle domande sciocche e stupide per cui usi la modalità di navigazione in incognito non è realmente possibile farlo in privato con un dispositivo vocale.
Di conseguenza, al di fuori di contesti di nicchia e di uso privato, gli assistenti vocali non potranno mai sostituire uno smartphone o un dispositivo per uso privato, e non credo che ciò cambierà mai. Senza un cambiamento fondamentale nel modo in cui le persone vedono la propria privacy e ciò che sono disposte a dire ad alta voce, è difficile convincere le persone che Volere usare la propria voce per azionare i propri dispositivi in ogni momento.
Non abbiamo bisogno che la stessa notizia venga letta in 15 posti diversi o che una persona chieda ripetutamente quante pizze da 16 pollici hanno bisogno per 778 persone.
Immagina un mondo in cui, invece di usare il telefono in una metropolitana affollata, tutti usano un dispositivo a comando vocale. Immagina quanto sarebbe frenetico, per non parlare del rumore. I tuoi dispositivi avrebbero difficoltà a distinguere le voci e una metropolitana affollata sarebbe teoricamente una cacofonia di rumore. La metropolitana è già abbastanza brutta. Non è necessario che la stessa notizia venga letta in 15 posti diversi o che una persona chieda ripetutamente quante pizze da 16 pollici hanno bisogno per 778 persone.
È anche abbastanza difficile convincere le persone perché i tuoi dispositivi non ti ascoltano 24 ore su 24, 7 giorni su 7, ma le persone sono già ansiose di avere microfoni sempre in ascolto vicino a loro. Con i dispositivi che possono essere gestiti solo con la voce, sarà difficile non per sentirsi ascoltati in ogni momento.
I dispositivi solo vocali sono un sogno che non diventerà mai realtà
E mi va bene così
Fonte: umano
Sono un appassionato di tecnologia, ma penso che sia meglio che i dispositivi non vengano gestiti esclusivamente con la voce per molto tempo. È quasi impossibile che ciò accada per le ragioni qui esposte. Mentre aziende come Humane stanno spingendo oltre i limiti, alla fine non riusciranno a conquistare un mercato ragionevole con un dispositivo che si basa sulla voce come modo principale per funzionare.
Gli assistenti vocali saranno per sempre un'utile aggiunta ai dispositivi che utilizziamo quotidianamente, ma la tecnologia per capirci è abbastanza buona ormai da molto tempo.