Le fonctionnement vocal de ChatGPT montre que les assistants vocaux ne remplaceront jamais votre smartphone

ChatGPT a introduit la dictée vocale, mais il y a une raison pour laquelle elle ne décollera jamais vraiment

Points clés à retenir

OpenAI a récemment annoncé que ChatGPT pourra interagir avec les utilisateurs via la voix.
La technologie de dictée vocale présente des défauts qui ont entravé son adoption généralisée. Pourquoi gérer les longues réponses des assistants vocaux alors que vous pouvez trouver rapidement des réponses vous-même?
La confidentialité est également une préoccupation majeure avec les assistants vocaux en raison du manque de sécurité et du risque de microphones toujours à l’écoute.
Il est peu probable que les appareils à commande vocale exclusifs deviennent une réalité pour des raisons pratiques et les préférences des utilisateurs. Même si les assistants vocaux peuvent constituer un complément utile, la technologie permettant de comprendre les utilisateurs a déjà atteint un niveau de précision satisfaisant.

Au milieu de la tourmente chez OpenAI, la société a annoncé que ChatGPT serait bientôt capable d'interagir avec les utilisateurs via leur voix sur Android et iOS. Non seulement un utilisateur peut parler à ChatGPT, mais il recevra désormais également une réponse audible. Même si cela semble cool en apparence, il y a une raison pour laquelle la dictée vocale, une technologie qui est pour l'essentiel mature depuis de nombreuses années maintenant, n'a pas vraiment décollé. Bien sûr, presque tous les principaux écosystèmes ont leur propre version, d'Amazon Alexa à Siri, mais la technologie présente tellement de défauts que même ChatGPT ne peut pas la rendre intéressante.

Personne ne veut s'occuper du préambule

Donnez-moi juste la réponse !

L’un de mes plus gros désagréments avec les assistants vocaux vient du fait de gérer le préambule du lancement de la conversation et de l’obtention de la réponse. Je peux souvent le rechercher moi-même plus rapidement, et lorsque j'ai les mains pleines, la meilleure utilisation que je trouve de ce type d'assistant est de régler des minuteries, de ne pas répondre aux messages ou de rechercher des questions sur Google. OpenAI a récemment partagé un exemple de conversation que vous pourriez avoir avec ChatGPT.

Bien que techniquement impressionnante, la démonstration est un peu ridicule. Tout d’abord, la question du nombre de pizzas de 16 pouces à commander est absurde. Je comprends qu'il est là pour démontrer la capacité de ChatGPT à gérer des conversations complexes, mais non seulement la réponse est inutilement complexe, mais la livraison l'est aussi. Si je pose une question mathématique à une IA, je veux juste la réponse. Dites-moi d'abord le numéro, puis expliquez-le. Si l'explication ne m'importe pas, je peux simplement annuler la lecture.

Changer cela n'est cependant pas suffisant, car c'est quelque chose que l'IA peut déjà faire. Peut-être que la nature contextuelle du nombre de parts de pizza et du nombre de personnes oblige l'IA à "recherche", mais à un moment donné, je suis sûr que des fonctionnalités comme celle-là seront disponibles sur tous les autres assistants vocaux IA, aussi. Une fois que c'est le cas, nous revenons à la case départ alors que même le meilleur Amazon Echo les appareils peuvent faire ce vers quoi OpenAI évolue à un rythme effréné.

Si j'utilise mon smartphone, il m'est facile de taper et de rechercher rapidement quelque chose. Je peux le faire n'importe où, sans être entendu, et je peux alors lire les réponses à loisir. Si je demande à un assistant vocal de trouver quelque chose pour moi, il y a de fortes chances que je le recherche moi-même après coup pour voir quelles autres options existent. Les assistants vocaux sont trop verbeux, et ils le seront toujours.

La confidentialité est également une préoccupation sur deux fronts

Personne ne veut entendre à quel point mes questions sont stupides

Quel est l’objectif final d’un assistant vocal? Ils ne remplaceront jamais les smartphones (autant que des entreprises comme Humane le souhaitent) pour plusieurs raisons clés, la plus importante étant la confidentialité. Se connecter à des services, envoyer des messages privés ou même rechercher sur Google les questions idiotes et stupides pour lesquelles vous utilisez le mode navigation privée n'est pas vraiment possible en privé avec un appareil vocal.

Par conséquent, en dehors des contextes d’utilisation privée très spécialisés, les assistants vocaux ne pourront jamais remplacer un smartphone ou un appareil à usage privé, et je ne vois pas que cela change jamais. Sans un changement fondamental dans la façon dont les gens perçoivent leur propre vie privée et dans ce qu'ils sont prêts à dire à haute voix, il est difficile de convaincre les gens qu'ils vouloir d'utiliser leur voix pour faire fonctionner leurs appareils à tout moment.

Nous n'avons pas besoin que le même reportage soit lu dans 15 endroits différents ou qu'une personne demande à plusieurs reprises combien de pizzas de 16 pouces elle a besoin pour 778 personnes.

Imaginez un monde où, au lieu que tout le monde utilise son téléphone dans un métro bondé, il utilise un appareil à commande vocale. Imaginez à quel point cela deviendrait mouvementé, sans parler du bruit. Vos propres appareils auraient du mal à discerner les voix, et un métro bondé serait théoriquement une cacophonie de bruit. Le métro est déjà assez mauvais. Il n'est pas nécessaire que le même reportage soit lu dans 15 endroits différents ou qu'une personne demande à plusieurs reprises combien de pizzas de 16 pouces elle a besoin pour 778 personnes.

Il est également assez difficile de convaincre les gens, car vos appareils ne vous écoutent pas 24 heures sur 24, 7 jours sur 7, mais les gens sont déjà inquiets d'avoir des microphones toujours à l'écoute à proximité d'eux. Avec des appareils qui ne peuvent être commandés que par la voix, ce sera difficile pas se sentir écouté à tout moment.

Les appareils uniquement vocaux sont un rêve qui ne deviendra jamais réalité

Et je suis d'accord avec ça

Source: Humain

Je suis un passionné de technologie, mais je pense qu'il est préférable que les appareils ne soient pas exclusivement à commande vocale pendant longtemps. Il est quasiment impossible que cela soit le cas pour les raisons exposées ici. Alors que des entreprises comme Humane repoussent les limites, elles ne parviendront finalement pas à conquérir un marché raisonnable avec un appareil qui repose sur la voix comme principal moyen de fonctionnement.

Les assistants vocaux seront toujours un complément utile aux appareils que nous utilisons quotidiennement, mais la technologie pour nous comprendre est suffisamment performante depuis longtemps maintenant.