La operación de voz de ChatGPT muestra que los asistentes de voz nunca reemplazarán su teléfono inteligente

ChatGPT ha introducido el dictado por voz, pero hay una razón por la que nunca despegará

Conclusiones clave

  • OpenAI anunció recientemente que ChatGPT podrá interactuar con los usuarios mediante voz.
  • La tecnología de dictado de voz tiene fallas que han dificultado su adopción generalizada. ¿Por qué lidiar con las largas respuestas de los asistentes de voz cuando usted mismo puede encontrar las respuestas rápidamente?
  • La privacidad también es una preocupación importante con los asistentes de voz debido a la falta de seguridad y el riesgo de que los micrófonos estén siempre escuchando.
  • Es poco probable que los dispositivos exclusivos operados por voz se conviertan en realidad por razones prácticas y preferencias de los usuarios. Si bien los asistentes de voz pueden ser adiciones útiles, la tecnología para comprender a los usuarios ya ha alcanzado un nivel satisfactorio de precisión.

En medio de la agitación en OpenAI, la compañía anunció que ChatGPT pronto podría interactuar con los usuarios a través de sus voces en Android e iOS. Un usuario no solo puede hablar con ChatGPT, sino que ahora también recibirá una respuesta audible. Si bien eso es bueno en la superficie, hay una razón por la cual el dictado de voz, una tecnología que ha estado madura durante muchos años, en realidad no ha despegado. Claro, casi todos los ecosistemas importantes tienen su propia versión, desde Amazon Alexa hasta Siri, pero la tecnología tiene tantas fallas que ni siquiera ChatGPT puede hacerla interesante.

Nadie quiere lidiar con el preámbulo

¡Solo dame la respuesta!

Una de mis mayores molestias con los asistentes de voz proviene del preámbulo de iniciar la conversación y obtener la respuesta. A menudo puedo buscarlo más rápido y, cuando tengo las manos ocupadas, el mejor uso que encuentro para este tipo de asistentes es configurar temporizadores, no responder mensajes ni buscar preguntas en Google. OpenAI compartió recientemente un ejemplo de una conversación que podrías tener con ChatGPT.

Aunque técnicamente impresionante, la demostración es un poco ridícula. En primer lugar, la pregunta sobre cuántas pizzas de 16 pulgadas pedir es absurda. Entiendo que está ahí para demostrar la capacidad de ChatGPT para manejar conversaciones complejas, pero no solo la respuesta es innecesariamente compleja, sino que la entrega también lo es. Si le hago una pregunta matemática a una IA, solo quiero la respuesta. Primero dime el número y luego explícalo. Si no me importa la explicación, puedo cancelar la reproducción.

Sin embargo, cambiar eso no es suficiente, porque eso es algo que la IA puede ya hacer. Tal vez la naturaleza contextual del número de porciones de pizza y el número de personas requiera que la IA "investigación", pero en algún momento, estoy seguro de que funciones como esa llegarán a todos los demás asistentes de voz con IA. también. Una vez que lo haga, volvemos al punto de partida cuando incluso el mejor eco de amazon Los dispositivos pueden hacer aquello hacia lo que OpenAI ha estado avanzando a un ritmo vertiginoso.

Si estoy usando mi teléfono inteligente, me resulta fácil escribir y buscar algo rápidamente. Puedo hacerlo en cualquier lugar, sin que me escuchen, y luego puedo leer las respuestas cuando quiera. Si le pido a un asistente de voz que busque algo para mí, es probable que lo busque yo mismo después para ver qué otras opciones hay. Los asistentes de voz son demasiado prolijos y siempre lo serán.

La privacidad también es una preocupación en dos frentes

Nadie quiere escuchar lo estúpidas que son mis preguntas.

¿Cuál es el objetivo final de un asistente de voz? Nunca reemplazarán a los teléfonos inteligentes (por mucho que empresas como Humane quieran que lo hagan) por varias razones clave, la más importante es la privacidad. Iniciar sesión en servicios, enviar mensajes privados o incluso buscar en Google esas preguntas tontas y tontas para las que utiliza el modo incógnito no es realmente posible hacerlo de forma privada con un dispositivo basado en voz.

Como resultado, fuera de contextos de uso privado muy especializados, los asistentes de voz nunca podrán reemplazar un teléfono inteligente o un dispositivo de uso privado, y no veo que eso cambie nunca. Sin un cambio fundamental en cómo las personas ven su propia privacidad y lo que están dispuestas a decir en voz alta, es difícil convencer a las personas de que desear utilizar su voz para operar sus dispositivos todo el tiempo.

No necesitamos que se lea el mismo informe de noticias en 15 lugares diferentes o que una persona pregunte repetidamente cuántas pizzas de 16 pulgadas necesita para 778 personas.

Imagine un mundo en el que, en lugar de que todos utilicen sus teléfonos en un metro abarrotado, utilicen un dispositivo activado por voz. Imagínese lo agitado que sería eso, por no hablar de lo ruidoso que sería. Sus propios dispositivos tendrían problemas para discernir las voces y, en teoría, un metro abarrotado sería una cacofonía de ruido. El metro ya es bastante malo. No es necesario que se lea el mismo informe de noticias en 15 lugares diferentes o que una persona pregunte repetidamente cuántas pizzas de 16 pulgadas necesitan para 778 personas.

También es bastante difícil convencer a la gente, ya que sus dispositivos no lo escuchan las 24 horas del día, los 7 días de la semana, pero la gente ya está ansiosa por tener micrófonos que siempre escuchen cerca de ellos. Con dispositivos que sólo pueden ser operados por voz, será difícil no Sentirse escuchado en todo momento.

Los dispositivos solo de voz son un sueño que nunca se hará realidad

Y estoy bien con eso

Fuente: Humano

Soy un entusiasta de la tecnología, pero creo que es mejor que los dispositivos no funcionen exclusivamente con voz durante mucho tiempo. Es casi imposible que ese sea el caso por las razones descritas aquí. Si bien empresas como Humane están superando los límites, en última instancia no lograrán capturar ningún mercado razonable con un dispositivo que depende de la voz como forma principal de operarlo.

Los asistentes de voz siempre serán una adición útil a los dispositivos que usamos a diario, pero la tecnología para entendernos ha sido lo suficientemente buena desde hace mucho tiempo.