ChatGPT의 음성 작업은 음성 비서가 결코 스마트폰을 대체할 수 없음을 보여줍니다.

click fraud protection

ChatGPT는 음성 받아쓰기를 도입했지만 결코 성공하지 못하는 이유가 있습니다.

주요 시사점

  • OpenAI는 최근 ChatGPT가 음성을 통해 사용자와 상호 작용할 수 있다고 발표했습니다.
  • 음성 받아쓰기 기술에는 광범위한 채택을 방해하는 결함이 있습니다. 스스로 답을 빨리 찾을 수 있는데 왜 음성 비서의 긴 응답을 처리해야 할까요?
  • 보안이 부족하고 항상 듣는 마이크의 위험으로 인해 개인 정보 보호는 음성 비서의 주요 관심사이기도 합니다.
  • 음성으로 작동되는 전용 장치는 현실적인 이유와 사용자 선호도 때문에 현실화될 가능성이 낮습니다. 음성 도우미는 유용한 추가 기능이 될 수 있지만 사용자를 이해하는 기술은 이미 만족스러운 정확도 수준에 도달했습니다.

OpenAI의 혼란 속에서, 회사는 ChatGPT가 곧 Android 및 iOS에서 음성을 통해 사용자와 상호 작용할 수 있을 것이라고 발표했습니다. 사용자는 ChatGPT에 말할 수 있을 뿐만 아니라 이제 음성 응답도 받게 됩니다. 표면적으로는 괜찮지만, 수년 동안 대부분 성숙해졌던 기술인 음성 받아쓰기가 실제로 성공하지 못한 데에는 이유가 있습니다. 물론 거의 모든 주요 생태계에는 Amazon Alexa에서 Siri까지 자체 버전이 있지만 기술에는 결함이 너무 많아서 ChatGPT도 흥미를 끌 수 없습니다.

아무도 서문을 다루고 싶어하지 않습니다

그냥 나에게 대답을 줘!

음성 어시스턴트에 대한 가장 큰 불만 사항 중 하나는 대화를 시작하고 답변을 얻는 서문을 처리하는 것입니다. 나는 종종 스스로 더 빨리 찾을 수 있으며, 내 손이 꽉 찼을 때 이러한 종류의 비서에 대한 가장 좋은 용도는 메시지에 응답하거나 질문에 응답하는 것이 아니라 타이머를 설정하는 것입니다. OpenAI는 최근 ChatGPT와 대화할 수 있는 예시를 공유했습니다.

기술적으로는 인상적이지만 시연은 약간 우스꽝스럽습니다. 우선, 16인치 피자를 몇 개 주문해야 하는지에 대한 질문이 터무니없습니다. ChatGPT가 복잡한 대화를 처리하는 능력을 보여주기 위해 존재한다는 점을 이해하지만 답변이 불필요하게 복잡할 뿐만 아니라 전달도 복잡합니다. AI에게 수학적 질문을 한다면 나는 단지 대답을 원할 뿐입니다. 번호를 먼저 말한 후 설명해주세요. 설명이 마음에 들지 않으면 재생을 취소하면 됩니다.

하지만 그것을 바꾸는 것만으로는 충분하지 않습니다. AI가 할 수 있는 일이기 때문입니다. 이미 하다. 어쩌면 피자 조각 수와 사람 수의 상황적 특성으로 인해 AI가 다음을 수행해야 할 수도 있습니다. "연구"하지만 어느 시점에는 이와 같은 기능이 다른 모든 AI 음성 비서에도 적용될 것이라고 확신합니다. 도. 일단 그렇게 되면 우리는 원점으로 돌아갑니다. 최고의 아마존 에코 장치는 OpenAI가 엄청난 속도로 나아가고 있는 일을 할 수 있습니다.

스마트폰을 사용하면 빠르게 무언가를 입력하고 검색하는 것이 쉽습니다. 나는 누구의 말을 듣지 않고도 어디서나 그렇게 할 수 있으며, 여가 시간에 답변을 읽을 수 있습니다. 음성 비서에게 무언가를 찾아달라고 요청하면 다른 옵션이 있는지 확인하기 위해 직접 검색할 가능성이 높습니다. 음성 비서는 너무 장황하며 앞으로도 그럴 것입니다.

개인 정보 보호는 두 가지 측면에서 우려되는 사항이기도 합니다.

내 질문이 얼마나 멍청한지 아무도 듣고 싶어하지 않아

음성 비서의 최종 목표는 무엇입니까? 그들은 여러 가지 주요 이유로 스마트폰을 결코 대체하지 않을 것입니다(Humane과 같은 회사가 원하는 만큼). 가장 중요한 것은 개인 정보 보호입니다. 서비스에 로그인하고, 비공개 메시지를 보내고, 시크릿 모드를 사용하는 어리석고 멍청한 질문을 검색하는 것은 음성 기반 장치를 사용하여 개인적으로 수행하는 것이 실제로 불가능합니다.

결과적으로 매우 틈새 시장인 개인용 환경을 제외하면 음성 비서는 스마트폰이나 개인용 장치를 결코 대체할 수 없으며 앞으로도 변하지 않을 것입니다. 사람들이 자신의 프라이버시를 보는 방식과 큰 소리로 말하고 싶은 내용에 대한 근본적인 변화 없이는 사람들에게 자신이 원하다 항상 음성을 사용하여 장치를 작동합니다.

우리는 동일한 뉴스 보도를 15곳의 다른 장소에서 읽거나 한 사람이 778명에게 16인치 피자가 몇 개가 필요한지 반복적으로 질문할 필요가 없습니다.

붐비는 지하철에서 모든 사람이 휴대폰을 사용하는 대신 음성 구동 장치를 사용하는 세상을 상상해 보세요. 시끄러운 것은 말할 것도 없고 얼마나 정신없게 될지 상상해 보십시오. 귀하의 장치는 음성을 식별하는 데 어려움을 겪을 것이며, 만원 지하철은 이론적으로 소음의 불협화음이 될 것입니다. 지하철이 너무 안좋습니다. 15개의 다른 장소에서 동일한 뉴스 보도를 읽거나 한 사람이 778명에게 16인치 피자가 몇 개 필요한지 반복적으로 질문할 필요가 없습니다.

귀하의 장치가 연중무휴 24시간 귀하의 말을 듣고 있지는 않지만 사람들은 이미 항상 청취하는 마이크를 근처에 두는 것에 대해 불안해하고 있기 때문에 사람들을 설득하는 것도 충분히 어렵습니다. 음성으로만 작동할 수 있는 장치로는 어려울 것입니다. ~ 아니다 항상 들어주는 느낌.

음성 전용 기기는 결코 현실이 될 수 없는 꿈입니다

그리고 난 그걸로 괜찮아

출처: 휴메인

저는 기술에 열광하는 사람이지만, 기기가 오랫동안 음성만으로 작동되지 않는 것이 최선이라고 생각합니다. 여기에 설명된 이유 때문에 그렇게 되는 것은 거의 불가능합니다. Humane과 같은 회사가 한계를 뛰어넘고 있지만 음성을 주요 작동 방법으로 사용하는 장치로는 궁극적으로 합리적인 시장을 포착하지 못할 것입니다.

음성 비서는 우리가 매일 사용하는 장치에 영원히 유용한 추가 기능이 될 것이지만, 우리를 이해하는 기술은 오랫동안 충분히 훌륭했습니다.