ChatGPT hat das Sprachdiktieren eingeführt, aber es gibt einen Grund, warum es nie richtig durchstarten wird
Die zentralen Thesen
- OpenAI gab kürzlich bekannt, dass ChatGPT in der Lage sein wird, mit Benutzern per Sprache zu interagieren.
- Die Sprachdiktiertechnologie weist Mängel auf, die ihre weitverbreitete Einführung behindert haben. Warum sich mit den langen Antworten von Sprachassistenten herumschlagen, wenn Sie selbst schnell Antworten finden können?
- Datenschutz ist auch bei Sprachassistenten ein großes Problem, da es an Sicherheit mangelt und das Risiko besteht, dass die Mikrofone ständig mithören.
- Aus praktischen Gründen und Benutzerpräferenzen ist es unwahrscheinlich, dass exklusive sprachgesteuerte Geräte Realität werden. Während Sprachassistenten hilfreiche Ergänzungen sein können, hat die Technologie zum Verstehen von Benutzern bereits ein zufriedenstellendes Maß an Genauigkeit erreicht.
Inmitten der Turbulenzen bei OpenAIkündigte das Unternehmen an, dass ChatGPT bald in der Lage sein werde, mit Benutzern über deren Stimme auf Android und iOS zu interagieren. Ein Benutzer kann nicht nur mit ChatGPT sprechen, sondern erhält jetzt auch eine akustische Antwort. Obwohl das oberflächlich betrachtet cool ist, gibt es einen Grund dafür, dass sich die Sprachdiktierfunktion, eine Technologie, die schon seit vielen Jahren größtenteils ausgereift ist, nicht wirklich durchgesetzt hat. Sicher, fast jedes große Ökosystem hat seine eigene Version, von Amazon Alexa bis Siri, aber die Technologie weist so viele Mängel auf, dass nicht einmal ChatGPT sie interessant machen kann.
Niemand möchte sich mit der Präambel befassen
Gib mir einfach die Antwort!
Eines meiner größten Ärgernisse bei Sprachassistenten besteht darin, dass ich mich mit der Einleitung auseinandersetzen muss, sowohl das Gespräch zu beginnen als auch die Antwort zu erhalten. Oft kann ich selbst schneller nachschlagen, und wenn ich gerade alle Hände voll zu tun habe, finde ich, dass diese Art von Assistenten am besten zum Einstellen von Timern und nicht zum Beantworten von Nachrichten oder zum Googeln von Fragen geeignet ist. OpenAI hat kürzlich ein Beispiel für eine Konversation geteilt, die Sie mit ChatGPT führen könnten.
Obwohl die Demonstration technisch beeindruckend ist, ist sie etwas lächerlich. Zunächst einmal ist die Frage, wie viele 16-Zoll-Pizzen man bestellen soll, absurd. Ich verstehe, dass es dazu dient, die Fähigkeit von ChatGPT zu demonstrieren, mit komplexen Gesprächen umzugehen, aber nicht nur die Antwort ist unnötig komplex, sondern auch die Übermittlung. Wenn ich einer KI eine mathematische Frage stelle, möchte ich nur die Antwort. Sagen Sie mir zuerst die Nummer und erklären Sie sie dann. Wenn mir die Erklärung egal ist, kann ich die Wiedergabe einfach abbrechen.
Es reicht jedoch nicht aus, das zu ändern, denn das ist etwas, was die KI kann bereits Tun. Vielleicht erfordert die kontextbezogene Natur der Anzahl der Pizzastücke und der Anzahl der Personen dies von der KI „Forschung“, aber ich bin mir sicher, dass solche Funktionen irgendwann auch für alle anderen KI-Sprachassistenten verfügbar sein werden. zu. Sobald dies der Fall ist, sind wir wieder bei Null, wenn sogar die bestes Amazon Echo Geräte können das tun, worauf OpenAI in rasantem Tempo hinarbeitet.
Wenn ich mein Smartphone nutze, fällt es mir leicht, schnell etwas zu tippen und zu suchen. Das kann ich überall machen, ohne gehört zu werden, und die Antworten dann in aller Ruhe durchlesen. Wenn ich einen Sprachassistenten bitte, etwas für mich zu finden, ist es wahrscheinlich, dass ich im Nachhinein selbst danach suche, um zu sehen, welche anderen Optionen es gibt. Sprachassistenten sind zu wortreich und werden es immer sein.
Auch der Datenschutz ist in zweierlei Hinsicht ein Problem
Niemand will hören, wie dumm meine Fragen sind
Was ist das Endziel eines Sprachassistenten? Sie werden Smartphones niemals ersetzen (so sehr Unternehmen wie Humane dies wünschen), und zwar aus mehreren wichtigen Gründen, wobei der Datenschutz der wichtigste ist. Sich bei Diensten anzumelden, private Nachrichten zu senden oder sogar die albernen, dummen Fragen zu googeln, für die Sie den Inkognito-Modus verwenden, ist mit einem sprachbasierten Gerät nicht wirklich privat möglich.
Daher können Sprachassistenten außerhalb sehr privater Nischenkontexte niemals ein Smartphone oder ein privat genutztes Gerät ersetzen, und ich glaube nicht, dass sich daran jemals etwas ändern wird. Ohne einen grundlegenden Wandel in der Art und Weise, wie Menschen ihre eigene Privatsphäre sehen und was sie laut sagen wollen, ist es schwierig, die Menschen davon zu überzeugen wollen ihre Geräte jederzeit mit ihrer Stimme bedienen zu können.
Wir brauchen nicht die gleiche Nachrichtenmeldung, die an 15 verschiedenen Orten vorgelesen wird, oder eine Person, die immer wieder fragt, wie viele 16-Zoll-Pizzen sie für 778 Personen braucht.
Stellen Sie sich eine Welt vor, in der nicht jeder in einer überfüllten U-Bahn sein Telefon benutzt, sondern ein sprachgesteuertes Gerät. Stellen Sie sich vor, wie hektisch das werden würde, ganz zu schweigen von der Lautstärke. Ihre eigenen Geräte hätten Schwierigkeiten, Stimmen zu erkennen, und eine überfüllte U-Bahn wäre theoretisch eine Kakophonie aus Lärm. Die U-Bahn ist schon schlimm genug. Es ist nicht erforderlich, dass an 15 verschiedenen Orten derselbe Nachrichtenbericht vorgelesen wird oder dass eine Person wiederholt fragt, wie viele 16-Zoll-Pizzen sie für 778 Personen benötigen.
Es ist auch schwer genug, die Leute zu überzeugen, weil Ihre Geräte nicht rund um die Uhr auf Sie hören, aber die Leute sind ohnehin schon nervös, weil sie immer Mikrofone in der Nähe haben, die sie hören. Bei Geräten, die nur per Sprache bedient werden können, wird es schwierig nicht sich jederzeit angehört zu fühlen.
Nur-Sprachgeräte sind ein Traum, der niemals Wirklichkeit werden wird
Und ich bin damit einverstanden
Quelle: Humane
Ich bin ein Technik-Enthusiast, aber ich denke, es ist das Beste, dass Geräte noch lange nicht ausschließlich per Sprache bedient werden. Aus den hier genannten Gründen ist es nahezu unmöglich, dass dies der Fall ist. Während Unternehmen wie Humane bis an die Grenzen gehen, wird es ihnen letztendlich nicht gelingen, einen vernünftigen Markt mit einem Gerät zu erobern, das hauptsächlich auf Sprache basiert.
Sprachassistenten werden für immer eine hilfreiche Ergänzung zu den Geräten sein, die wir täglich nutzen, aber die Technologie, um uns zu verstehen, ist schon lange gut genug.