لقد قدم ChatGPT الإملاء الصوتي، ولكن هناك سبب لعدم نجاحه أبدًا
الماخذ الرئيسية
- أعلنت OpenAI مؤخرًا أن ChatGPT سيكون قادرًا على التفاعل مع المستخدمين عبر الصوت.
- تعاني تقنية الإملاء الصوتي من عيوب أعاقت اعتمادها على نطاق واسع. لماذا تتعامل مع الاستجابات المطولة للمساعدين الصوتيين عندما يمكنك العثور بسرعة على الإجابات بنفسك؟
- تعد الخصوصية أيضًا مصدر قلق كبير للمساعدين الصوتيين بسبب نقص الأمان ومخاطر الاستماع الدائم للميكروفونات.
- من غير المرجح أن تصبح الأجهزة الحصرية التي تعمل بالصوت حقيقة واقعة لأسباب عملية وتفضيلات المستخدم. في حين أن المساعدين الصوتيين يمكن أن يكونوا إضافات مفيدة، فإن التكنولوجيا المستخدمة لفهم المستخدمين قد وصلت بالفعل إلى مستوى مرضٍ من الدقة.
وسط الاضطرابات في OpenAIأعلنت الشركة أن ChatGPT سيكون قادرًا قريبًا على التفاعل مع المستخدمين عبر أصواتهم على Android وiOS. لا يستطيع المستخدم التحدث إلى ChatGPT فحسب، بل سيتلقى الآن استجابة مسموعة أيضًا. على الرغم من أن هذا يبدو رائعًا ظاهريًا، إلا أن هناك سببًا وراء عدم نجاح الإملاء الصوتي، وهي تقنية كانت ناضجة في الغالب لسنوات عديدة حتى الآن. من المؤكد أن كل نظام بيئي رئيسي تقريبًا لديه نسخته الخاصة، من Amazon Alexa إلى Siri، ولكن التكنولوجيا بها الكثير من العيوب التي لا يمكن حتى لـ ChatGPT أن تجعلها مثيرة للاهتمام.
لا أحد يريد التعامل مع الديباجة
فقط أعطني الجواب!
واحدة من أكبر مضايقاتي مع المساعدين الصوتيين تأتي من التعامل مع مقدمة بدء المحادثة والحصول على الإجابة. يمكنني في كثير من الأحيان البحث عنه بشكل أسرع بنفسي، وفي الأوقات التي تكون فيها يدي مشغولة، فإن أفضل استخدام أجده لهذا النوع من المساعدين هو ضبط المؤقتات، وعدم الرد على الرسائل أو البحث عن الأسئلة عبر Google. قامت OpenAI مؤخرًا بمشاركة مثال لمحادثة يمكنك إجراؤها مع ChatGPT.
على الرغم من أنها مثيرة للإعجاب من الناحية الفنية، إلا أن العرض مثير للسخرية بعض الشيء. أولاً، السؤال – حول عدد البيتزا مقاس 16 بوصة التي يجب طلبها – هو سؤال سخيف. أدرك أن هذا موجود لإثبات قدرة ChatGPT على التعامل مع المحادثات المعقدة، ولكن الإجابة ليست معقدة بلا داع فحسب، بل إن التسليم أيضًا معقد. إذا كنت أطرح سؤالاً رياضيًا حول الذكاء الاصطناعي، فأنا أريد الإجابة فقط. أخبرني بالرقم أولاً، ثم اشرحه. إذا لم أهتم بالشرح، فيمكنني فقط إلغاء التشغيل.
ومع ذلك، فإن تبديل ذلك ليس كافيًا، لأن هذا شيء يستطيع الذكاء الاصطناعي القيام به بالفعل يفعل. ربما تتطلب الطبيعة السياقية لعدد شرائح البيتزا وعدد الأشخاص الذكاء الاصطناعي "بحث"، لكن في مرحلة ما، أنا متأكد من أن ميزات كهذه ستتوفر لجميع المساعدين الصوتيين الآخرين الذين يعملون بتقنية الذكاء الاصطناعي، أيضاً. وبمجرد أن يحدث ذلك، نعود إلى المربع الأول حتى عندما أفضل صدى الأمازون يمكن للأجهزة أن تفعل ما كان OpenAI يتحرك نحوه بوتيرة مذهلة.
إذا كنت أستخدم هاتفي الذكي، فمن السهل بالنسبة لي أن أكتب شيئًا ما وأبحث عنه بسرعة. يمكنني أن أفعل ذلك في أي مكان، دون أن يسمعني أحد، ويمكنني بعد ذلك قراءة الإجابات في وقت فراغي. إذا طلبت من مساعد صوتي العثور على شيء ما لي، فمن المحتمل أن أبحث عنه بنفسي بعد حدوثه لأرى ما هي الخيارات الأخرى المتاحة. المساعدون الصوتيون كثيرو الكلام، وسيظلون كذلك دائمًا.
وتشكل الخصوصية مصدر قلق أيضًا على جبهتين
لا أحد يريد أن يسمع مدى غباء أسئلتي
ما هو الهدف النهائي للمساعد الصوتي؟ لن يقوموا أبدًا باستبدال الهواتف الذكية (بقدر ما تريدهم شركات مثل Humane أن يفعلوا ذلك) لعدة أسباب رئيسية، أهمها الخصوصية. إن تسجيل الدخول إلى الخدمات أو إرسال رسائل خاصة أو حتى البحث عن تلك الأسئلة السخيفة والغبية التي تستخدم وضع التصفح المتخفي لها ليس من الممكن حقًا القيام بها بشكل خاص باستخدام جهاز يعتمد على الصوت.
ونتيجة لذلك، خارج سياقات الاستخدام الخاص المتخصصة للغاية، لا يمكن للمساعدين الصوتيين أبدًا أن يحلوا محل الهاتف الذكي أو الجهاز المستخدم بشكل خاص، ولا أرى أن هذا يتغير أبدًا. وبدون حدوث تحول جوهري في كيفية رؤية الناس لخصوصيتهم وما يرغبون في قوله بصوت عالٍ، فمن الصعب إقناع الناس بأنهم يريد لاستخدام أصواتهم لتشغيل أجهزتهم طوال الوقت.
لا نحتاج إلى قراءة نفس التقرير الإخباري في 15 مكانًا مختلفًا أو أن يسأل شخص واحد بشكل متكرر عن عدد البيتزا مقاس 16 بوصة التي يحتاجها لـ 778 شخصًا.
تخيل عالما، بدلا من أن يستخدم الجميع هواتفهم في مترو الأنفاق المزدحم، يستخدمون جهازا يعمل بالصوت. تخيل مدى صعوبة ذلك، ناهيك عن الصوت العالي. ستواجه أجهزتك الخاصة مشكلة في تمييز الأصوات، ومن الناحية النظرية، سيكون مترو الأنفاق المزدحم عبارة عن نشاز من الضوضاء. مترو الأنفاق سيء بما فيه الكفاية. لا يتطلب الأمر قراءة نفس التقرير الإخباري في 15 مكانًا مختلفًا أو أن يسأل شخص واحد بشكل متكرر عن عدد البيتزا مقاس 16 بوصة التي يحتاجها لـ 778 شخصًا.
من الصعب أيضًا إقناع الأشخاص لأن أجهزتك لا تستمع إليك على مدار الساعة طوال أيام الأسبوع، ولكن الناس يشعرون بالقلق بالفعل بشأن وجود ميكروفونات تستمع دائمًا بالقرب منهم. مع الأجهزة التي لا يمكن تشغيلها إلا بالصوت، سيكون الأمر صعبًا لا لتشعر بالاستماع إليك في جميع الأوقات.
الأجهزة الصوتية فقط هي حلم لن يصبح حقيقة أبدًا
وأنا موافق على ذلك
المصدر: إنساني
أنا متحمس للتكنولوجيا، ولكن أعتقد أنه من الأفضل ألا يتم تشغيل الأجهزة حصريًا بالصوت لفترة طويلة. ومن المستحيل أن يكون الأمر كذلك للأسباب الموضحة هنا. في حين أن شركات مثل Humane تتخطى حدودها، فإنها ستفشل في نهاية المطاف في الاستيلاء على أي سوق معقول بجهاز يعتمد على الصوت باعتباره الطريقة الرئيسية لتشغيله.
ستظل المساعدات الصوتية إلى الأبد إضافة مفيدة للأجهزة التي نستخدمها يوميًا، ولكن التكنولوجيا التي تمكننا من فهمنا كانت جيدة بما يكفي لفترة طويلة الآن.