चैटजीपीटी ने वॉयस डिक्टेशन पेश किया है, लेकिन एक कारण है कि यह वास्तव में कभी शुरू नहीं होगा
चाबी छीनना
- OpenAI ने हाल ही में घोषणा की कि ChatGPT आवाज के माध्यम से उपयोगकर्ताओं के साथ बातचीत करने में सक्षम होगा।
- वॉयस डिक्टेशन तकनीक में खामियां हैं जो इसे व्यापक रूप से अपनाए जाने में बाधा बन रही हैं। जब आप स्वयं तुरंत उत्तर ढूंढ सकते हैं तो वॉयस असिस्टेंट की लंबी प्रतिक्रियाओं से क्यों निपटें?
- सुरक्षा की कमी और हमेशा सुनने वाले माइक्रोफ़ोन के जोखिम के कारण वॉयस असिस्टेंट के साथ गोपनीयता भी एक बड़ी चिंता है।
- व्यावहारिक कारणों और उपयोगकर्ता की प्राथमिकताओं के कारण विशिष्ट आवाज-संचालित उपकरणों के वास्तविकता बनने की संभावना नहीं है। जबकि वॉयस असिस्टेंट मददगार हो सकते हैं, उपयोगकर्ताओं को समझने की तकनीक पहले ही सटीकता के संतोषजनक स्तर तक पहुंच चुकी है।
OpenAI में उथल-पुथल के बीचकंपनी ने घोषणा की कि चैटजीपीटी जल्द ही एंड्रॉइड और आईओएस पर अपनी आवाज के माध्यम से उपयोगकर्ताओं के साथ बातचीत करने में सक्षम होगा। कोई उपयोगकर्ता न केवल ChatGPT से बात कर सकता है, बल्कि अब उन्हें एक श्रव्य प्रतिक्रिया भी प्राप्त होगी। हालाँकि यह सतह पर अच्छा है, इसका एक कारण वॉयस डिक्टेशन भी है, एक ऐसी तकनीक जो अब कई वर्षों से ज्यादातर परिपक्व है, वास्तव में आगे नहीं बढ़ी है। निश्चित रूप से, अमेज़ॅन एलेक्सा से लेकर सिरी तक लगभग हर प्रमुख पारिस्थितिकी तंत्र का अपना संस्करण है, लेकिन तकनीक में इतनी खामियां हैं कि चैटजीपीटी भी इसे दिलचस्प नहीं बना सकता है।
कोई भी प्रस्तावना से निपटना नहीं चाहता
बस मुझे उत्तर दो!
वॉइस असिस्टेंट के साथ मेरी सबसे बड़ी झुंझलाहट बातचीत शुरू करने और उत्तर प्राप्त करने की प्रस्तावना से निपटने से आती है। मैं अक्सर स्वयं इसे तेजी से देख सकता हूं, और ऐसे समय में जब मेरे हाथ भरे हुए होते हैं, मुझे इस प्रकार के सहायकों का सबसे अच्छा उपयोग टाइमर सेट करने के लिए लगता है, न कि संदेशों का जवाब देने या प्रश्नों को गूगल करने के लिए। OpenAI ने हाल ही में ChatGPT के साथ हुई बातचीत का एक उदाहरण साझा किया है।
तकनीकी रूप से प्रभावशाली होते हुए भी, प्रदर्शन थोड़ा हास्यास्पद है। सबसे पहले, यह सवाल - कितने 16 इंच के पिज्जा ऑर्डर करने हैं - बेतुका है। मैं समझता हूं कि यह जटिल बातचीत से निपटने के लिए चैटजीपीटी की क्षमता को प्रदर्शित करने के लिए है, लेकिन न केवल उत्तर अनावश्यक रूप से जटिल है, बल्कि डिलीवरी भी है। यदि मैं एआई का गणितीय प्रश्न पूछ रहा हूं, तो मुझे बस उत्तर चाहिए। पहले मुझे नंबर बताओ, फिर समझाओ. अगर मुझे स्पष्टीकरण की परवाह नहीं है, तो मैं प्लेबैक रद्द कर सकता हूं।
हालाँकि, इसे स्विच अप करना पर्याप्त नहीं है, क्योंकि यह कुछ ऐसा है जो AI कर सकता है पहले से करना। हो सकता है कि पिज़्ज़ा के स्लाइस की संख्या और लोगों की संख्या की प्रासंगिक प्रकृति के लिए एआई की आवश्यकता हो "अनुसंधान," लेकिन कुछ बिंदु पर, मुझे यकीन है कि ऐसी सुविधाएं अन्य सभी एआई वॉयस असिस्टेंट में आएंगी, बहुत। एक बार ऐसा हो जाने पर, हम एक स्थिति में वापस आ जाते हैं जब भी सबसे अच्छा अमेज़ॅन इको डिवाइस वह कर सकते हैं जिसकी ओर OpenAI तीव्र गति से आगे बढ़ रहा है।
यदि मैं अपने स्मार्टफोन का उपयोग कर रहा हूं, तो मेरे लिए जल्दी से टाइप करना और कुछ खोजना आसान है। मैं ऐसा कहीं भी कर सकता हूं, बिना सुने, और फिर अपने खाली समय में उत्तर पढ़ सकता हूं। अगर मैं वॉयस असिस्टेंट से मेरे लिए कुछ ढूंढने के लिए कहता हूं, तो संभावना है कि मैं खुद ही उसे खोजूंगा, यह देखने के लिए कि अन्य विकल्प क्या हैं। वॉइस असिस्टेंट बहुत अधिक शब्दाडंबरपूर्ण होते हैं, और वे हमेशा रहेंगे।
गोपनीयता भी दो मोर्चों पर चिंता का विषय है
कोई भी यह नहीं सुनना चाहता कि मेरे प्रश्न कितने मूर्खतापूर्ण हैं
वॉयस असिस्टेंट का अंतिम लक्ष्य क्या है? वे कई प्रमुख कारणों से कभी भी स्मार्टफ़ोन को प्रतिस्थापित नहीं करने जा रहे हैं (जितना ह्यूमेन जैसी कंपनियां उन्हें चाहती हैं), जिनमें सबसे महत्वपूर्ण है गोपनीयता। सेवाओं में लॉग इन करना, निजी संदेश भेजना, या यहां तक कि उन मूर्खतापूर्ण, मूर्खतापूर्ण प्रश्नों को गूगल पर खोजना जिनके लिए आप गुप्त मोड का उपयोग करते हैं, ध्वनि-आधारित डिवाइस के साथ निजी तौर पर करना वास्तव में संभव नहीं है।
परिणामस्वरूप, बहुत विशिष्ट, निजी-उपयोग संदर्भों के बाहर, वॉयस असिस्टेंट कभी भी स्मार्टफोन या निजी तौर पर उपयोग किए जाने वाले डिवाइस की जगह नहीं ले सकते हैं, और मैं इसे कभी भी बदलते हुए नहीं देखता। लोग अपनी निजता को कैसे देखते हैं और वे ज़ोर से क्या कहना चाहते हैं, इसमें बुनियादी बदलाव के बिना, लोगों को यह विश्वास दिलाना कठिन है कि वे चाहना हर समय अपने उपकरणों को संचालित करने के लिए अपनी आवाज़ का उपयोग करना।
हमें एक ही समाचार रिपोर्ट को 15 अलग-अलग स्थानों पर पढ़ने या एक व्यक्ति से बार-बार यह पूछने की आवश्यकता नहीं है कि उन्हें 778 लोगों के लिए कितने 16-इंच पिज्जा की आवश्यकता है।
एक ऐसी दुनिया की कल्पना करें, जहां खचाखच भरी मेट्रो में हर कोई अपने फोन का उपयोग करने के बजाय, आवाज से चलने वाले उपकरण का उपयोग करता है। कल्पना कीजिए कि यह कितना व्यस्त हो जाएगा, जोर-जोर से कहने की जरूरत नहीं है। आपके अपने उपकरणों को आवाज़ों को पहचानने में परेशानी होगी, और एक खचाखच भरा मेट्रो सैद्धांतिक रूप से शोर का कोलाहल होगा। सबवे काफ़ी ख़राब है. इसके लिए एक ही समाचार रिपोर्ट को 15 अलग-अलग स्थानों पर पढ़े जाने या एक व्यक्ति से बार-बार यह पूछने की आवश्यकता नहीं है कि उन्हें 778 लोगों के लिए कितने 16-इंच पिज्जा की आवश्यकता है।
लोगों को यह विश्वास दिलाना भी काफी कठिन है कि आपके उपकरण 24/7 आपकी बात नहीं सुन रहे हैं, लेकिन लोग पहले से ही अपने पास हमेशा सुनने वाले माइक्रोफोन रखने से परेशान हैं। ऐसे उपकरणों के साथ जो केवल आवाज से संचालित हो सकते हैं, यह कठिन होगा नहीं हर समय सुना हुआ महसूस करना।
केवल आवाज वाले उपकरण एक सपना है जो कभी हकीकत नहीं बनेगा
और मैं इससे सहमत हूं
स्रोत: मानवीय
मैं प्रौद्योगिकी उत्साही हूं, लेकिन मुझे लगता है कि यह सबसे अच्छा है कि डिवाइस लंबे समय तक विशेष रूप से आवाज से संचालित नहीं होंगे। यहां बताए गए कारणों से ऐसा होना लगभग असंभव है। जबकि ह्यूमेन जैसी कंपनियां अपने दायरे को आगे बढ़ा रही हैं, वे अंततः ऐसे उपकरण के साथ किसी भी उचित बाजार पर कब्जा करने में विफल हो जाएंगी जो इसे संचालित करने के मुख्य तरीके के रूप में आवाज पर निर्भर करती है।
वॉयस असिस्टेंट उन उपकरणों के लिए हमेशा मददगार साबित होंगे जिनका हम दैनिक उपयोग करते हैं, लेकिन हमें समझने की तकनीक लंबे समय से काफी अच्छी रही है।