कैसे क्वालकॉम ने स्नैपड्रैगन 865 पर AI में भारी सुधार किया

क्वालकॉम ने नए स्नैपड्रैगन 865 SoC के साथ AI प्रदर्शन में बड़ी छलांग लगाई है। हम मशीन लर्निंग में तेजी लाने के लिए क्वालकॉम द्वारा किए गए परिवर्तनों का विश्लेषण करते हैं।

ऐसा लगता है जैसे हम समाचारों में "कृत्रिम बुद्धिमत्ता" को देखे बिना एक दिन भी नहीं रह सकते हैं, और स्नैपड्रैगन टेक शिखर सम्मेलन के कारण पिछला सप्ताह किसी भी छोटे हिस्से में अपवाद नहीं था। हर साल, क्वालकॉम अपने हेक्सागोन डीएसपी और क्वालकॉम एआई इंजन में कई सुधार लाता है, एआई के बारे में बात करते समय वे अपने संपूर्ण विषम कंप्यूट प्लेटफॉर्म - सीपीयू, जीपीयू और डीएसपी - के लिए एक शब्द का उपयोग करते हैं कार्यभार. कुछ साल पहले, बातचीत को पारंपरिक बातचीत के बिंदुओं से दूर ले जाने की क्वालकॉम की जिद, जैसे कि साल-दर-साल सीपीयू प्रदर्शन में सुधार, थोड़ा अजीब लग रहा था। फिर भी 2019 में और स्नैपड्रैगन 865 के साथ, हम देखते हैं कि विषम कंप्यूटिंग वास्तव में उनके मोबाइल कंप्यूटिंग पुश के शीर्ष पर है, क्योंकि एआई और हार्डवेयर-त्वरित कार्यभार सोशल मीडिया से लेकर रोज़मर्रा के उपयोग के मामलों और अनुप्रयोगों में अपना रास्ता बनाते दिख रहे हैं सेवाएँ।

स्नैपड्रैगन 865 क्वालकॉम की 5वीं पीढ़ी का एआई इंजन ला रहा है, और इसके साथ प्रदर्शन और बिजली दक्षता में शानदार सुधार आएगा - लेकिन यह अपेक्षित है। विशिष्टताओं, प्रदर्शन के आंकड़ों, फैंसी इंजीनियरिंग शब्दों और थकाऊ विपणन चर्चाओं के सागर में, इन सुधारों का वास्तव में क्या मतलब है, इस पर ध्यान देना आसान है। वे क्या वर्णन करते हैं? ये अपग्रेड उन लोगों के लिए इतने सार्थक क्यों हैं जो आज अपने ऐप्स में एआई लागू कर रहे हैं, और शायद इससे भी महत्वपूर्ण बात यह है कि भविष्य में ऐसा करने की चाह रखने वालों के लिए?

इस लेख में, हम क्वालकॉम एआई इंजन का उसके इतिहास, उसके घटकों और स्नैपड्रैगन 865 के अपग्रेड और सबसे महत्वपूर्ण रूप से गहन अवलोकन करेंगे। क्यों या कैसे इनमें से प्रत्येक ने आज के स्मार्टफ़ोन अनुभव में योगदान दिया है, मज़ेदार फ़िल्टर से लेकर डिजिटल सहायक तक।

हेक्सागोन डीएसपी और क्वालकॉम एआई इंजन: जब ब्रांडिंग से फर्क पड़ता है

हालाँकि मैं इस सप्ताह के स्नैपड्रैगन टेक शिखर सम्मेलन में भाग लेने में सक्षम नहीं था, फिर भी मैंने 2015 के बाद से किसी अन्य सम्मेलन में भाग लिया है। यदि आपको याद हो, वह यह स्नैपड्रैगन 810 की भारी गड़बड़ी का वर्ष था, और इसलिए न्यूयॉर्क शहर में चेल्सी लॉफ्ट के पत्रकार यह जानने के लिए उत्सुक थे कि स्नैपड्रैगन 820 कंपनी को कैसे फायदा पहुंचाएगा। और यह एक शानदार चिपसेट था, ठीक है: इसने उस समय आजमाए गए और सही कस्टम कोर पर वापस जाकर स्वस्थ प्रदर्शन में सुधार (बिना किसी थ्रॉटलिंग के) का वादा किया था, जिसके लिए क्वालकॉम जाना जाता था। फिर भी मुझे एक बहुत ही सूक्ष्म घोषणा भी याद है, जिस पर, पूर्वव्यापी दृष्टि से, अधिक ध्यान दिया जाना चाहिए था: दूसरी पीढ़ी के हेक्सागोन 680 डीएसपी और इसके एकल निर्देश, एकाधिक डेटा (SIMD) हेक्सागोन वेक्टर एक्सटेंशन, या एचवीएक्स. शायद अगर इंजीनियरों ने इस सुविधा का नाम नहीं रखा होता, तो इसे वह ध्यान मिलता जिसके वह हकदार था।

यह कोप्रोसेसर स्केलर डीएसपी यूनिट के हार्डवेयर थ्रेड्स को विस्तृत वेक्टर प्रोसेसिंग क्षमताओं के लिए एचवीएक्स "संदर्भों" (रजिस्टर फाइलों) तक पहुंचने की अनुमति देता है। इसने बिजली की खपत करने वाले सीपीयू या जीपीयू से महत्वपूर्ण कंप्यूट वर्कलोड को ऑफलोड करने में सक्षम बनाया पावर-कुशल डीएसपी ताकि इमेजिंग और कंप्यूटर विज़न कार्य काफी बेहतर प्रदर्शन पर चल सकें प्रति मिलीवाट. वे सन्निहित वेक्टर तत्वों (मूल रूप से केवल पूर्णांक) पर समान संचालन लागू करने के लिए एकदम सही हैं, जिससे वे कंप्यूटर विज़न वर्कलोड के लिए उपयुक्त हो जाते हैं। हमने पहले भी डीएसपी और एचवीएक्स पर एक गहन लेख लिखा है, यह देखते हुए कि एचवीएक्स आर्किटेक्चर खुद को समानांतर करने और, जाहिर है, बड़े इनपुट वैक्टर को संसाधित करने के लिए अच्छी तरह से उधार देता है। उस समय, क्वालकॉम ने डीएसपी और एचवीएक्स दोनों को विशेष रूप से उनके सुधारों का वर्णन करके प्रचारित किया हैरिस कॉर्नर डिटेक्टर और अन्य स्लाइडिंग विंडो जैसे कंप्यूटर विज़न वर्कलोड लाएगा तरीके.

उपभोक्ता मोबाइल अनुप्रयोगों में गहन शिक्षा के आगमन तक ऐसा नहीं था कि डीएसपी, इसका वेक्टर प्रसंस्करण इकाइयाँ (और अब, एक टेंसर त्वरक) एआई और तंत्रिका नेटवर्क से शादी कर लेंगी विशिष्ट। लेकिन पीछे मुड़कर देखने पर, यह सही समझ में आता है: डिजिटल सिग्नल प्रोसेसर (डीएसपी) आर्किटेक्चर, मूल रूप से डिजिटलीकरण को संभालने के लिए डिज़ाइन किया गया है वास्तविक दुनिया या एनालॉग सिग्नल इनपुट, खुद को कई मशीन लर्निंग एल्गोरिदम और न्यूरल के समान कार्यभार के लिए उधार देता है नेटवर्क. उदाहरण के लिए, डीएसपी को फ़िल्टर कर्नेल, कनवल्शन और सहसंबंध संचालन, 8-बिट गणना, ढेर सारे के लिए तैयार किया गया है रैखिक बीजगणित (वेक्टर और मैट्रिक्स उत्पाद) और गुणा-संचय (मैक) संचालन, सभी सबसे कुशल जब समानांतर। एक तंत्रिका नेटवर्क का रनटाइम भी बड़े वैक्टर, मैट्रिक्स और/या टेंसर को गुणा करने पर अत्यधिक निर्भर है, इसलिए यह स्वाभाविक ही है कि डीएसपी के प्रदर्शन लाभ बड़े करीने से तंत्रिका नेटवर्क आर्किटेक्चर में अनुवादित होते हैं कुंआ। हम संक्षेप में इस विषय पर दोबारा विचार करेंगे!

बाद के वर्षों में, क्वालकॉम ने इस बात पर जोर देना जारी रखा कि वे पेशकश नहीं करते हैं अभी चिपसेट, लेकिन मोबाइल प्लेटफार्म, और वे ध्यान केंद्रित नहीं करते हैं अभी विशेष घटकों को सुधारने पर, लेकिन "विषम" गणना प्रदान करने पर। 2017 में, उन्होंने क्वालकॉम डेवलपर नेटवर्क पर अपना स्नैपड्रैगन न्यूरल प्रोसेसिंग इंजन एसडीके (रनटाइम एक्सेलेरेशन के लिए) जारी किया, और 2018 की शुरुआत में उन्होंने अपने कई एआई-सक्षम हार्डवेयर (सीपीयू, जीपीयू, डीएसपी) और सॉफ्टवेयर घटकों को एक के तहत समेकित करने के लिए क्वालकॉम आर्टिफिशियल इंटेलिजेंस इंजन की घोषणा की नाम। इस उपयोगी नामकरण के साथ, वे स्नैपड्रैगन 855 और दोनों पर अपने एआई प्रदर्शन सुधारों का बड़े करीने से विज्ञापन करने में सक्षम थे। स्नैपड्रैगन 865, प्रति सेकंड खरबों ऑपरेशनों की संख्या (TOPS) और साल-दर-साल प्रतिशत को आराम से बताने में सक्षम है सुधार. सीपीयू, जीपीयू और डीएसपी में पीढ़ीगत सुधारों का उपयोग करना - ये सभी अपने स्वयं के एआई-केंद्रित देखते हैं अपग्रेड - कंपनी प्रतिस्पर्धियों के मुकाबले प्रभावशाली बेंचमार्क पोस्ट करने में सक्षम है, जिस पर हम चर्चा करेंगे शीघ्र ही. कंपनी के हालिया विपणन प्रयासों और विषम कंप्यूटिंग पर एकीकृत, लगातार संदेश के साथ, उनकी एआई ब्रांडिंग अंततः पत्रकारों और तकनीकी उत्साही लोगों के बीच लोकप्रियता हासिल कर रही है।

तंत्रिका नेटवर्क का रहस्योद्घाटन: रैखिक बीजगणित का एक सांसारिक ढेर

बहुत सारे शब्दजाल को सुलझाने के लिए जो हम लेख में बाद में देखेंगे, हमें एक संक्षिप्त प्राइमर की आवश्यकता है तंत्रिका नेटवर्क क्या है और इसे तेज़ बनाने के लिए आपको क्या चाहिए. मैं तंत्रिका नेटवर्क के कुछ गणितीय आधारों पर संक्षेप में चर्चा करना चाहता हूं, जितना संभव हो उतना शब्दजाल और संकेतन से बचना चाहता हूं। इस अनुभाग का उद्देश्य मूल रूप से यह पहचानना है कि तंत्रिका नेटवर्क क्या कर रहा है: अंकगणितीय परिचालन यह सैद्धांतिक आधार के बजाय कार्यान्वयन करता है जो उक्त परिचालनों को उचित ठहराता है (जो कहीं अधिक जटिल है!)। यदि आप सीधे क्वालकॉम एआई इंजन अपग्रेड पर जाना चाहते हैं तो बेझिझक अगले भाग पर आगे बढ़ें।

"वेक्टर गणित गहन शिक्षा की नींव है।" - ट्रैविस लैनियर, 2017 स्नैपड्रैगन टेक समिट में क्वालकॉम में उत्पाद प्रबंधन के वरिष्ठ निदेशक

नीचे आपको एक बहुत ही विशिष्ट फीडफॉरवर्ड पूर्णतः कनेक्टेड न्यूरल नेटवर्क आरेख मिलेगा। वास्तव में, आरेख पूरी प्रक्रिया को उससे कुछ अधिक जटिल बना देता है (कम से कम, जब तक आपको इसकी आदत न हो जाए)। हम एक फॉरवर्ड पास की गणना करेंगे, जो अंततः एक नेटवर्क करता है जब भी वह एक का उत्पादन करता है अनुमान, एक शब्द जिसका सामना हम लेख में बाद में भी करेंगे। फिलहाल, हम केवल मशीन और उसके हिस्सों के बारे में ही बात करेंगे, प्रत्येक घटक की संक्षिप्त व्याख्या के साथ।

एक तंत्रिका नेटवर्क अनुक्रमिक से बना होता है परतें, प्रत्येक में जुड़े हुए कई "न्यूरॉन्स" (आरेख में वृत्त के रूप में दर्शाए गए) शामिल हैं तौल (आरेख में रेखाओं के रूप में दर्शाया गया है)। सामान्य शब्दों में, परतें तीन प्रकार की होती हैं: इनपुट परत, जो कच्चा इनपुट लेता है; छुपी हुई परतें, जो पिछली परत से गणितीय संचालन की गणना करता है, और आउटपुट परत, जो अंतिम भविष्यवाणियाँ प्रदान करता है। इस मामले में, हमारे पास तीन के साथ केवल एक छिपी हुई परत है छिपी हुई इकाइयाँ. इनपुट इसमें एक वेक्टर, सरणी, या किसी विशेष आयाम या लंबाई की संख्याओं की सूची शामिल होती है। उदाहरण में, हमारे पास एक द्वि-आयामी इनपुट होगा, मान लीजिए [1.0, -1.0]. यहां ही आउटपुट नेटवर्क में एक अदिश या एकल संख्या होती है (सूची नहीं)। प्रत्येक छिपी हुई इकाई एक सेट से जुड़ी होती है तौल और ए पूर्वाग्रह शब्द, प्रत्येक नोड के साथ और नीचे दिखाया गया है। की गणना करने के लिए भारित राशि एक इकाई का आउटपुट, प्रत्येक वजन को प्रत्येक संबंधित इनपुट से गुणा किया जाता है, और फिर उत्पादों को एक साथ जोड़ा जाता है। फिर, हम उत्पादों के उस योग में पूर्वाग्रह शब्द जोड़ देंगे, जिसके परिणामस्वरूप न्यूरॉन का आउटपुट प्राप्त होगा। उदाहरण के लिए, हमारे इनपुट के साथ [1.0,-1.0], पहली छिपी हुई इकाई का आउटपुट होगा 1.0*0.3 + (-1.0) * 0.2 + 1.0 = 1.1. सरल, सही?

आरेख में अगला चरण एक को दर्शाता है सक्रियण समारोह, और यही हमें प्रत्येक छिपी हुई परत के आउटपुट वेक्टर का उत्पादन करने की अनुमति देगा। हमारे मामले में, हम बहुत लोकप्रिय और बेहद सरल का उपयोग करेंगे परिशोधित रैखिक इकाई या ReLU, जो एक इनपुट संख्या लेगा और या तो आउटपुट देगा (i) शून्य, यदि वह संख्या नकारात्मक है या शून्य (ii) इनपुट संख्या ही, यदि संख्या सकारात्मक है। उदाहरण के लिए, ReLU(-0.1) = 0, लेकिन ReLU(0.1) = 0.1. हमारे इनपुट के उदाहरण का अनुसरण करते हुए प्रसारित उस पहली छिपी हुई इकाई के माध्यम से, 1.1 का आउटपुट जिसकी हमने गणना की थी, सक्रियण फ़ंक्शन में पारित किया जाएगा, जिससे परिणाम मिलेगा ReLU(1.1)=1.1. इस उदाहरण में, आउटपुट परत, एक छिपी हुई इकाई की तरह काम करेगी: यह छिपी हुई इकाइयों के आउटपुट को उसके वजन से गुणा करेगी, और फिर इसके पूर्वाग्रह शब्द को जोड़ेगी। 0.2. अंतिम सक्रियण फ़ंक्शन, समारोह की ओर कदम बढ़ाएं, सकारात्मक इनपुट को 1 और नकारात्मक मान को 0 में बदल देगा। यह जानते हुए कि नेटवर्क में प्रत्येक ऑपरेशन कैसे संचालित होता है, हम अपने अनुमान की पूरी गणना इस प्रकार लिख सकते हैं:

हमारे फीडफॉरवर्ड न्यूरल नेटवर्क गणना में बस इतना ही है। जैसा कि आप देख सकते हैं, संचालन में लगभग पूरी तरह से उत्पाद और संख्याओं का योग शामिल होता है. हमारा सक्रियण कार्य ReLU(x) इसे बहुत आसानी से लागू किया जा सकता है, उदाहरण के लिए केवल कॉल करके अधिकतम (x, 0), जैसे कि जब भी इनपुट 0 से अधिक हो तो यह x लौटाता है, लेकिन अन्यथा यह 0 लौटाता है। ध्यान दें कि चरण (एक्स) समान रूप से गणना की जा सकती है। कई अधिक जटिल सक्रियण फ़ंक्शन मौजूद हैं, जैसे कि सिग्मोइडल फ़ंक्शन या अतिशयोक्तिपूर्ण स्पर्शरेखा, जिसमें विभिन्न आंतरिक गणनाएँ शामिल हैं और विभिन्न उद्देश्यों के लिए बेहतर अनुकूल हैं। एक और चीज़ जिसे आप पहले से ही नोटिस करना शुरू कर सकते हैं वह यह है कि हम भी तीन छिपी हुई इकाइयों की गणना और उनके ReLU अनुप्रयोगों को समानांतर में चला सकते हैं, क्योंकि जब तक हम आउटपुट नोड पर उनके भारित योग की गणना नहीं करते, तब तक उनके मूल्यों की एक ही समय में आवश्यकता नहीं होती है।

लेकिन हमें यहीं नहीं रुकना है. ऊपर, आप वही गणना देख सकते हैं, लेकिन इस बार इसके बजाय मैट्रिक्स और वेक्टर गुणन संचालन के साथ दर्शाया गया है। इस प्रतिनिधित्व पर पहुंचने के लिए, हम अपने इनपुट वेक्टर में 1.0 (हल्का रंग) जोड़कर इसे "बढ़ाते" हैं, जैसे कि जब हम अपना इनपुट वेक्टर डालते हैं जैसा कि ऊपर दिखाया गया है, मैट्रिक्स में वजन और हमारा पूर्वाग्रह (हल्का रंग), परिणामी गुणन से वही छिपी हुई इकाई प्राप्त होती है आउटपुट. फिर, हम तत्व-वार आउटपुट वेक्टर पर ReLU लागू कर सकते हैं, और फिर ReLU आउटपुट को "संवर्धित" करके इसे हमारी आउटपुट परत के वजन और पूर्वाग्रह से गुणा कर सकते हैं। यह प्रतिनिधित्व अंकन को बहुत सरल बनाता है, क्योंकि संपूर्ण छिपी हुई परत के पैरामीटर (वजन और पूर्वाग्रह) को एक ही चर के अंतर्गत रखा जा सकता है। लेकिन हमारे लिए सबसे महत्वपूर्ण बात यह है कि यह स्पष्ट हो जाता है नेटवर्क की आंतरिक गणना अनिवार्य रूप से मैट्रिक्स और वेक्टर गुणन या डॉट उत्पाद हैं। यह देखते हुए कि इन वैक्टरों और मैट्रिक्स का आकार हमारे इनपुट की आयामीता और हमारे नेटवर्क में मापदंडों की संख्या के साथ कैसे बढ़ता है, अधिकांश रनटाइम इस प्रकार की गणना करने में व्यतीत होगा। रैखिक बीजगणित का एक गुच्छा!

बेशक, हमारा खिलौना उदाहरण है, बहुत दायरे में सीमित. व्यवहार में, आधुनिक गहन शिक्षण मॉडल में सैकड़ों नहीं तो दसियों छिपी हुई परतें और लाखों संबंधित पैरामीटर हो सकते हैं। हमारे द्वि-आयामी वेक्टर इनपुट उदाहरण के बजाय, वे हजारों प्रविष्टियों वाले वैक्टर ले सकते हैं, विभिन्न आकारों में, जैसे कि मैट्रिक्स (जैसे एकल-चैनल छवियां) या टेंसर (तीन-चैनल आरजीबी) इमेजिस)। हमारे मूल इनपुट में पंक्तियाँ जोड़कर, हमारे मैट्रिक्स प्रतिनिधित्व को एक साथ कई इनपुट वैक्टर लेने से कोई नहीं रोक सकता है। तंत्रिका नेटवर्क को हमारे फीडफॉरवर्ड तंत्रिका नेटवर्क से अलग तरीके से "वायर्ड" किया जा सकता है, या विभिन्न सक्रियण कार्यों को निष्पादित किया जा सकता है। नेटवर्क आर्किटेक्चर और तकनीकों का एक विशाल चिड़ियाघर है, लेकिन अंत में, वे ज्यादातर समानान्तर अंकगणितीय संक्रियाओं को तोड़ें जो हम अपने खिलौने के उदाहरण में पाते हैं, बहुत बड़े पैमाने पर।

टेंसर पर काम करने वाली कनवल्शन परतों का दृश्य उदाहरण। (छवि क्रेडिट: डेटा साइंस की ओर)

उदाहरण के लिए, लोकप्रिय कनवल्शनल न्यूरल नेटवर्क (सीएनएन) जिनके बारे में आपने पढ़ा होगा वे हमारे मॉक नेटवर्क की तरह "पूरी तरह से जुड़े हुए" नहीं हैं। इसके छिपे हुए "वजन" या पैरामीटर संवेगात्मक परतें इसे एक प्रकार के फिल्टर के रूप में सोचा जा सकता है, एक स्लाइडिंग विंडो जो इनपुट के छोटे पैच पर क्रमिक रूप से लागू होती है जैसा कि ऊपर दिखाया गया है - यह "कन्वोल्यूशन" वास्तव में सिर्फ एक स्लाइडिंग डॉट उत्पाद है! इस प्रक्रिया का परिणाम वह होता है जिसे अक्सर a कहा जाता है फ़ीचर मानचित्र. छवि के छोटे पैच के अधिकतम या औसत मूल्य की गणना करके, पूलिंग परतें इनपुट या कनवल्शनल परत के आउटपुट के आकार को कम करती हैं। बाकी नेटवर्क में आमतौर पर पूरी तरह से कनेक्टेड परतें होती हैं, जैसे हमारे उदाहरण में हैं, और ReLU जैसे सक्रियण फ़ंक्शन होते हैं। इसका उपयोग अक्सर उन छवियों में फ़ीचर निष्कर्षण के लिए किया जाता है जहां प्रारंभिक संकेंद्रित परतों के फ़ीचर मानचित्र "पता लगा सकते हैं" रेखाएं या किनारे जैसे पैटर्न, और बाद की परतें चेहरे या जटिल जैसी अधिक जटिल विशेषताओं का पता लगा सकती हैं आकृतियाँ

जो कुछ कहा गया है वह सब है केवल अनुमान तक ही सीमित है, या किसी तंत्रिका नेटवर्क के मापदंडों का पता लगने के बाद उसका मूल्यांकन करना प्रशिक्षण जो बहुत अधिक जटिल प्रक्रिया है. और फिर, हमने बहुत सारे स्पष्टीकरणों को बाहर कर दिया है। वास्तव में, नेटवर्क के प्रत्येक घटक को एक उद्देश्य के लिए शामिल किया गया है। उदाहरण के लिए, आपमें से जिन लोगों ने रैखिक बीजगणित का अध्ययन किया है, वे इसे बिना आसानी से देख सकते हैं गैर-रेखीय सक्रियण फ़ंक्शंस, हमारा नेटवर्क बहुत सीमित पूर्वानुमान के साथ एक रैखिक मॉडल को सरल बनाता है क्षमता।

स्नैपड्रैगन 865 पर एक उन्नत एआई इंजन - सुधारों का सारांश

तंत्रिका नेटवर्क के घटकों और उनके गणितीय संचालन की इस आसान समझ के साथ, हम यह समझना शुरू कर सकते हैं कि हार्डवेयर त्वरण इतना महत्वपूर्ण क्यों है। अंतिम खंड में, हम देख सकते हैं कि नेटवर्क को तेज़ करने के लिए समानांतरीकरण महत्वपूर्ण है उदाहरण के लिए, हमें प्रत्येक न्यूरॉन के अनुरूप कई समानांतर डॉट-उत्पादों की गणना करने की अनुमति देता है सक्रियण. इनमें से प्रत्येक डॉट-उत्पाद स्वयं संख्याओं पर गुणा-जोड़ संचालन से बना है, आमतौर पर मोबाइल एप्लिकेशन के मामले में 8-बिट परिशुद्धता के साथ, जो जितनी जल्दी हो सके होना चाहिए। एआई इंजन डेवलपर के प्रदर्शन और बिजली दक्षता विचारों के आधार पर इन कार्यों को पूरा करने के लिए विभिन्न घटकों की पेशकश करता है।

लोकप्रिय एमएनआईएसटी डेटासेट के लिए सीएनएन का एक आरेख, इस साल के स्नैपड्रैगन शिखर सम्मेलन में मंच पर दिखाया गया। वेक्टर प्रोसेसिंग यूनिट पूरी तरह से जुड़ी हुई परतों के लिए उपयुक्त है, जैसा कि हमारे नकली उदाहरण में है। इस बीच, टेंसर प्रोसेसर कनवल्शनल और पूलिंग परतों को संभालता है जो एकाधिक स्लाइडिंग की प्रक्रिया करता है ऊपर दिए गए चित्र की तरह, समानांतर में गुठली, और प्रत्येक संकेंद्रित परत कई अलग-अलग सुविधाओं को आउटपुट कर सकती है मानचित्र.

सबसे पहले, आइए GPU पर नज़र डालें, जिसके बारे में हम आमतौर पर 3D गेम के संदर्भ में बात करते हैं। वीडियो गेम के उपभोक्ता बाजार ने दशकों से ग्राफिक्स प्रोसेसिंग हार्डवेयर में विकास को प्रेरित किया है, लेकिन तंत्रिका नेटवर्क के लिए जीपीयू इतने महत्वपूर्ण क्यों हैं? शुरुआत के लिए, वे इन-गेम विश्व स्थिति पर नज़र रखने के लिए बहुभुज शीर्षों के 3डी निर्देशांक की विशाल सूचियों को एक साथ चबाते हैं। GPU को इन 3D को परिवर्तित (या मैप) करने के लिए विशाल मैट्रिक्स गुणन संचालन भी करना होगा 2डी प्लेनर पर निर्देशांक, ऑन-स्क्रीन निर्देशांक, और पिक्सेल की रंग जानकारी को भी संभालता है समानांतर। इन सबसे ऊपर, वे इन-गेम ज्यामिति पर मढ़ा बनावट बिटमैप्स के लिए विशाल मेमोरी बफ़र्स को संभालने के लिए उच्च मेमोरी बैंडविड्थ प्रदान करते हैं। समानांतरीकरण, मेमोरी बैंडविड्थ और परिणामी रैखिक बीजगणित क्षमताओं में इसके फायदे तंत्रिका नेटवर्क की प्रदर्शन आवश्यकताओं से मेल खाते हैं।

इस प्रकार एड्रेनो जीपीयू लाइन की क्वालकॉम एआई इंजन में एक बड़ी भूमिका है, और मंच पर, क्वालकॉम ने कहा कि स्नैपड्रैगन 865 में यह अद्यतन घटक सक्षम बनाता है फ़्लोटिंग-पॉइंट क्षमताओं से दोगुनी और TOPS की संख्या दोगुनी पिछली पीढ़ी की तुलना में, यह आश्चर्यजनक है कि उन्होंने ग्राफ़िक्स रेंडरिंग के लिए केवल 25% प्रदर्शन वृद्धि पोस्ट की। फिर भी, इस रिलीज़ के लिए, कंपनी का दावा है अंकगणितीय तर्क इकाइयों (एएलयू) की संख्या में 50% की वृद्धिहालाँकि, हमेशा की तरह, उन्होंने अपनी GPU आवृत्तियों का खुलासा नहीं किया है। क्वालकॉम ने मिश्रित-परिशुद्धता भी सूचीबद्ध की है निर्देश, जो बिल्कुल वैसा ही लगता है: एक ही कम्प्यूटेशनल विधि में संचालन में विभिन्न संख्यात्मक परिशुद्धता।

हेक्सागोन 698 डीएसपी वह जगह है जहां हम स्नैपड्रैगन 865 द्वारा पेश किए गए प्रदर्शन लाभ का एक बड़ा हिस्सा देखते हैं। इस वर्ष, कंपनी ने अपने डीएसपी के वेक्टर एक्सटेंशन (जिनका प्रदर्शन पिछले वर्ष के 855 में चौगुना हो गया) में सुधार के बारे में कोई सूचना नहीं दी है, न ही उनकी स्केलर इकाइयों में। हालाँकि, वे ध्यान देते हैं कि इस ब्लॉक के टेन्सर एक्सेलेरेटर के लिए, उन्होंने हासिल किया है टॉप से चार गुना हेक्सागोन 695 डीएसपी में पिछले साल पेश किए गए संस्करण की तुलना में, यह भी पेश करने में सक्षम है 35% बेहतर बिजली दक्षता. आधुनिक एआई उपयोग के मामलों में इमेज ऑब्जेक्ट डिटेक्शन से लेकर स्वचालित वाक् पहचान तक कन्वेन्शनल न्यूरल नेटवर्क आर्किटेक्चर की व्यापकता को देखते हुए यह एक बड़ी बात है। जैसा कि ऊपर बताया गया है, इन नेटवर्कों में कनवल्शन ऑपरेशन मैट्रिक्स आउटपुट की 2डी सरणी तैयार करता है प्रत्येक फ़िल्टर, जिसका अर्थ है कि जब एक साथ स्टैक किया जाता है, तो कनवल्शन परत का आउटपुट एक 3D सरणी या होता है टेंसर.

क्वालकॉम ने भी अपने "नए और अनूठे" को बढ़ावा दिया गहन शिक्षण बैंडविड्थ संपीड़न तकनीक, जो स्पष्ट रूप से हो सकती है लगभग 50% तक हानि रहित तरीके से डेटा को संपीड़ित करें, बदले में आधे डेटा को स्थानांतरित करना और चिपसेट के अन्य हिस्सों के लिए बैंडविड्थ को मुक्त करना। इससे उस डेटा थ्रूपुट को कम करके बिजली भी बचानी चाहिए, हालांकि हमें कोई आंकड़े नहीं दिए गए हैं और डेटा को संपीड़ित करने के लिए एक छोटी बिजली लागत भी होनी चाहिए।

बैंडविड्थ के विषय पर, स्नैपड्रैगन 865 सपोर्ट करता है एलपीडीडीआर5 मेमोरी, जिससे एआई प्रदर्शन को भी लाभ होगा क्योंकि इससे संसाधनों और इनपुट डेटा को स्थानांतरित करने की गति बढ़ जाएगी। हार्डवेयर से परे, क्वालकॉम का नया एआई मॉडल दक्षता टूलकिट डेवलपर्स के लिए आसान मॉडल संपीड़न और परिणामी बिजली दक्षता बचत उपलब्ध कराता है। तंत्रिका नेटवर्क में अक्सर बड़ी संख्या में "अनावश्यक" पैरामीटर होते हैं; उदाहरण के लिए, वे छिपी हुई परतों को आवश्यकता से अधिक चौड़ा बना सकते हैं। मंच पर चर्चा की गई एआई टूलकिट सुविधाओं में से एक इस प्रकार है मॉडल संपीड़न, उद्धृत विधियों में से दो स्थानिक एकवचन मूल्य अपघटन (एसवीडी) और बायेसियन संपीड़न हैं, दोनों जो अनावश्यक नोड्स से छुटकारा दिलाकर और मॉडल संरचना को समायोजित करके तंत्रिका नेटवर्क को प्रभावी ढंग से काटता है आवश्यक। मंच पर प्रस्तुत अन्य मॉडल संपीड़न तकनीक परिमाणीकरण से संबंधित है, और इसमें वजन मापदंडों और सक्रियण नोड गणनाओं की संख्यात्मक सटीकता को बदलना शामिल है।

तंत्रिका नेटवर्क भार की संख्यात्मक परिशुद्धता से तात्पर्य है कि गणना के लिए उपयोग किए जाने वाले संख्यात्मक मानों को 64, 32, 16 (अर्ध-सटीक) या 8-बिट मानों के रूप में संग्रहीत, स्थानांतरित और संसाधित किया जाता है या नहीं। कम संख्यात्मक परिशुद्धता (उदाहरण के लिए, INT8 बनाम FP32) का उपयोग करने से समग्र मेमोरी उपयोग और डेटा ट्रांसफर गति कम हो जाती है, जिससे उच्च बैंडविड्थ और तेज़ अनुमान की अनुमति मिलती है। आज के बहुत से गहन शिक्षण अनुप्रयोगों ने अनुमान के लिए 8-बिट सटीक मॉडल पर स्विच कर दिया है, जो अच्छा लग सकता है आश्चर्य की बात है: क्या उच्च संख्यात्मक सटीकता वर्गीकरण या प्रतिगमन में अधिक "सटीक" भविष्यवाणियां सक्षम नहीं कर पाएगी कार्य? आवश्यक रूप से नहीं; उच्च संख्यात्मक सटीकता, विशेष रूप से अनुमान के दौरान, बर्बाद हो सकती है क्योंकि तंत्रिका नेटवर्क को शोर इनपुट से निपटने के लिए प्रशिक्षित किया जाता है या वैसे भी पूरे प्रशिक्षण के दौरान छोटी-मोटी गड़बड़ी, और किसी दिए गए (एफपी) मान के निचले-बिट प्रतिनिधित्व पर त्रुटि समान रूप से 'यादृच्छिक' है पर्याप्त। एक अर्थ में, गणनाओं की कम-सटीकता को नेटवर्क द्वारा शोर के एक अन्य स्रोत के रूप में माना जाता है, और भविष्यवाणियाँ प्रयोग योग्य बनी रहती हैं। अनुमानी व्याख्याकारों को छोड़ दें, तो यह संभव है कि किसी मॉडल की घटिया मात्रा निर्धारित करने पर आप सटीकता दंड अर्जित करेंगे कुछ महत्वपूर्ण विचारों को ध्यान में रखे बिना, यही कारण है कि बहुत सारे शोध किए जाते हैं विषय

क्वालकॉम एआई टूलकिट पर वापस: इसके माध्यम से वे पेशकश करते हैं डेटा-मुक्त परिमाणीकरण, विभिन्न कार्यों पर लगभग-मूल मॉडल प्रदर्शन प्राप्त करते हुए मॉडल को डेटा या पैरामीटर फ़ाइन-ट्यूनिंग के बिना परिमाणित करने की अनुमति देता है। अनिवार्य रूप से, यह परिमाणीकरण के लिए वजन मापदंडों को अनुकूलित करता है और कम परिशुद्धता वजन पर स्विच करते समय शुरू की गई पूर्वाग्रह त्रुटि को ठीक करता है। परिमाणीकरण से होने वाले लाभों को देखते हुए, एपीआई कॉल के तहत प्रक्रिया को स्वचालित करने से मॉडल उत्पादन और तैनाती सरल हो जाएगी, और क्वालकॉम का दावा है प्रति वाट प्रदर्शन चार गुना से भी अधिक परिमाणित मॉडल चलाते समय।

लेकिन फिर, यह चौंकाने वाली बात नहीं है: परिमाणीकरण मॉडल जबरदस्त बैंडविड्थ और भंडारण लाभ प्रदान कर सकते हैं। किसी मॉडल को INT8 में परिवर्तित करने से न केवल आपको बैंडविड्थ में 4x की कमी मिलती है, बल्कि तेज पूर्णांक गणना (हार्डवेयर के आधार पर) का लाभ भी मिलता है। फिर, इसमें कोई संदेह नहीं है कि परिमाणीकरण और संख्यात्मक गणना दोनों के लिए हार्डवेयर-त्वरित दृष्टिकोण से बड़े पैमाने पर प्रदर्शन लाभ प्राप्त होंगे। उनके ब्लॉग परउदाहरण के लिए, Google के पीट वार्डन ने लिखा है कि क्वालकॉम और टेन्सरफ़्लो टीमों के बीच सहयोग 8-बिट मॉडल को चलाने में सक्षम बनाता है सात गुना तेजसीपीयू की तुलना में एचवीएक्स डीएसपी पर। उपयोग में आसान परिमाणीकरण की क्षमता को बढ़ा-चढ़ाकर बताना कठिन है, विशेष रूप से यह देखते हुए कि कैसे क्वालकॉम ने INT8 प्रदर्शन पर ध्यान केंद्रित किया है।

स्नैपड्रैगन 865 का एआरएम-आधारित क्रियो सीपीयू अभी भी एआई इंजन का एक महत्वपूर्ण घटक है। यद्यपि उपरोक्त पैराग्राफ में चर्चा की गई हार्डवेयर त्वरण बेहतर है, कभी-कभी हम उन अनुप्रयोगों से बच नहीं सकते जो इन ब्लॉकों का उचित लाभ नहीं उठाते हैं, जिसके परिणामस्वरूप सीपीयू होता है मैदान छोड़ना। अतीत में, एआरएम ने मैट्रिक्स- और वेक्टर-आधारित गणनाओं में तेजी लाने के उद्देश्य से विशिष्ट निर्देश सेट पेश किए थे। ARMv7 प्रोसेसर में, हमने ARM NEON की शुरूआत देखी, जो एक SIMD आर्किटेक्चर एक्सटेंशन है जो DSP जैसे निर्देशों को सक्षम करता है। और ARMv8.4-A माइक्रोआर्किटेक्चर के साथ, हमने विशेष रूप से डॉट-उत्पादों के लिए एक निर्देश की शुरूआत देखी।

ये सभी पोस्ट किए गए प्रदर्शन लाभ हमारे द्वारा पिछले अनुभाग में वर्णित कई कार्यभार से संबंधित हैं, लेकिन यह भी ध्यान में रखने योग्य है कि ये स्नैपड्रैगन 865 अपग्रेड हैं केवल नवीनतम क्वालकॉम की AI क्षमताओं में सुधार। 2017 में, हमने हेक्सागोन 685 डीएसपी और अन्य चिपसेट अपडेट के साथ उनकी एआई क्षमताओं को तीन गुना करने का दस्तावेजीकरण किया। पिछले साल, उन्होंने अपना टेंसर एक्सेलेरेटर पेश किया, और हार्डवेयर स्तर पर गैर-रैखिकता कार्यों (जैसे उपरोक्त ReLU!) के लिए एकीकृत समर्थन पेश किया। उन्होंने वेक्टर त्वरक की संख्या भी दोगुनी कर दी और स्केलर प्रोसेसिंग यूनिट के प्रदर्शन में 20% सुधार किया। इन सभी को सीपीयू पक्ष में संवर्द्धन के साथ जोड़ना, जैसे एआरएम के सौजन्य से तेज डॉट-उत्पाद संचालन, और जीपीयू में अतिरिक्त एएलयू, क्वालकॉम अंततः तीन गुना कच्ची AI क्षमताएं भी।

व्यावहारिक लाभ और विस्तारित उपयोग-मामले

इन सभी अपग्रेडों से स्नैपड्रैगन 865 की AI क्षमताएं केवल दो साल पहले की तुलना में पांच गुना बढ़ गई हैं, लेकिन शायद सबसे महत्वपूर्ण बात यह है कि सुधार प्रति मिलीवाट बेहतर प्रदर्शन के साथ आए, जो मोबाइल के लिए एक महत्वपूर्ण मीट्रिक है उपकरण। स्नैपड्रैगन समिट 2019 में, क्वालकॉम ने हमें विभिन्न वर्गीकरण नेटवर्क पर दो प्रतिस्पर्धियों के मुकाबले अपने एआई इंजन की तुलना करते हुए कुछ बेंचमार्क दिए। ये आंकड़े AIMark, एक क्रॉस-प्लेटफ़ॉर्म बेंचमार्किंग एप्लिकेशन का उपयोग करके एकत्र किए गए प्रतीत होते हैं, जो Apple की A-सीरीज़ और Huawei के HiSilicon प्रोसेसर के साथ तुलना करने में सक्षम बनाता है। क्वालकॉम का दावा है कि ये परिणाम संपूर्ण एआई इंजन का उपयोग करते हैं, और हमें और इंतजार करना होगा प्रत्येक घटक के प्रभाव को ठीक से सुलझाने और यह निर्धारित करने के लिए कि ये परीक्षण कैसे थे, संपूर्ण बेंचमार्किंग संचालित। उदाहरण के लिए, क्या कंपनी बी के परिणाम सीपीयू फ़ॉलबैक का संकेत देते हैं? जहाँ तक मेरी जानकारी है, उदाहरण के लिए, AIMark वर्तमान में हमारी Mate 30 Pro इकाइयों पर किरिन 990 के NPU का लाभ नहीं उठाता है। लेकिन यह स्नैपड्रैगन न्यूरल प्रोसेसिंग इंजन को सपोर्ट करता है, इसलिए यह निश्चित रूप से क्वालकॉम एआई इंजन का लाभ उठाएगा; यह देखते हुए कि यह आंतरिक परीक्षण है, यह स्पष्ट रूप से स्पष्ट नहीं है कि बेंचमार्क अपने प्रतिस्पर्धियों के लिए सही लाइब्रेरी या एसडीके का उचित उपयोग कर रहा है या नहीं।

यह भी कहा जाना चाहिए कि क्वालकॉम स्नैपड्रैगन 865 की एआई प्रोसेसिंग क्षमताओं की तुलना पहले से घोषित या जारी चिपसेट से प्रभावी ढंग से कर रहा है। इसकी बहुत संभावना है कि इसके प्रतिस्पर्धी अगले चक्र में समान रूप से प्रभावशाली प्रदर्शन सुधार लाएंगे, और यदि ऐसा है यदि मामला है, तो स्नैपड्रैगन 865 उपकरणों के बाजार में आने के क्षण से क्वालकॉम केवल लगभग आधे साल तक ही ताज अपने पास रखेगा। जैसा कि कहा गया है, ये अभी भी संकेत हैं कि हम स्नैपड्रैगन 865 से किस तरह के उतार-चढ़ाव की उम्मीद कर सकते हैं। प्रदर्शन में सुधार और आगामी रिलीज़ के बेंचमार्क परिणामों के बारे में संचार करते समय क्वालकॉम आम तौर पर बहुत सटीक रहा है।

इन बेंचमार्क में प्रस्तुत सभी नेटवर्क इमेजनेट जैसे डेटाबेस से छवियों को वर्गीकृत कर रहे हैं, उन्हें इनपुट के रूप में प्राप्त कर रहे हैं और सैकड़ों श्रेणियों में से एक को आउटपुट कर रहे हैं। फिर, वे उसी प्रकार के ऑपरेशनों पर भरोसा करते हैं जिनका हमने दूसरे खंड में वर्णन किया है, हालांकि उनके आर्किटेक्चर बहुत सारे हैं इन उदाहरणों की तुलना में अधिक जटिल और प्रकाशन के समय उन्हें अत्याधुनिक समाधान माना गया है। सर्वोत्तम मामलों में, उनका निकटतम प्रतिद्वंद्वी प्रति सेकंड आधे से भी कम संख्या में अनुमान प्रदान करता है।

बिजली की खपत के संदर्भ में, क्वालकॉम ने बिजली की एक निश्चित मात्रा में संभव एआई प्रसंस्करण की मात्रा को प्रदर्शित करने के लिए प्रति वाट के आंकड़ों की पेशकश की। सबसे अच्छे मामलों में (मोबाइलनेट एसएसडी), स्नैपड्रैगन एआई इंजन समान पावर बजट के तहत दोगुनी संख्या में अनुमान पेश कर सकता है।

मोबाइल उपकरणों के लिए पावर विशेष रूप से महत्वपूर्ण है। उदाहरण के लिए, न्यूरल नेटवर्क-आधारित स्नैपचैट फ़िल्टर के बारे में सोचें। वास्तविक रूप से, कंप्यूटर विज़न पाइपलाइन चेहरे की जानकारी निकालती है और मास्क या इनपुट लगाती है किसी तरल पदार्थ को प्राप्त करने के लिए परिवर्तन को केवल 30 या 60 पूर्णताएं प्रति सेकंड की दर से चलाने की आवश्यकता होती है अनुभव। कच्चे एआई प्रदर्शन को बढ़ाने से आप उच्च-रिज़ॉल्यूशन इनपुट लेने और बेहतर दिखने वाले फ़िल्टर आउटपुट करने में सक्षम होंगे, लेकिन ऐसा हो सकता है तेज अपलोड और बिजली की खपत और थर्मल थ्रॉटलिंग को कम करने के लिए एचडी रिज़ॉल्यूशन को स्वीकार करना भी बेहतर होगा। कई अनुप्रयोगों में, "तेज़" आवश्यक रूप से "बेहतर" नहीं होता है, और फिर व्यक्ति को बेहतर बिजली दक्षता का लाभ मिलता है।

स्नैपड्रैगन शिखर सम्मेलन के दूसरे दिन के दौरान, स्नैपचैट के वरिष्ठ इंजीनियरिंग निदेशक यूरी मोनास्टिरशिन ने यह दिखाने के लिए मंच संभाला कि कैसे उनके नवीनतम डीप लर्निंग-आधारित फिल्टर को स्नैपड्रैगन पर हेक्सागोन 695 डीएसपी का उपयोग करके हेक्सागोन डायरेक्ट एनएन द्वारा काफी तेज किया गया है। 865.

उसके ऊपर, जैसे-जैसे डेवलपर्स को आसान तंत्रिका नेटवर्क कार्यान्वयन तक पहुंच मिलती है और अधिक एप्लिकेशन एआई तकनीकों को नियोजित करना शुरू कर देंगे, समवर्ती उपयोग के मामले अधिक सुर्खियों में आ जाएंगे क्योंकि स्मार्टफोन को कई कार्यों को संभालना होगा एक साथ समानांतर एआई पाइपलाइन (या तो एक ही एप्लिकेशन के लिए विभिन्न स्रोतों से इनपुट सिग्नल संसाधित करना या कई एप्लिकेशन अलग-अलग चलते हैं उपकरण पर)। जबकि हम कंप्यूटिंग डीएसपी, जीपीयू और सीपीयू में सम्मानजनक बिजली दक्षता लाभ देखते हैं, क्वालकॉम सेंसिंग हब बहुत कम बिजली की खपत पर ट्रिगर शब्दों को सुनने के लिए हमेशा उपयोग के मामलों को संभालता है। यह 1mA से कम करंट पर ऑडियो, वीडियो और सेंसर फ़ीड की निगरानी करने में सक्षम बनाता है, जिससे डिवाइस को परिचित डिजिटल सहायक कीवर्ड के शीर्ष पर विशेष ध्वनि संकेतों (जैसे कि एक बच्चा रो रहा है) को पहचानने की अनुमति मिलती है। उस नोट पर, स्नैपड्रैगन 865 न केवल कीवर्ड का पता लगाने में सक्षम बनाता है, बल्कि यह भी बताता है कि इसे कौन बोल रहा है, एक अधिकृत उपयोगकर्ता की पहचान करने और उसके अनुसार कार्य करने में।

एज डिवाइसेज़ पर अधिक AI

ये सुधार अंततः आपके उपयोगकर्ता-अनुभव के लिए ठोस लाभ में तब्दील हो सकते हैं। ऐसी सेवाएँ जिनमें अनुवाद, वस्तु पहचान और लेबलिंग, उपयोग की भविष्यवाणी या आइटम अनुशंसाएँ शामिल हैं, प्राकृतिक भाषा की समझ, भाषण विश्लेषण आदि से तेजी से संचालन और कम खपत का लाभ मिलेगा शक्ति। उच्च गणना बजट होने से नए उपयोग के मामलों और अनुभवों के निर्माण और क्लाउड में होने वाली प्रक्रियाओं को आपके डिवाइस पर स्थानांतरित करने में भी मदद मिलती है। जबकि एआई शब्द का प्रयोग अतीत में संदिग्ध, धोखा देने वाले और यहां तक कि गलत तरीकों से किया गया है (यहां तक कि ओईएम द्वारा भी), आज आप जिन सेवाओं का आनंद ले रहे हैं उनमें से कई अंततः किसी न किसी रूप में मशीन लर्निंग एल्गोरिदम पर निर्भर हैं एक और।

लेकिन क्वालकॉम के अलावा, अन्य चिपसेट निर्माता भी तेजी से इस मोर्चे पर सुधार कर रहे हैं। उदाहरण के लिए, 990 5G 2+1 NPU कोर डिज़ाइन लेकर आया जिसके परिणामस्वरूप किरिन 980 का प्रदर्शन 2.5 गुना और Apple A12 का दोगुना हो गया। जब प्रोसेसर की घोषणा की गई थी, तो इसे प्रति सेकंड दोगुने फ्रेम (अनुमान) की पेशकश करते हुए दिखाया गया था INT8 मोबाइलनेट पर स्नैपड्रैगन 855 का, जो कि क्वालकॉम द्वारा उपलब्ध कराए गए परिणामों से मेल खाना मुश्किल है। दूसरी ओर, Apple A13 बायोनिक ने कथित तौर पर अपने पूर्ववर्ती की तुलना में छह गुना तेज मैट्रिक्स गुणन की पेशकश की और इसके आठ-कोर न्यूरल इंजन डिजाइन में सुधार किया। हमें तब तक इंतजार करना होगा जब तक हम स्नैपड्रैगन 865 को उसके वर्तमान और भविष्य के प्रतिस्पर्धियों के खिलाफ वाणिज्यिक उपकरणों पर ठीक से परीक्षण नहीं कर सकते, लेकिन यह है स्पष्ट है कि इस क्षेत्र में प्रतिस्पर्धा कभी भी स्थिर नहीं रहती है क्योंकि तीनों कंपनियां अपने एआई को बेहतर बनाने के लिए ढेर सारे संसाधन लगा रही हैं प्रदर्शन।