يعد معالج Hexagon 685 DSP من Qualcomm أحد أقوى مراكز التعلم الآلي

يحتوي Snapdragon 845 من Qualcomm على شريحة قوية للتعلم الآلي بداخله. يطلق عليه اسم Hexagon 685 DSP، وهو يمثل خطوة كبيرة للأمام في أجهزة الذكاء الاصطناعي.

يعد Snapdragon 845 - أحدث نظام على شريحة في عائلة Snapdragon من Qualcomm - بمثابة قوة معالج. إنه يتميز بمراكز وحدة المعالجة المركزية السريعة، ومعالج إشارات الصور Spectra من الجيل الثالث (ISP)، وبنية أكثر كفاءة في استخدام الطاقة بنسبة 30 بالمائة من الجيل السابق. ولكن يمكن القول إن العنصر الأكثر إثارة للإعجاب هو المعالج المشترك - Hexagon 685 DSP - المصمم خصيصًا للذكاء الاصطناعي والتعلم الآلي.

ما الذي يميز معالج Qualcomm's Hexagon 685 DSP؟

بنية Hexagon DSP في Snapdragon 835. المصدر: كوالكوم

"الرياضيات المتجهة هي أساس التعلم العميق." - ترافيس لانير، المدير الأول لإدارة المنتجات في شركة كوالكوم

لفهم ما الذي يجعل Hexagon DSP فريدًا جدًا، من المفيد أن نعرف أن الذكاء الاصطناعي مدفوع بنوع تخصصات الهندسة في كلية الرياضيات المألوفة تمامًا. يتضمن التعلم الآلي عمليات حسابية باستخدام ناقلات كبيرة، مما يشكل تحديًا لمعالجات الهواتف الذكية والأجهزة اللوحية وأجهزة الكمبيوتر. من الصعب على الرقائق ذات الأغراض العامة حساب خوارزميات مثل النسب التدرج العشوائي - أنواع الخوارزميات التي تشكل جوهر التطبيقات التي تعمل بالذكاء الاصطناعي - بسرعة وكفاءة. تم تقديم معالج Hexagon DSP من Qualcomm جزئيًا لحل هذه المشكلة: إنه رائع في التعامل مع بيانات الصور وأجهزة الاستشعار، وخاصة التصوير الفوتوغرافي.

لكن جهاز Hexagon DSP قادر على أكثر من مجرد تجميل صور السيلفي. تمنحها سياقات HVX المضمنة (المزيد حول تلك لاحقًا) ميزة كل من المعالجات ذات الأغراض العامة والنوى ذات الوظائف الثابتة؛ يتميز Hexagon 685 DSP بكفاءة رائعة في حساب العمليات الحسابية وراء التعلم الآلي على الجهاز، ولكنه يحتفظ بمرونة المعالجات الأكثر قابلية للبرمجة.

شرائح الذكاء الاصطناعي مثل Hexagon 685 DSP، والتي يشار إليها أحيانًا باسم "وحدات المعالجة العصبية"، تم تصميم "المحركات العصبية" أو "مراكز التعلم الآلي" خصيصًا لتناسب خوارزميات الذكاء الاصطناعي الرياضية الاحتياجات. إنها أكثر صرامة في التصميم من وحدات المعالجة المركزية التقليدية، وتحتوي على تعليمات وترتيبات خاصة (في حالة Hexagon 685 DSP، بنية HVX المذكورة أعلاه) التي تعمل على تسريع بعض العمليات العددية والمتجهة، والتي تصبح ملحوظة في نطاق واسع التطبيقات.

يمكن لـ Snapdragon 845's Hexagon 685 DSP التعامل مع آلاف البتات من الوحدات المتجهة لكل دورة معالجة، مقارنة بمئات البتات المتوسطة لوحدة المعالجة المركزية الأساسية في كل دورة. هذا حسب التصميم. مع أربعة مؤشرات ترابط عددية متوازية لعمليات كلمات التعليمات الطويلة جدًا (VLIW) وسياقات HVX المتعددة، فإن DSP هو قادر على التوفيق بين وحدات تنفيذ متعددة بناءً على تعليمات واحدة والاختراق من خلال الأعداد الصحيحة والفاصلة العشرية الثابتة عمليات.

بدلاً من دفع الأداء عبر ميغاهيرتز الخام، يهدف تصميم Hexagon 685 إلى مستويات عالية من العمل لكل دورة بسرعة منخفضة على مدار الساعة. وهو يشتمل على سلاسل عمليات متعددة للأجهزة تعمل بشكل جيد مع VLIW، حيث تعمل سلاسل العمليات المتعددة على إخفاء زمن انتقال خطوط الأنابيب مما يتيح الاستفادة بشكل أفضل من حزم VLIW. إن الخيوط المتعددة لـ DSP تعني أنه يمكنه خدمة جلسات إلغاء التحميل المتعددة - أي التطبيقات المتزامنة للصوت، والكاميرا، رؤية الكمبيوتر، وما إلى ذلك - وتسريع المهام المختلفة في وقت واحد، مما يمنع التطبيقات من الاضطرار إلى القتال من أجلها وقت التنفيذ.

المصدر: كوالكوم

لكن هذه ليست نقاط القوة الوحيدة لـ Hexagon DSP. تتميز بنية مجموعة التعليمات (ISA) الخاصة بها بكفاءة محسنة مقارنة بـ VLIW التقليدية بفضل تم تحسين رمز التحكم، ويستخدم حيلًا ذكية لاستعادة الأداء من حالة الخمول والمتوقفة الخيوط. كما أنه ينفذ أيضًا جدولة سلاسل الرسائل الدائرية ذات زمن الوصول الصفري، مما يعني أن سلاسل رسائل DSP تعالج التعليمات الجديدة فورًا بعد إكمال حزمة البيانات السابقة.

المصدر: كوالكوم

لنكون واضحين، لا شيء من هذا جديد. قدمت شركة كوالكوم "الجيل الأول" (أو الصحيح) Hexagon DSP - Hexagon 680، أو QDSP6 v6 - جنبًا إلى جنب مع Snapdragon 820 في عام 2015، وتبعه Hexagon 680 الذي تم تحسينه قليلاً السداسي 682. لكن الجيل الأحدث هو الأكثر تطورًا حتى الآن، ويقدم ما يصل إلى ثلاثة أضعاف الأداء الإجمالي لمعالج الإشارة الرقمية الخاص بمعالج Snapdragon 835.

ويرجع الفضل في ذلك إلى حد كبير إلى HVX، الذي عمل بشكل جيد للغاية في معالجة الصور (فكر في الواقع المعزز، ورؤية الكمبيوتر، والفيديو، والصور). يمكن التحكم في سجلات HVX الخاصة بـ DSP بواسطة أي اثنين من السجلات العددية، ويمكن استخدام وحدات HVX والوحدات العددية في وقت واحد، مما يؤدي إلى مكاسب كبيرة في الأداء والتزامن.

هنا شرح كوالكوم:

"لنفترض أنك تقوم بالمعالجة على وحدة المعالجة المركزية المحمولة في وضع رمز التحكم وقمت بالتبديل إلى الوضع الحسابي على المعالج المساعد. إذا كنت بحاجة إلى أي رمز تحكم، فيجب عليك التوقف والعودة من المعالج المساعد إلى وحدة المعالجة المركزية الرئيسية. باستخدام Hexagon، يمكن تشغيل كل من معالج كود التحكم على DSP ومعالج الكود الحسابي على HVX في نفس الوقت من أجل اقتران محكم للتحكم والكود الحسابي. وهذا يسمح لـ DSP بأخذ نتيجة حساب HVX واستخدامها في قرار رمز التحكم في دورة الساعة التالية.

يوفر HVX ميزة كبيرة أخرى في معالجة مستشعر الصورة. يمكن لأجهزة Snapdragon المزودة بـ Hexagon 685 DSP دفق البيانات مباشرة من مستشعر التصوير إلى الذاكرة المحلية لـ DSP (L2 Cache)، متجاوزة وحدة تحكم ذاكرة DDR الخاصة بالجهاز. يؤدي ذلك إلى تقليل زمن الوصول بالطبع، ولكنه يعمل أيضًا على تحسين عمر البطارية - حيث تم تصميم معالج Snapdragon ليكون خاملاً طوال العملية.

تم تحسينه خصيصًا لشبكات الفاصلة العائمة 16 بت، ويتم التحكم فيه بواسطة برنامج التعلم الآلي من Qualcomm: محرك المعالجة العصبية Snapdragon.

وقال متحدث باسم كوالكوم: "لقد أخذنا الأمر على محمل الجد". "لقد عملنا مع الشركاء على مدى السنوات الثلاث الماضية لجعلهم يستخدمون [...] السيليكون الخاص بنا في الذكاء الاصطناعي والتصوير."

ومن بين هؤلاء الشركاء شركة Google، التي استخدمت جزء معالجة الصور في Hexagon DSP لتشغيل خوارزمية HDR+ الخاصة بهواتف Pixel وPixel 2، على سبيل المثال. على الرغم من أن Google قدمت Pixel Core الخاصة بها أيضًا، فمن الجدير بالذكر أن الأجهزة التي تدعم Hexagon 685 DSP هي الأفضل. تلك التي تحقق أفضل النتائج باستخدام منفذ Google Camera الشهير، ويرجع ذلك جزئيًا إلى (كما أكدنا) HVX استغلال. وعمل فيسبوك، وهو شريك آخر، بشكل وثيق مع شركة كوالكوم لتسريع مرشحات وتأثيرات الكاميرا في الوقت الفعلي لبرنامج Messenger.

قامت شركة أوبو بتحسين تقنية فتح القفل بالوجه لـ Hexagon 685 DSP، وطورت لينوفو ميزة Landmark Detection حولها.

أحد أسباب الدعم الكبير الذي توفره المنصة هو بساطتها. يدعم Hexagon SDK الشامل من Qualcomm لغة Halide لمعالجة الصور عالية الأداء، وليست هناك حاجة ما يدعو للقلق بشأن أطر التدريب على التعلم الآلي - يعد تنفيذ النموذج أمرًا بسيطًا مثل إجراء استدعاء واجهة برمجة التطبيقات (API)، في معظم الأحيان حالات.

"نحن لا [...] نتنافس مع أمثال IBM وNvidia [في الذكاء الاصطناعي]، ولكن لدينا مجالات يمكن للمطورين الاستفادة منها - وهي موجودة بالفعل،" كما صرحت شركة Qualcomm لمطوري XDA.

مسدس مقابل. المنافسة

يأتي معالج Hexagon 685 DSP الخاص بمعالج Snapdragon 845 مع تزايد عدد الشركات المصنعة للمعدات الأصلية (OEM) التي تسعى إلى تحقيق حلول الذكاء الاصطناعي الخاصة بالهواتف المحمولة وعلى الأجهزة. هواوي كيرين 970 - النظام الموجود على الرقاقة داخل ماتي 10 و ميت 10 برو - يحتوي على "وحدة معالجة عصبية" (NPU) يمكنها التعرف على أكثر من 2000 صورة في الثانية بمعدل 1/50 فقط من استهلاك الطاقة لوحدة معالجة مركزية متوسطة للهاتف الذكي. ويحتوي نظام Apple A11 Bionic الموجود على الرقاقة في iPhone 8 وiPhone 8 Plus وiPhone X على "محرك عصبي" يقوم بنمذجة الوجه في الوقت الفعلي وما يصل إلى 600 مليار عملية في الثانية.

لكن شركة كوالكوم تقول إن عدم استقلالية منصة Hexagon يمنحها ميزة. على عكس Apple وHuawei، اللتين تجبران المطورين إلى حد كبير على استخدام واجهات برمجة التطبيقات الخاصة، سعت شركة Qualcomm إلى دعم بعض أطر العمل مفتوحة المصدر الأكثر شيوعًا منذ البداية. على سبيل المثال، عملت مع Google لتحسينها TensorFlow، منصة التعلم الآلي من Google، لجهاز Hexagon 685 DSP - تقول شركة Qualcomm إنها تعمل بشكل أسرع بما يصل إلى ثماني مرات وأكثر كفاءة في استخدام الطاقة بمقدار 25 مرة مقارنة بالأجهزة غير Hexagon.

المصدر: كوالكوم

في بنية DSP الخاصة بشركة Qualcomm، وGoogle إنشاء شبكة عصبية عميقة من GoogLeNet - خوارزمية التعلم الآلي المصممة لتقييم جودة أنظمة الكشف عن الأشياء وتصنيفها - أظهرت مكاسب في العرض التجريبي تطبيق واحد للتعرف على الصور يعمل بتقنية TensorFlow على هاتفين ذكيين: أحدهما يقوم بتشغيل التطبيق على وحدة المعالجة المركزية، والآخر يقوم بتشغيله على Qualcomm’s Hexagon DSP. التقط تطبيق الهاتف الذكي الذي يعمل بتقنية DSP المزيد من الصور في الثانية، وحدد الكائنات بشكل أسرع، وكان لديه ثقة أكبر في استنتاجه بشأن ماهية الكائن مقارنة بتطبيق وحدة المعالجة المركزية فقط.

تستخدم Google أيضًا Hexagon 685 DSP لتسريع مشروع Tango، منصة الواقع المعزز للهواتف الذكية. تستفيد أجهزة Phab 2 Pro من Lenovo، وZenFone AR من Asus، وغيرها من الأجهزة المزودة بوحدة IR لاستشعار العمق من Tango وكاميرات تتبع الصور من تقنية Qualcomm. بنية المعالجة غير المتجانسة، التي تقوم بتفويض مهام المعالجة بين Hexagon 685 DSP الخاص بمجموعة شرائح Snapdragon، ومحور المستشعر، وإشارة الصورة المعالج (مزود خدمة الإنترنت). والنتيجة هي "أقل من 10 بالمائة" من الحمل على وحدة المعالجة المركزية للنظام الموجود على الرقاقة، وفقًا لشركة كوالكوم.

وقال متحدث باسم شركة كوالكوم: "على حد علمنا، نحن الوحيدون في مجال الهواتف المحمولة الذين يقومون بتحسين الأداء وكفاءة الطاقة".

وبطبيعة الحال، يعمل المنافسون أيضًا على توسيع نطاق نفوذهم وتعزيز دعم المطورين على منصاتهم. تم إطلاق شريحة Kirin 970 العصبية مع دعم TensorFlow و كافيه (إطار عمل واجهة برمجة التطبيقات المفتوحة لفيسبوك) بالإضافة إلى واجهات برمجة تطبيقات كيرين من هواوي، مع TensorFlow لايت و كافيه2 التكامل على الطريق في وقت لاحق من هذا العام. وعملت Huawei مع Microsoft لتحسين مترجمها المدعوم بالذكاء الاصطناعي لجهاز Mate 10.

لكن لدى شركة كوالكوم ميزة أخرى: الوصول. استحوذت شركة تصنيع الرقائق على 42% من سوق شرائح الهواتف الذكية في النصف الأول من عام 2017، تليها Apple وMediaTek بنسبة 18% لكل منهما، وفقًا لشركة Strategy Analytics. ويكفي أن نقول، أنها لا تهتز في حذائها حتى الآن.

وتتوقع شركة كوالكوم أنها سوف تنمو فقط. تتوقع شركة صناعة الرقائق إيرادات بقيمة 160 مليار دولار بحلول عام 2025 باستخدام تقنيات برمجيات الذكاء الاصطناعي مثل رؤية الكمبيوتر، و يرى سوق الهواتف الذكية – الذي من المتوقع أن يصل إلى 8.6 مليار وحدة يتم شحنها بحلول عام 2021 – كأكبر سوق منصة.

مع Hexagon 685 DSP والتحسينات "الثالثية" الأخرى التي تشق طريقها باستمرار إلى النطاق المتوسط الأجهزة، فمن الأسهل أيضًا على شرائح Qualcomm توفير التعلم الآلي على الجهاز لجميع أنواع الأجهزة القريبة مستقبل. كما أنها توفر مجموعة أدوات تطوير البرامج (SDK) سهلة الاستخدام للمطورين (لا داعي للتلاعب بلغة تجميع DSP) للاستفادة من Hexagon 685 DSP وHVX في تطبيقاتهم وخدماتهم.

وقال متحدث باسم شركة كوالكوم: "هناك حاجة إلى وحدات المعالجة المخصصة هذه للمعالجة العصبية، ولكنك تحتاج أيضًا إلى توسيعها، حتى تتمكن من دعم أطر العمل [مفتوحة المصدر]". "إذا لم تقم بإنشاء هذا النظام البيئي، فلا توجد طريقة يمكن للمطورين من إنشاءه عليه."