يكشف مركز سامسونج للبحث والتطوير في أوستن عن تفاصيل البنية الدقيقة لوحدة المعالجة المركزية Exynos M6 التي لم يتم إصدارها

click fraud protection

أصدر مركز Samsung Austin للأبحاث والتطوير (SARC) ورقة بحثية توضح بالتفصيل البنية الدقيقة لنواة وحدة المعالجة المركزية المخصصة Exynos M6 الملغاة.

نحن نعلم أن المشروع الأساسي لوحدة المعالجة المركزية المخصصة في مركز الأبحاث والتطوير التابع لشركة سامسونج في أوستن (SARC) وصل الى نهايته في أكتوبر 2019. بالنسبة للمشروع الذي تم الترويج له بمثل هذه الضجة مع إطلاق Exynos M1 الذي يضم Exynos 8890 في عام 2016، كانت نهاية حزينة. لماذا قام الهلال الأحمر العربي السوري بطي المشروع؟ النواة المخصصة Exynos M5، الموجودة في إكسينوس 990 SoC، هو آخر نواة مخصصة بالكامل صممتها سامسونج في المستقبل المنظور، وبعد فوات الأوان، من السهل معرفة سبب تخلي سامسونج عن النوى المخصصة، لأنها ببساطة لم تكن قادرة على المنافسة بما فيه الكفاية. ومن المعروف الآن أن Exynos M5 هو النواة لديها عجز في كفاءة الطاقة بنسبة 100٪ ضد Cortex-A77 من ARM، والذي يقول الكثير. ومع ذلك، لم يكن من الضروري أن تسير الأمور على هذا النحو. أظهرت تصميمات Exynos M1 وExynos M2 بعض الأمل، وكان المشروع الأساسي لوحدة المعالجة المركزية المخصصة، في ذلك الوقت، يُنظر إليه على أنه مهم من أجل المنافسة في مساحة وحدة المعالجة المركزية المحمولة. كان Exynos M3 بمثابة تراجع كبير على الرغم من الزيادة الكبيرة في IPC، و

إكسينوس M4 وفشل Exynos M5 في مواكبة IP الخاص بوحدة المعالجة المركزية (CPU) الخاصة بشركة ARM. ما هي التغييرات المعمارية الدقيقة في النواة المخصصة التالية، Exynos M6 الملغاة؟

وحتى الآن، لم تكن الإجابة على هذا السؤال معروفة. الآن، على الرغم من ذلك، قدم فريق تطوير وحدة المعالجة المركزية في SARC ورقة بعنوان "تطور بنية وحدة المعالجة المركزية Samsung Exynos" (والتي تعرفنا عليها عبر أناند تك) في الندوة الدولية لهندسة الكمبيوتر (ISCA)، وهو مؤتمر IEEE. يكشف عن الكثير من التفاصيل حول وحدات المعالجة المركزية السابقة من سلسلة Exynos M بالإضافة إلى بنية Exynos M6 الملغاة.

توضح الورقة التي قدمها فريق تطوير وحدة المعالجة المركزية في SARC جهود الفريق على مدار ثماني سنوات من وجوده، وتكشف أيضًا عن التفاصيل الرئيسية لنوى ARM المخصصة بدءًا من Exynos M1 (Mongoose) إلى الجيل الحالي من Exynos M5 (Lion)، وحتى وحدة المعالجة المركزية Exynos M6 التي لم يتم إصدارها، والتي كان من المتوقع، قبل الإلغاء، أن تظهر في Exynos 990's 2021 SoC خليفة.

تم إنشاء فريق SARC CPU التابع لشركة Samsung في عام 2011 لتطوير نوى وحدة المعالجة المركزية المخصصة، والتي ظهرت بعد ذلك في أنظمة Samsung LSI Exynos SoCs. كانت أول شركة Exynos SoC تستخدم نواة مخصصة هي Exynos 8890، والتي ظهرت في هاتف Samsung Galaxy لعام 2016 س7. ظلت النوى المخصصة جزءًا من Exynos SoCs حتى Exynos 990 مع نوى Exynos M5، والتي ظهرت في متغيرات Samsung Galaxy S20 التي تعمل بنظام Exynos. (القادم إكسينوس 992، من المحتمل أن يتم عرضه في Galaxy Note 20، ومن المتوقع أن يتميز بـ ARM اللحاء-A78 وليس Exynos M5.) ومع ذلك، أكمل SARC بنية Exynos M6 قبل أن يتمكن فريق وحدة المعالجة المركزية من حصلت على أخبار عن حلها في أكتوبر 2019، مع دخول التفكيك حيز التنفيذ في ديسمبر.

تحتوي ورقة ISCA على جدول نظرة عامة على الاختلافات المعمارية الدقيقة بين نوى وحدة المعالجة المركزية المخصصة من سامسونج من Exynos M1 إلى Exynos M6. تم الكشف عن بعض الخصائص المعروفة للتصميم من قبل الشركة في الغوص العميق الأولي في بنية وحدة المعالجة المركزية M1 في حدث HotChips 2016. في HotChips 2018، قامت سامسونج بدراسة عميقة حول Exynos M3. تم أيضًا تفصيل بنية أنوية Exynos M4 وExynos M5، بالإضافة إلى بنية M6.

المصدر: الهلال الأحمر العربي السوري

أناند تك يلاحظ أن السمة الرئيسية الوحيدة لتصميمات سامسونج على مر السنين هي أنها كانت مبنية على نفس مخطط RTL الذي بدأ باستخدام نواة Exynos M1 Mongoose. واصلت سامسونج إجراء تحسينات على الكتل الوظيفية للنوى على مر السنين. يمثل Exynos M3 تغييرًا عن الإصدارات الأولى حيث قام بتوسيع النواة بشكل كبير في عدة جوانب، حيث انتقل من تصميم 4 عريض إلى 6 نواة متوسطة. (من ناحية أخرى، تتمتع أجهزة Apple A11 وA12 وA13 بعرض فك ترميز يبلغ 7 عرض، في حين أن عرض فك التشفير Cortex-A76 وA77 وA78 يبلغ 4 عرض. يعمل Cortex-X1 على زيادة عرض فك التشفير إلى 5 عرضًا.)

يقدم التقرير أيضًا بعض الإفصاحات التي لم تكن علنية من قبل فيما يتعلق بـ Exynos M5 و M6. بالنسبة إلى Exynos M5، أجرت سامسونج تغييرات أكبر على التسلسل الهرمي لذاكرة التخزين المؤقت للنوى، حيث استبدلت ذاكرة التخزين المؤقت L2 الخاصة بذاكرة تخزين مؤقت جديدة. ذاكرة تخزين مؤقت مشتركة أكبر بالإضافة إلى الكشف عن تغيير في هيكل L3 من تصميم 3 بنوك إلى تصميم 2 بنك بتكلفة أقل وقت الإستجابة.

كان من الممكن أن يمثل نواة M6 الملغاة قفزة أكبر من حيث البنية الدقيقة. قام SARC بإجراء تحسينات كبيرة مثل مضاعفة تعليمات L1 وذاكرة التخزين المؤقت للبيانات من 64 كيلو بايت إلى 128 كيلو بايت - أناند تك يشير إلى أن هذا هو خيار التصميم الذي تم تنفيذه فقط من خلال نوى سلسلة A من Apple حتى الآن، بدءًا من Apple A12.

تمت مضاعفة إمكانات النطاق الترددي L2 حتى 64 بايت/دورة، بينما كان L3 سيشهد زيادة من 3 ميجابايت إلى 4 ميجابايت. كان من الممكن أن يكون Exynos M6 عبارة عن نواة فك تشفير بعرض 8. كما أشار أناند تك، كان من الممكن أن يكون هذا هو أوسع معمارية تجارية دقيقة معروفة حاليًا من حيث فك التشفير. ومع ذلك، على الرغم من أن النواة كانت أوسع بكثير، إلا أن وحدات تنفيذ الأعداد الصحيحة لم تشهد الكثير من التغيير. أضاف أحد خطوط الأنابيب المعقدة إمكانية تقسيم عدد صحيح ثاني، بينما ظلت خطوط أنابيب التحميل/التخزين كما هي في M5 بوحدة تحميل واحدة، ووحدة تخزين واحدة، ووحدة تحميل/تخزين واحدة. ستشهد خطوط أنابيب الفاصلة العائمة/SIMD وحدة رابعة إضافية بقدرات FMAC. تمت زيادة L1 DTLB من 48 صفحة إلى 128 صفحة، وتمت مضاعفة TLB الرئيسي من 4K صفحة إلى 8K صفحة (تغطية 32 ميجابايت).

كان من الممكن أن يمثل Exynos M6 تغييرًا مهمًا آخر عن سابقاته من خلال زيادة نافذة الخروج عن الترتيب للنواة منذ المرة الأولى منذ M3. كان من الممكن أن يكون هناك عدد صحيح أكبر وملفات تسجيل فيزيائية ذات فاصلة عائمة، وكان من الممكن أن يزيد ROB (مخزن إعادة الطلب) من 228 إلى 256. أناند تك يشير إلى أن أحد نقاط الضعف المهمة في نوى Exynos المخصصة لا يزال موجودًا في M5 وكان من الممكن أن يكون موجودًا في M6 أيضًا. ستكون مراحل خط الأنابيب الأعمق هي التي قد تؤدي إلى عقوبة باهظة الثمن لخطأ التنبؤ لمدة 16 دورة، والتي كانت أعلى من نوى وحدة المعالجة المركزية الخاصة بـ ARM التي لديها عقوبة خطأ في التنبؤ لمدة 11 دورة. تتعمق ورقة SARC بشكل أكبر في تصميم توقع الفرع، حيث تعرض التصميم القائم على Scaled Hashed Perceptron لوحدة المعالجة المركزية. كان من المفترض أن يتحسن هذا التصميم بشكل مستمر على مر السنين وعمليات التنفيذ، مما يؤدي إلى تحسين دقة الفرع وتقليل التنبؤات الخاطئة لكل كيلو تعليمات (MPKI) بشكل مستمر. يقدم SARC جدولاً يوضح مقدار هياكل التخزين التي يشغلها المتنبئ الفرعي داخل الواجهة الأمامية. تم أيضًا تفصيل تقنيات الجلب المسبق للنواة في الورقة، والتي تغطي مقدمة ذاكرة التخزين المؤقت μOP في M5، بالإضافة إلى جهود الفريق في تقوية النواة ضد الثغرات الأمنية مثل شبح.

تم أيضًا تفصيل الجهود المبذولة لتحسين زمن وصول الذاكرة في نوى Exynos المخصصة بواسطة SARC في الورقة. في Exynos M4، قام فريق SARC بتضمين آلية تعاقبية للحمل والحمل أدت إلى تقليل زمن الوصول الفعال لدورة L1 من أربع دورات إلى ثلاث في الأحمال اللاحقة. قدم نواة M4 أيضًا مسارًا جانبيًا بواجهة جديدة من مراكز وحدة المعالجة المركزية مباشرةً إلى وحدات التحكم في الذاكرة، مما أدى إلى تجنب حركة المرور عبر الاتصال البيني. وفق أناند تك، يوضح هذا بعض التحسينات الأكبر في زمن الوصول التي تمكن المنشور من قياسها باستخدام Exynos 9820. قدم Exynos M5 تجاوزًا للبحث في ذاكرة التخزين المؤقت، والذي أصدر طلبًا لكل من علامات الاتصال البيني وذاكرة التخزين المؤقت في وقت واحد. من المحتمل أن يؤدي هذا إلى توفير زمن الوصول في حالة فقدان ذاكرة التخزين المؤقت أثناء تنفيذ طلب الذاكرة. كما تم أيضًا تحسين متوسط ​​زمن وصول الحمل بشكل مستمر على مدار الأجيال من 14.9 دورة على M1 إلى 8.3 دورة على M6.

على الرغم من أن الخصائص المعمارية الدقيقة المذكورة أعلاه تعتبر تقنية تمامًا، إلا أن عشاق وحدة المعالجة المركزية سيكونون على دراية بمصطلح Instructions Per Clock (IPC)، والذي يعني لكل ميجا هرتز الأداء في أداء وحدة المعالجة المركزية ذات الخيط الواحد (إنه العامل الرئيسي الأساسي الذي يحدد أداء وحدة المعالجة المركزية ذات الخيط الواحد، مع العامل الآخر وهو سرعة الساعة لـ جوهر). يعد كل من IPC الصحيح وIPC الفاصلة العائمة من محددات IPC. تمكن فريق الهلال الأحمر العربي السوري من الحصول على تحسينات سنوية بمعدل 20% من M1 إلى M6. يمثل M3، على وجه الخصوص، نسبة تحسن كبيرة في IPC، على الرغم من أن عوامل أخرى خذلته. يمثل Exynos M5 تحسنًا بنسبة 15-17٪ في IPC، في حين يمثل تحسين IPC لـ Exynos M6 الذي لم يتم إصداره تم الكشف عن أن متوسطه 2.71 مقابل 1.06 لـ M1، وهو ما يمثل تحسنًا بنسبة 20٪ مقارنة بـ M1. م5.

وقد أجاب بريان جرايسون، مقدم الصحيفة، على الأسئلة المتعلقة بإلغاء البرنامج خلال جلسة الأسئلة والأجوبة. وقال إن الفريق كان دائمًا ملتزمًا بالهدف وفي الموعد المحدد مع تحسين الأداء والكفاءة مع كل جيل. (هل هذا يعني أن الأهداف لم تكن عالية بما فيه الكفاية في المقام الأول؟). من ناحية أخرى، كانت الصعوبة الأكبر التي واجهها الفريق هي توخي الحذر الشديد فيما يتعلق بالمستقبل يتغير التصميم حيث لم يكن لدى الفريق الموارد اللازمة للبدء من الصفر أو لإعادة كتابة المشروع بالكامل حاجز. بعد فوات الأوان، كان الفريق قد قام باختيارات مختلفة في الماضي مع بعض اتجاهات التصميم. في تناقض صارخ، تمتلك ARM فرقًا متعددة لوحدة المعالجة المركزية تعمل في مواقع مختلفة وتتنافس بالفعل مع بعضها البعض. يسمح هذا بـ "إعادة التصميمات الشاملة" مثل اللحاء-A76. ال اللحاء-A77 و Cortex-A78 هم الخلفاء المباشرون لـ A76.

كان لدى فريق SARC أفكار لتحسين النوى القادمة مثل Exynos M7 الافتراضي. ومع ذلك، فمن المفترض أن شخصًا رفيع المستوى في سامسونج هو الذي قرر إلغاء البرنامج الأساسي المخصص. مثل أناند تك يلاحظ أن النوى المخصصة لم تكن تنافسية من حيث كفاءة الطاقة والأداء واستخدام المنطقة (PPA) مقارنة بوحدات المعالجة المركزية الخاصة بـ ARM من أي جيل معين. في الشهر الماضي، أعلنت شركة ARM عن برنامج Cortex-X Custom الذي يضم الإصدار الجديد اللحاء-X1، نواة الجيل التالي المخصصة للأجهزة المحمولة لعام 2021. لديها فلسفة تصميمية تتمثل في كسر غلاف Cortex-A PPA والسعي للحصول على الأداء المطلق بدلاً من ذلك. لذلك، كان Exynos M6 يواجه صعوبة في التنافس معه. ومع ذلك، يبدو أن سامسونج لن تقوم بتكييف Cortex-X1 وستستخدم فقط مجموعة Cortex-A78 + Cortex-A55 في Exynos 992 - وقد يتم اعتمادها في هاتف Galaxy S الرائد العام المقبل.

لا يزال فريق SARC يقوم حاليًا بتصميم وصلات بينية مخصصة ووحدات تحكم في الذاكرة لأنظمة Samsung Systems LSI. وكانت تعمل أيضًا على بنيات GPU المخصصة، ولكن Samsung Systems LSI وقعت صفقة مع AMD لاستخدام الجيل التالي من AMD (بنية الرسومات التالية) RDNA GPU في وحدات معالجة الرسومات Exynos المستقبلية، بدءًا من عام 2021.

بشكل عام، كان المشروع الأساسي المخصص لوحدة المعالجة المركزية بمثابة درس مفيد لموردي شرائح الأجهزة المحمولة حول الأخطاء التي يمكن أن تحدث. كان لدى فريق وحدة المعالجة المركزية (SARC) طموحات عالية للتنافس مع شركة Apple، وهي الشركة الرائدة بلا منازع في مجال وحدة المعالجة المركزية المحمولة. لسوء الحظ، فشلت في منافسة ARM، ناهيك عن Apple. كان من الممكن حل هذه المشكلات، ولكن سنة بعد سنة، كانت جهود الهلال الأحمر العربي السوري متأخرة خطوة أو خطوتين لقد انعكس ذلك سلبًا في شحن المنتجات مثل متغيرات Exynos 9810 لجهاز Samsung Galaxy S9. الآن، سيستخدم جميع بائعي شرائح الهواتف المحمولة الرئيسيين الذين يعملون بنظام Android عنوان IP الخاص بوحدة المعالجة المركزية الخاصة بشركة ARM اعتبارًا من عام 2021، وتشمل هذه القائمة Qualcomm وSamsung وMediaTek وHiSilicon. سيتم نقل المعركة إلى شركة Apple باستخدام أنوية مثل Cortex-X1، وليس أنوية ARM مخصصة مصممة من الصفر.


مصدر: تطور بنية وحدة المعالجة المركزية Samsung Exynos | عبر: أناند تك