ARM מכריזה על Cortex-A78 CPU, Mali-G78 GPU, Ethos N78 NPU

click fraud protection

ARM הכריזה על ארכיטקטורת המעבד Cortex-A78 וכן על ה-GPU Mali-G78. השניים הם ממשיכי דרכו של המעבד Cortex-A77 וה-GPU Mali-G77.

כחלק מה-TechDay 2020 שלה, ARM פרסמה שלוש הכרזות מרכזיות. ההכרזה העיקרית היא תוכנית Cortex-X Custom (CXC), המכילה את החדש ליבת מעבד Cortex-X1. ה-Cortex-X1 מביא לביצועי שיא גבוהים יותר מכל מעבד מסדרת Cortex-A, תוך שבירת המעטפת של ה-PPA של סדרת Cortex-A. שתי ההכרזות האחרות ש-ARM פרסמה היו הרבה יותר שגרתיות. מעבד Cortex-A78 ומעבד Mali-G78 הם כעת רשמיים, והם פועלים כיורשים של קורטקס-A77 המעבד וה- Mali-G77 מעבד בהתאמה. בואו נסקור את ההכרזות האלה אחת אחת:

ARM Cortex-A78

עם ה-Cortex-A78, המיקוד המרכזי של ARM היה בדרישות יעילות, כגון דרישות לחיי סוללה ארוכים יותר, גורמי צורה ניידים חדשים וכיווץ אזורי SoC. ביצועים מתמשכים הם מילת המפתח כאן עבור ה-Cortex-A78, בעוד ה-Cortex-X1 זוכה לכוכבים במטרה להשיג ביצועי שיא מקסימליים לטווח קצר.

ARM אומר שה-Cortex-78 מייצג את ה"טוב ביותר" של הכונן שלו לביצועים מתקדמים ביעילות הטובה מסוגה. גם אלו לא רק מילים ריקות. בשנתיים האחרונות, ה-Cortex-A76 וה-Cortex-A77 הראו את היעילות האנרגטית הטובה מסוגה ו-PPA (ביצועים, הספק ושטח) הטובים מסוגו. לא היה להם את העיצוב הנדרש כדי להתחרות עם השבבים מסדרת A של אפל, אלא בגלל נמוך יותר כוח שנוצר, יעילות האנרגיה שלהם הייתה במקרה הרע זהה לאפל ובמקרה הטוב אפילו גבוהה מזו תפוח עץ.

שיפורי הביצועים של ה-A78 מכסים את מקרי השימוש של פרודוקטיביות, תקשורת, אבטחה ומשימות מבוססות מצלמה, משחקים מתקדמים, XR וחוויות מבוססות ML.

בביצועים מתמשכים, ה-Cortex-A78 מביאה שיפורים דו ספרתיים. הוא מספק שיפור של 20% בביצועים מתמשכים לעומת קודמו, ה-Cortex-A77, באותה מעטפת כוח תרמית ניידת. אננדטק עבר על המספרים והסביר שהנתון של 20% הוא שילוב של IPC גבוה ב-7% לעומת A77, בעוד רווחי הביצועים הנותרים של 13% נזקפים לתהליך ה-5nm, שבו יהיו כל ה-SoCs הדור הבא מזויף. ARM מציינת את החשיבות של ביצועים מתמשכים באומרה שלמכשירים ניידים יש יכולת מוגבלת לפזר כוח, וביצועים מתמשכים מונעים מצערת כוח עבור יישומים הדורשים הרבה כּוֹחַ. זה, בתורו, משפר את ה-UX על ידי הימנעות מפיגור או נפילות פריימים.

הדחיפה על יעילות החשמל מתורגמת ליעילות אנרגטית גבוהה יותר, שכן השניים קשורים, אך מושגים שונים. לפי ARM, בנקודות ביצועים גבוהות, כמו אלו שהן השיא עבור מכשירים ניידים נוכחיים, ה-Cortex-A78 מציע חיסכון באנרגיה של 50% בהשוואה למכשירים ב-2019 באותה הופעה כמו Cortex-A77. זה מרשים וזה הופך את ה-A78 ליעיל ביותר באנרגיה של Cortex-A CPU ARM שתוכנן אי פעם.

ההתמקדות של ARM בביצועים מתמשכים תועיל לגל הבא של חדשנות סלולרית כמו גורמי צורה חדשים (טלפונים מתקפלים) כמו גם "טבילה דיגיטלית" משופרת באמצעות 5G. בדיקת המציאות היא שזה לא המקרה של הדור הנוכחי, וזה לא ישפיע הרבה גם בדור הבא.

מקרה שימוש אחד שישופר על ידי ה-Cortex-A78 הוא משחק נייד AAA, בשילוב עם ה-GPU החדש Mali-G78 של ARM. השילוב בין השניים נועד להביא חוויות משחק בנאמנות גבוהה למובייל. הביצועים הגדולים יותר שלהם, בשילוב עם המהירות המהירה של ה-5G ורוחב הפס הגבוה, יאפשרו משחקי פרימיום בנייד. ליעילות של ה-A78 יש יתרון כאן, שכן הוא יספק חיי סוללה ארוכים יותר לגיימינג ממושך. ARM אומרת שהיא גם עובדת עם המערכת האקולוגית כדי לשפר עוד יותר את הביצועים ולבנות חוויות משחק עשירות יותר, ונותנת דוגמה לעבודתה עם Unity כדי להביא את Burst Compiler לאנדרואיד.

ביצועי למידת מכונה (ML) הם עדיפות נוספת עבור ARM. ה-CPU הוא מעבד הבחירה הראשון עבור מחשוב ML בנייד, אם כי בימים אלה SoCs מתקדמים מגיעים עם יחידות עיבוד עצביות נפרדות (NPUs). המעבדים של ARM תומכים ביישומי ML הפופולריים ביותר בעולם האמיתי ומקרי שימוש בסמארטפונים, כגון מסנני מדיה חברתית, הכתבה, אבטחה ואבטחה. ה-Cortex-A78 משתמש ב-8% פחות כוח בממוצע עבור משימות מבוססות ML בהשוואה ל-A77, מה שמוביל לשיפורי יעילות רשמיים של 10%.

ARM Cortex-A78 - ארכיטקטורה

ל-ARM Cortex-A78 יש את אותה ארכיטקטורה כמו הדור הקודם (זו עדיין ליבת ARM v8.2). עם זאת, ARM הוסיפה תכונות מיקרו-ארכיטקטוניות שמטרתן לדחוף את הביצועים גבוה יותר בשטח ובצורה חסכונית. ARM חוסך שטח וכוח תוך שמירה על רמות הביצועים הדרושות. שוב, ההתמקדות של ARM בסדרת Cortex-A נשארת ביעילות השטח וההספק במקום בביצועים שיא, שהיא כעת עבודה שנלקחה על ידי תוכנית Cortex-X.

שיפורי הביצועים של ה-Cortex-A78 מתאפשרים באמצעות תכונות מיקרו-ארכיטקטוניות נוספות הממטבות רוחב ועומק. רוחב פענוח ההוראות נשאר ברוחב 4, זהה ל-A77 וה-A76. (רוחב הפענוח של ה-Cortex-X1, לעומת זאת, הוא ברוחב של 5, בעוד של-A13 יש רוחב של 7 לפענוח.) ARM הוסיפה חיזוי ענפים גדולים יותר עבור רוחב פס ודיוק, כמו גם מקרי היתוך הוראות. שיפורים ארכיטקטוניים אלו מאפשרים עלייה של 7% בביצועי חוט בודד בהשוואה ל-A77.

היעילות הוגדלה באמצעות צמצום מבנים בעלי ביצועים ושטח נמוכים, כגון במטמונים L1-I ו-L1-D. ARM עשתה אופטימיזציה של מבנים קיימים כדי לצרוך פחות חשמל, כמו מבני חיזוי המותג. ARM אומר שזה מוביל ל-4% פחות הספק לביצועים לכל mW ו-5% פחות שטח לביצועים למ"מ בהשוואה ל-A77.

ה-A78 שומר על הפוקוס על ביצועים מתמשכים ביעילות הטובה מסוגה ברמת האשכול. ניתן לשדרג אשכול DynamIQ של 4x Cortex-A77 ו-4x Cortex-A55 ל-4x A78 ליבות ו-4x A55. זה מספק 20% שיפורי ביצועים מתמשכים ב-15% פחות שטח. יישומים הדורשים מספר שרשורים בעלי ביצועים גבוהים במקביל, כגון גיימינג בנאמנות גבוהה, ייהנו מהדחיפה המתמשכת של הביצועים.

ARM מציינת את יעילות השטח המשופרת של אשכול A78 DynamIQ הופכת אותו לאידיאלי עבור טלפונים מתקפלים וצגים מרובים וגדולים יותר. התמקדות נוספת היא בהכנת הסמארטפונים ל-5G באמצעות שיפורי ביצועים ואנרגיה. 5G מספק כביכול "מהירויות מהירות הרבה יותר", "שהייה נמוכה בהרבה" ו"קישוריות הרבה יותר מהירה ונמצאת בכל מקום עבור מכשירים ניידים עבור יישומים ברוחב פס גבוה". זה עשוי להיות המקרה בעוד כמה שנים מהיום, אבל נכון לעכשיו, רוב היתרונות הללו אינם מורגשים עבור צרכני הקצה.

בסך הכל, ה-Cortex-A78 הוא מוצר מוצק. מכשירי הדגל של הדור הבא ישלבו מספר ליבות A78 כדי להשלים את הליבה הבודדת Cortex-X1 בעל דרישות הספק ושטח גבוהות יותר, וחלק מה-SoCs בעלי ערך גבוהות אפילו יבחרו לדלג על ה-Cortex-X1 לַחֲלוּטִין. עבור שוק ה-SoC הבינוני, ה-A78 תהיה ליבת ה-CPU המועדפת עבור 2021 SoCs, וההתמקדות שלו בביצועים מתמשכים מבורכת.


ARM Mali-G78

סדרת ה-GPU של Mali של ARM לא הצליחה כמעט כמו סדרת המעבדים שלה Cortex, בלשון המעטה. מעבדי ה-GPU של Mali זכו לביצועים גבוהים באופן עקבי הן מבחינת ביצועים והן מבחינת יעילות צריכת החשמל על ידי ה-GPUs המותאמים אישית של אפל וה-GPUs המותאמים אישית Adreno של קוואלקום, שנה אחר שנה. ההשקה בשנה שעברה של ארכיטקטורת Valhall החדשה ו- Mali-G77 GPU לא שינתה דבר, למרבה הצער. SoCs הכוללים את Mali-G77 כללו את Exynos 990 וה MediaTek Dimensity 1000L בהתאמה. לשניהם, למרבה הצער, נראה כי יש יישומים חלשים שמשמעו שביצועי ה-GPU שלהם יכולים אל תתחרה ב-Adreno 650 GPU של קוואלקום, אל תחשוב על ה-GPU המובילים בכיתה של אפל ב-Apple A12 ו A13. מאלי נשארה מאחור במשך שנים, והשיפורים שלה לא הספיקו כדי לשנות את הסטטוס קוו במרחב ה-GPU הנייד.

עם זאת, ARM אינו דבר אם לא אופטימי. היא מציינת כי השותפים שלה שלחו יותר ממיליארד מעבדי Mali GPU מדי שנה, מה שהופך את מאלי ל-GPU מספר אחת בעולם. המספר הזה רק יגדל, כביכול, מכיוון שהרבה יותר סוגים שונים של מכשירים מאפשרים מקרי שימוש עתירי גרפיקה כמו משחקי סלולר מתקדמים ו-XR (VR ו-AR). לפי ARM, זה הופך את מאלי ל-GPU הנפוץ ביותר לפיתוח נייד ברחבי המערכת האקולוגית.

ARM מציינת כי בשנת 2019 היא הכריזה על ה-GPU הראשון שלה המבוסס על ארכיטקטורת Valhall - Mali-G77. בשנת 2020, ה-G77 ירש את ה-Mali-G78, המבוסס גם הוא על ארכיטקטורת Valhall. בעוד ש-ARM אומר שזהו ה-GPU הביצועי ביותר עבור מכשירי סלולר מובחרים עד כה, המספרים אינם מגבים אותו למרות מה ש-ARM אומר באופן אירוני על כך שזו עובדה הנתמכת על ידי המספרים. ה-G78 מביא לשיפור של 25% בביצועים לעומת ה-G77, שהוא דל, בלשון המעטה. הפער בביצועי GPU שיא בין ה-G77 ל-GPU של Apple A13 היה משמעותי, מה שאומר שה-G78 לא יוכל להדביק את ה-A13, לא משנה ה-GPU הקרוב של Apple A14. קוואלקום גם תמשיך להישאר צעד אחד קדימה בגלל שיפורי הביצועים המצטברים שלה.

גרפיקה משנה משחק ומשחקים כל היום בנייד כבר אפשריים ב-GPUs אחרים, כך שהשיווק של ARM כאן מצלצל מעט חלול.

ה-Mali-G78 נבנה מתוך מחשבה על מפתחים ומשתמש הקצה, על פי ARM. זה מאפשר חוויות משחק ניידות באיכות גבוהה עם משחקי קונסולות הזמינים כעת בנייד. ה-G78 מביא חיי סוללה ארוכים יותר למכשירים ניידים פרימיום. זה גם מביא לשיפור נוסף בביצועי ML עבור תכונות ML מורכבות יותר של משחקים, וידאו, מצלמה, אבטחה במכשירים ניידים.

ARM שורית לגבי הסיכוי למשחקים ניידים. המשחקים הניידים היוו יותר מ-46% משוק המשחקים העולמי ב-2019, והגיעו להכנסות של 68.2 מיליארד דולר. זה גם אמור להמשיך לצמוח במהלך השנים הקרובות מכיוון שהוא יעלה על משחקי המחשב האישי והקונסולות. יותר כותרי גיימינג פרימיום מגיעים למובייל והמשתמשים מצפים לחוויה דומה בנייד בהשוואה לקונסולות.

כדי לאפשר את החוויות הללו, Mali-G78 מגיע עם חיזוק הביצועים הנדרש. יש לו שיפור בצפיפות ביצועים של 15% עבור תוכן משחקים בהשוואה ל-G77. עבור אותה כמות שטח כמו הדור הקודם, ה-G78 יספק יותר ביצועים. חיזוק זה מתאפשר בזכות ארבע תכונות עיקריות:

  • תמיכה בעד 24 ליבות
  • רמה עליונה אסינכרונית
  • שיפורים לריצוף
  • מעקב משופר של תלות בקטעים

בעוד שספירת הליבות המקסימלית של ה-G77 הייתה 16, ARM הגדילה את ספירת הליבות המקסימלית ב-G78 למקסימום של 24 ליבות. כמובן, רק בגלל שיש מקסימום לא אומר שספקי שבבים ניידים למעשה ישלבו 24 ליבות. גרסת הליבה הרחבה ביותר של ה-G77 שראינו עד כה היא Mali-G77MP11 ב-Exynos 990, בעוד של-Dimensity 1000 יש Mali-G77MC9.

ARM מאמינה ש-Asynchronous Top Level היא תכונה משנה משחק עבור ביצועי GPU. זה אמור לסחוט כמה שיותר ביצועים ממשחקים ניידים, מה שמבטיח ביצועים מקסימליים.

לעומת זאת, שיפורים ב-Tier מוסיפים שכבה נוספת של איכות למשחקים ניידים. למשחקים שהובאו מהמחשב והקונסולה יש לרוב נכסים מסובכים במיוחד וסצנות מתוחכמות, שגורמים לנקודות תקיעה וצווארי בקבוק בביצועים. שיפורי ריצוף מפחיתים את עומס הקודקוד על ה-GPU עבור סצנות ונכסים מורכבים אלה. זה משפר את הביצועים עבור תוכן משחקים מורכב דמוי קונסולה.

ARM גם שיפרה את מעקב התלות בקטעים ב-G78. זה משפיע במיוחד על משחקים ניידים עם סצנות משחק מורכבות הכוללות עשן, עצים ודשא. התוצאות הן ש-ARM ראתה שיפורי ביצועים של עד 17% במשחקי הנייד המובילים בהשוואה ל-G77.

ל-Mali-G78 יעילות אנרגטית טובה יותר ב-10% מקודמו. שוב, זה לא יספיק כדי להתעדכן לא עם קוואלקום ולא עם אפל. המטרות של ARM כאן נראות שמרניות במיוחד. התכונה Asynchronous Top Level ממלאת תפקיד חשוב ביעילות אנרגטית, מכיוון שהיא מאפשרת הפחתה בהספק, ובכך מאפשרת להפיק תוכן באופן בר קיימא. לכן, כאשר מכשיר מוציא תוכן בקצב הפריימים הרצוי, הוא יכול להוריד את השעון כדי לחסוך באנרגיה. הגדלת הרמה העליונה עבור משימה זו משתמשת במעט יותר אנרגיה, אך החיסכון באנרגיה מהפחתת התדירות של ליבות ההצללה גבוה בהרבה. הסיבה לכך היא שליבות הצללה משתמשות ב-90-95% מתקציב האנרגיה של ה-GPU.

יעילות אנרגטית טובה יותר ב-G78 מושגת גם הודות ל-Fused multiply-add (FMA). זה עוצב מחדש לחלוטין מהיסוד, מה שהוביל להפחתת אנרגיה של 30% ליחידה. יחידת ה-FMA אחראית לרוב החישובים המתרחשים בתוך GPU, וזו הסיבה שהיה הגיוני ש-ARM יכוון אותה להפחתת אנרגיה.

יכולת עיבוד הנתונים המקבילית של GPU הופכת אותו למתאים להפעלת עומסי עבודה של ML, אם כי ARM מכירה בכך ש-CPU ו-GPU נשארים המעבדים העיקריים עבור ML. ככל שמקרי השימוש נעשים מורכבים יותר, עומסי עבודה מסוימים יועברו ל-GPU. מקרי השימוש העיקריים ב-ML עבור ה-GPU מקושרים לתכונות אבטחה במכשיר, מצבי מצלמה ווידאו שונים וכן לאפליקציות עם תכונות AR.

התפקיד של ML ב-GPU מאפשר חוויות כגון מעקב אחר פנים בתוך מסגרת התמונה או הווידאו, משחקים המשתמשים בתכונות AR ועוד. עבור משימות מבוססות ML אלו, ה-Mali-G78 כולל שיפור ביצועים ממוצע של 15% עבור עומסי עבודה שונים של ML בהשוואה ל-G77. ה-G77 הביא שיפור של 60% בביצועי ML לעומת דורות קודמים, כך שהשיפור משנה לשנה השנה קטן בהרבה. רמה עליונה אסינכרונית חיונית בהגברת ביצועי ה-ML, שכן שעון ליבות הצללה עוזר עם מקרי השימוש השונים ב-ML ב-GPU.

ואז, יש את ההכרזה על Mali-G68. זה אינו אלא גרסה צרה יותר של Mali-G78, בדיוק כפי שה-Mali-G57 היה גרסה צרה יותר של Mali-G77. ARM אומר שזהו ה-Sub-Premium GPU Mali הראשון עבור מכשירי 2021. יש לו את כל התכונות של ה-G78 כמו שיפורי ריצוף ויחידת ה-FMA החדשה במנוע הביצוע אך תומך בעד 6 ליבות במקום 24. ביצועים כמעט פרימיום בעלות נמוכה יותר היא המטרה של GPU זה.

ARM פיתחה את שכבת ה-GPU התת-פרימיום הזו לאחר שהקשיבה למשוב משותפים שרצו תכונות פרימיום בכל תיק המכשירים שלהם. ל-G68 שטח סיליקון נמוך יותר, כצפוי, ומביא גיימינג עם ביצועים גבוהים לקהל רחב יותר של מפתחים וצרכנים.

לבסוף, ARM מזכירה את שותפויות המפתחים שלה. זה מקל על מפתחים לייעל את התוכן שלהם כך שיפעל טוב יותר ב-Mali GPUs (בתיאוריה). דוגמה אחת היא יועץ הביצועים. שנית הוא שיתוף הפעולה של ARM עם Unity כדי להביא את Burst Compiler. פרטים על כך ניתן לקרוא במאמר המקור.

Mali-G78 - אאוטלוק

התחזית עבור Mali-G78 עגומה. נראה כאילו ARM פשוט לא מעוניינת לבצע שיפורים משמעותיים בביצועים משנה לשנה באותה תבנית שאפל מייצרת, באותה תבנית שקוואלקום יצרה בעבר. בעוד שקצב השיפור של קוואלקום הואט גם הוא, קו הבסיס שלה נמצא במקום גבוה יותר מ-ARM. זה נראה רע עבור המערכת האקולוגית של אנדרואיד כאשר סוקרים מצהירים עם ראיות מספריות שהביצועים המתמשכים של ה-GPU של ה-A13 גבוהים מהביצועים השיא של Snapdragon 865. דלתא הביצועים בין אפל לאנדרואיד GPU הולכת וגדלה, והיא רק הולכת וגדלה.

ה-G78, אם כן, אינו פתרון קסם לפתרון בעיות Mali GPU של ARM ולהביא אותן לראש טבלאות הביצועים. הוא עדיין ידורג מתחת למעבדי ה-GPU של אפל וקוואלקום. זו תהיה בחירת ברירת המחדל עבור חלק מה-SoCs רק בגלל שזהו ה-GPU IP המניות של ARM, ולפתרונות מותאמים אישית יש חסמי כניסה ועלות יותר נו.

בשנה הבאה, ספק אם Samsung Systems LSI אכן תשתמש ב-Mali-G78. סמסונג הייתה לקוחה ידועה של מעבדי Mali GPU, אבל בשנה שעברה, היא חתמה על שותפות עם AMD כדי להביא את ארכיטקטורת ה-RDNA GPU ל-SoC הנייד שלה בשנת 2021. אם מפת הדרכים הזו תישאר על המסלול - ובשלב זה אין לנו סיבה לחשוד שהיא לא על המסלול - אז היורש של ה-Exynos 990 יכלול AMD RDNA GPU במקום Mali GPU. זה אכן יהיה הפסד עיצובי גדול עבור ARM. אפילו לספקים אחרים כמו MediaTek יש יותר אפשרויות בימים אלה. החדש של Imagination Technologies ארכיטקטורת GPU מסדרת A יש יעד עיצובי לביצועים גבוהים יותר מה-G78, וייתכן ש-MediaTek מתרחק ממאלי בעתיד. לקוואלקום, כמובן, אין סיבה לנטוש את מאמצי ה-Adreno GPU שלה, שעדיין נותרו הטובים ביותר במונחים של ביצועים ויעילות כאשר מדברים אך ורק על אנדרואיד שוק הסמארטפונים.

לפיכך, ברור ש-ARM תצטרך להגדיל את קצב השיפורים השנתי במעבדי Mali GPU כדי לעשות הבדל אמיתי בשוק ה-GPU הנייד. אם הוא לא יכול לעשות זאת, הוא עומד בפני הסיכון שיהפוך למחשבה שלאחר מכן בחלל הדגל של ה-GPU הנייד המובחר.


ARM Ethos N78

לבסוף, ARM הכריזה גם על יחידת העיבוד העצבית Ethos N78 (NPU). זה היורש של N77 NPU. הוא מספק יכולות ML גדולות יותר במכשיר ועד 25% יותר יעילות ביצועים. יכולת התצורה היא גם נקודת חוזק שכן תצורות זמינות נעות בין 1 TOP/s לעד 10 TOP/s. לפרטים נוספים, בדוק פוסט הבלוג של ARM. ל-NPU הזה כנראה יהיו זכיות עיצוב מוגבלות שכן לקוואלקום, סמסונג, HiSilicon ו-MediaTek יש לכולן יחידות עיבוד עצביות/מנועי AI משלהן.


מקורות: ARM (1, 2), אננדטק (1, 2)