כיצד קוואלקום שיפרה את הביצועים, המשחקים וה-AI ב-Snapdragon 855

click fraud protection

הפלטפורמה החדשה של Qualcomm Snapdragon 855 מביאה שיפורים גדולים במונחים של ביצועים, משחקים ובינה מלאכותית, ואנחנו מפרקים איך הם עשו זאת.

בפסגת Snapdragon של קוואלקום 2018, החברה הכריזו על ערכת השבבים החדשה ביותר בדרגת הפרימיום, ספינת הדגל: פלטפורמת Snapdragon 855. המוצר החדש הזה יהיה בלב רוב ספינות הדגל הפוריות של 2019, ויביא איתו את ההבטחה למהירויות נתונים מדהימות דרך מודם Snapdragon X50. עם זאת, מעבר לכך, ה-Snapdragon 855 מביא שלל שיפורים לכל בלוק מערכת על שבב, עם חלק מיחידות המחשוב רואות את הביצועים הגדולים ביותר משנה לשנה ושיפורי צריכת החשמל לאחרונה הִיסטוֹרִיָה.

כבר פירטנו את ספקטרה 380 ISP-CV, למשל, מה שמשפר עוד יותר את הצילום בסמארטפון ובמקביל נותן למשתמשים חיסכון בריא בסוללה. אמנם אנחנו שמים לב יותר ויותר לרכיבים היקפיים כמו Hexagon DSP, בלוקים הליבה שחובבים משלמים הכי הרבה תשומת לב - כלומר, המעבד וה-GPU - ראו גם רווחים צנועים יותר עם שיפורים ארכיטקטוניים והמעבר לתהליך חדש צוֹמֶת. במאמר זה, נסכם במהירות מה חדש ומה ידוע על המעבד, ה-GPU וה-DSP של Snapdragon 855, וכיצד השיפורים והתכונות החדשות יכולים להשפיע שֶׁלְךָ חווית משתמש ב-2019.


מעבד Kryo 485 מבוסס A76 והמעבר ל-7 ננומטר

ה-Snapdragon 855 עובר לתהליך הייצור האחרון של 7nm FinFET של TSMC. בדרך כלל אנו רואים עדכון צומת כל שנה או שנתיים, עם הקטנות או אופטימיזציות באמצע המחזור (כגון המעבר מ-"Low-Power Early" (LPE) ל-"Low-Power Plus" (LPP) בצמתי Samsung-LSI), כך שסביר להניח ששמעת על מדדים אלה בחדשות כאלה או אחרות מאמר. אבל מה זה אומר? בהקשר זה, הוא מתאר את גודל המאפיינים של הטרנזיסטור של המעבד, אשר בתורם מרמזים לנו על איזה סוג של שיפורי צפיפות טרנזיסטורים אנו יכולים לצפות בכל דור חדש. עם יותר טרנזיסטורים ליחידת שטח, ניתן להגדיל את הביצועים המתקבלים של המעבד. תכונה זו חשובה גם מכיוון שצמתי תהליך קטנים יותר מאפשרים ליישם עיצובי מעבדים בקנה מידה קטן יותר, אשר באופן אינטואיטיבי מכווץ את הרווח בין רכיבי המעבד, ובתורו מקצר את המרחק שהאלקטרונים צריכים לעבור כדי להשיג חישוב. זה מביא לשיפורים בביצועים, ולתהליכים קטנים יותר יש גם קיבול נמוך יותר, כלומר טרנזיסטורים עשויים להידלק ולכבות עם חביון נמוך יותר ובאנרגיה נמוכה יותר. לעיון, TSMC טוענת שהמעבר לתהליך 7nm שלהם משיג ביצועים ויעילות הספק בסדר גודל של 20% ו-40% בהתאמה, אם כי זה בהשוואה לתהליך ה-10nm FinFET של TSMC.

עבור ערכות הדגל האחרונות של Snapdragon, ראינו את Qualcomm עובדת עם סמסונג ומטמיעה את תהליך ה-LPP/LPE של 14nm ו-10nm. המעבר ל-7nm של TSMC עבור Snapdragon 855 אינו צפוי, עם זאת, בהתחשב בכך שתהליך ה-7nm של סמסונג היה רק נכנס לייצור המוני באוקטובר, אם כי בזמנו דווח כי תיבנה עליו ערכת שבבים 5G Qualcomm. יתר על כן, עיצוב ה-7LPP של סמסונג מיוצר בטכניקת ליתוגרפיה משופרת המכונה ליתוגרפיה אולטרה סגולה קיצונית (EUVL), מניב הפחתת שטח של 40% במורכבות עיצוב שווה, עם מהירויות מהירות יותר ב-20% או צריכת חשמל פחותה ב-50% בהשוואה ל-10nm FinFET אָבוֹת קַדמוֹנִים. כל קפיצה חדשה לצמתי תהליך קטנים יותר נחגגת בדיוק בגלל שהם כל כך קשים להשגה. לדוגמה, ככל שהטרנזיסטורים הולכים וקטנים, הם עשויים להציג 'דליפה' גדולה יותר או זרם זורם דרך טרנזיסטורים 'כבויים', מה שמגדיל את צריכת החשמל הסטטית במצבי סרק. ובעוד שבבים קטנים יותר עם ספירת טרנזיסטורים צפופה יותר עשויים לאפשר להפיק את המרב מפריסת סיליקון נתונה, התפוקה נוטה להיות נמוכה יותר עקב הדליפה האמורה, בתוספת קושי בהשגת מעבדים 'גבוהים יותר' הפועלים בהתייחסות (הגבוהה) שלהם תדרים. אלה סתם כמה מבין מכשולי הפיתוח הרבים שכמובן יתפוגגו עד שצומת תהליך חדש יגיע לייצור המוני, אבל ב בקיצור, יש הרבה מחקר ופיתוח כמו גם אתגרי ייצור שמוסיפים לעלות של הבאת גודל תהליך חדש ל שׁוּק.

ארכיטקטורת ARM A76 העדכנית ביותר ברישיון Kryo 485 היא תורם גדול נוסף לשיפורים המשמעותיים משנה לשנה שאנו רואים עם ה-Qualcomm Snapdragon 855. ליבת ה-A76 היא עיצוב צפחה ריק חדש לגמרי ממשרדי אוסטין של ARM, הכוללת מיקרו-ארכיטקטורה חדשה שנבנתה מאפס כדי לספק את מה ש-ARM מכנה "ביצועים ברמה של מחשב נייד עם יעילות ניידת." זה עדיין עיצוב מותאם למחצה, וקוואלקום ביצעה שיפורים כגון שליפת נתונים מראש אופטימלית ליעילות טובה יותר וביצוע גדול יותר מחוץ לסדר. חַלוֹן. העיצוב החדש הזה מציע כמה שיפורי ביצועים אדירים בהשוואה ל-A75, שעליהן התבססו ליבות הזהב של Snapdragon 845: הוא מבטיח שיפור ביצועים של 35% ויעילות צריכת חשמל טובה יותר ב-40%.. כאשר משווים את ה-A75 בתהליך של 10nm לעומת ה-A76 בתהליך של 7nm באותה מעטפת הספק של 750mW/ליבה, יתרון הביצועים גדל ל-40% לטובת הליבה החדשה, וגם החיסכון באנרגיה יכול לטפס עד 50%. יתרה מכך, שיפורים נוספים בצינורות אסימטריים של הוראה מרובת נתונים (ASIMD) ו הוראות נקודה למוצר שיפורים מצטברים לכ-3.9x בביצועים של משימות למידת מכונה, כמו מסקנות ברשתות עצביות קונבולוציוניות. כל זה מסתכם בביצועים מובילים בתעשייה לכל אזור והשלמה נהדרת לתהליך ה-7nm החדש, כאשר 'הליבה הראשית' של קוואלקום 2.84GHz זוחלת קרוב למהירויות השעון הייחוס ARM של 3GHz. השתמש בעת פירוט הליבה החדשה. הכל מהכל, קוואלקום מבטיחה שיפור מסיבי של 45% בביצועי המעבד מעל ה-845, העלייה הגדולה ביותר עד כה משנה לשנה.

אם כבר מדברים על 'הליבה הראשית' של Snapdragon 855, זה גם לא מפתיע לראות את קוואלקום נכנסת עם מערך האשכול החדש הזה בהתחשב בשיפורים גדולים יותר. LITTLE מופעל על ידי ARM's DynamimIQ פלטפורמות טכנולוגיות. בעיקרו של דבר, DynamIQ מאפשרת גמישות ומדרגיות רבה יותר בתכנון מעבד מרובה ליבות, המאפשרת עיצובי ליבה מרובים באשכול נתון, כמו גם בקרת מתח עדינה לכל ליבה. (עריכה: בשאלות ותשובות, קוואלקום אישרה שליבת Prime חולקת את תחום הכוח שלה עם אשכול הביצועים, מה שמגביל את השירות המתואר כאן). ה-A76 מתאים במיוחד לליבה פרימיום בודדת כזו עם שעון משלה, בהתחשב בכך שהוא דוחף את המעטפה כשמדובר בחוט יחיד ביצועים עם 25% יותר הוראות שלמים לשעון מאשר ה-A75, וביצועי ASIMD ונקודה צפה גבוהים ב-35%, תוך שהם מציעים 90% גבוהים יותר רוחב פס זיכרון. בקיצור, ה-A76 מציגה עליית דורות גדולה יותר מהדורות הקודמים, שללא ספק תרמה גם לקוואלקום. עליית ביצועים גדולה מהרגיל משנה לשנה עבור ה-Snapdragon 855 (לעיון, קוואלקום ציינה עלייה של 25 עד 30% עבור ה-845 מעל ה-835). זה עשוי להספיק כדי לשים את הביצועים המתקבלים של Qualcomm Snapdragon 855 לפני הליבה Mongoose 3 (M3) של Samsung LSI שנמצאת ב-Exynos 9810, אם כי העיצוב המסוים הזה סבל מיעילות חשמל באופן ששבבי קוואלקום לא סבלו, ושסביר להניח שה-Snapdragon 855 לא יעשה זאת. אוֹ.

מה זה אומר עבור משתמש הקצה? כמובן שעלינו לצפות לליבות בנצ'מרק מוגברות - ARM מקרין ציוני Geekbench גבוהים ב-28% לנייד ו-35% ביצועי Javascript משופרים. מעבר לאמות מידה, שאולי יש בהן קשר מועט לחוויית משתמש הקצה, ה-A76 ממשיך את ההתמקדות של ה-A75 על ביצועים מתמשכים, כלומר משתמשים צריכים לצפות פחות מצערת במהלך הפעלות משחק ממושכות. המעבר ל-7 ננומטר בשילוב עם עיצוב הליבה החדש בהחלט יביא לסוללה בולטת שיפורי חיים עבור משתמשי קצה, וזו אולי התכונה המושכת ביותר של סט זה של שדרוגים. גם הליבה 'Prime' החדשה מעניינת, בהתחשב בכך שליבה בודדת המתמקדת בביצועים מובילים עם חוטים בודדים יכולה להוכיח שימוש מועיל לאורך יישומים ותהליכים שאינם מוגדרים כדי לנצל כראוי ריבוי השחלות. כמובן, תהליך הייצור של 7nm משפיע עוד יותר על בלוקים אחרים של ה-Snapdragon 855, עם אותו חיסכון בחשמל ליחידות מחשוב אחרות שמעורבות גם הן בחוויית המשתמש היום יומית, כמו עיבוד תמונה לצילום סמארטפון.


'חווית משחק Snapdragon Elite' ו-Adreno 640 GPU

ה-Qualcomm Snapdragon 855 מתמקד מאוד במשחקים הפעם, תפנית לא מפתיעה בהתחשב בפופולריות של כותרים כמו Fortnite ו-PlayerUnknown's Battlegrounds, כמו גם הפופולריות הגוברת של ספורט אלקטרוני נייד (כן, זה דבר) באסיה. על פי נתונים שהציגה קוואלקום מ- דוח Newzoo 2017 Global Games Market, משחקי סלולר נמצאים במגמת עלייה עם הכנסות כוללות צפויות לשנת 2018 של 70.3 מיליארד דולר, המהווים 51% מכלל הכנסות המשחקים הודות לעלייה של 25.5% משנה לשנה.

ה-Adreno 640 GPU מביא בריא שיפור של 20% לביצועים הגרפיים, מה שמוסיף ליתרון של קוואלקום על פני המתחרים בתחום הספציפי הזה. עם זאת, לעיון, ה-Snapdragon 845 הביא עלייה של 30% ביחס ל-Snapdragon 835, שבעצמו הציע שיפור של 30% גם ביחס ל-Snapdragon 821. ובכל זאת, זה אמור לשמור על קוואלקום קדימה בביצועים גרפיים, והכי חשוב, ביצועים לוואט אם הם מצליחים להשתפר גם בחזית הזו. מעבר לנתון הזה, קוואלקום חשאית כתמיד בכל הנוגע לאדרנו: שמענו על המשולב מיקרו-בקר לניהול צריכת חשמל, וכיצד ל-640 יש את תקורה הדרייבר הנמוכה ביותר, למרות שהחברה הזכירה את הכללת 50% יותר יחידות לוגיות אריתמטיות (ALUs) שיאיצו עוד יותר את ביצועי הבינה המלאכותית.

דבר אחד שקוואלקום השקיע זמן רב בדיבור עליו בתדרוכים הוא הרצון שלהם להביא 'עיבוד מבוסס פיזי' (PBR) לחוויות משחק ניידות יותר. PBR הוא מודל הצללה המאפשר עיבוד גרפי ריאליסטי, מודל מדויק של זרימת אור בהתאם לחומר המיוצג בטקסטורות או לגבם של המשטח. זה מאפשר לאובייקטים במשחק לחקות כראוי את המאפיינים החזותיים של חומרים מהעולם האמיתי, כולל עיבוד נכון של משטחי מיקרו כמו שפשופים והדגשות ספורות. השיפורים הבולטים ביותר, עם זאת, מגיעים באופן שבו הוא מאפשר תיאור מדויק יותר של ההחזר והברק של כל המשטחים, אפילו אלה מחומרים שטוחים ואטומים (מדומים).

קוואלקום והמפתחים מאחורי Unity Engine הפופולרי עבדו על הפיכת PBR לנגיש יותר, אבל החברה גם עובדת עם מפתחי מנועים ומשחקים אחרים באופטימיזציה של משחקים ניידים עבור Snapdragon מכשירים. מנועי משחקים כמו Unity, Unreal, Messiah ו-NeoX כבר מותאמים למכשירי Snapdragon, למשל, וה-Snapdragon 855 תומך בממשקי API הגרפיים העדכניים ביותר כמו החדש וולקן 1.1. אולפנים כמו NetMarble, שעומד מאחורי Lineage II: Revolutions, גם עבדו עם קוואלקום בעבר כדי להציג בצורה הטובה ביותר את החוזקות של פלטפורמת Snapdragon. יתר על כן, עם ה סנאפדרגון 675, ראינו דיבורים על אלגוריתם מותאם אישית שהשיג עד 90% פחות ג'אנקים בהשוואה לאותה פלטפורמה ללא האופטימיזציות, ואותם שינויים עשו את דרכם ל-Snapdragon 855. עדיין לא ברור מה כוללות האופטימיזציות הללו, ואנחנו לא מצפים שהן יהיו ישימות ב כל משחק, אבל זה בהחלט אומר ביצועים טובים יותר, לפחות, בכותרים הגדולים יותר דְמוּי אָדָם.

נוסף על כל זה, בעוד ש-Snapdragon 835 ו-845 אפשרו השמעה ולכידה (בהתאמה) של סרטון HDR אמיתי 10 סיביות, ה-Qualcomm Snapdragon 855 יהיה ערכת השבבים הנייד הראשונה המאפשרת משחקי HDR אמיתיים. זה יחייב צגים אמיתיים בעלי יכולת HDR, שלמרבה המזל נפוצים יותר ויותר בקרב סמארטפונים של ספינות הדגל. בשל כך, משתמשים יכולים לצפות לצבעים עשירים יותר עם יותר עומק גוונים, טווח דינמי גבוה יותר (כפי שמשתמע מהשם) ושיפור ניגודיות. זה לא בהכרח תכונה חובה, אבל זה בהחלט נחמד לתת את המשחקים הנוכחיים של HDR הגדרות דורשות טלוויזיות ומסכים יקרים המותאמים ל-HDR, כמו גם מחשבים בעלי יכולת ומשחקים ספציפיים קונסולות. עם ה-Qualcomm Snapdragon 855, HDR במשחקים יהיה נגיש ונוח יותר (ללא בקרות מסך המגע, כמובן).


Hexagon 690 DSP חדש לעומסי עבודה של AI

למרות שהחברה לא מכנה אותה במפורש "יחידת עיבוד עצבית" בחומרי השיווק שלה, עומסי העבודה של AI ייהנו גם מה- Hexagon 690 DSP החדש והמשופר. קוואלקום הציגה בשקט את המעבדים המשותפים הללו לפני דורות רבים (עם ההשקה המתאימה של ה-QDSP6 v6 לצד ה-820), אך רק לאחרונה הם החלו להציג אותם כחלק מהבלוקים הטובים יותר של SoC עבור AI. תוכנן במקור להאצת עומסי הדמיה, הארכיטקטורה של ה-DSP - במיוחד עם הכללת Hexagon Vector eXtensions (HVX) - הפכה להתאמה מצוינת למשימות ML. ה-DSP ניתן לתכנות יותר מחומרה עם פונקציות קבועות, תוך שמירה על חלק מהביצועים ו יתרונות יעילות המאפיינים בלוקים של מעבדים ספציפיים ליישום, מאיצים מאוד את הסקלרים והווקטורים פעולות. זה הוכיח את עצמו מצוין עבור אלגוריתמי עיבוד התמונה המשתנים ללא הרף, שניתן להוריד ל-DSP, אך גם באופן טבעי להתאים לעומסי עבודה של AI. Hexagon DSP כבר א ברכה ללמידת מכונה על התקני קצה בשל ריבוי ההליכים המצוינים ברמת החומרה והמחשוב המקבילי, המסוגל לטפל באלפי סיביות של יחידות וקטוריות לכל מחזור עיבוד, בהשוואה למאות סיביות של ליבת מעבד ממוצעת למחזור, ושירות פריקה מרובה הפעלות.

ה- Hexagon DSP מתאים במיוחד למשימות הדמיה מכיוון שהוא יכול להזרים נתונים ישירות מחישן ההדמיה לזיכרון המקומי של ה-DSP (L2 Cache), תוך עקיפת בקר זיכרון ה-DDR של המכשיר. גוגל, למשל, השתמשה בעיבוד התמונה של Hexagon DSP כדי להפעיל את האלגוריתמים HDR+ של Pixel ו-Pixel 2, לפני שהציגה משלהם Pixel Visual Core. אלה גם מכשירים מוכנים למשושים שרואים את התוצאות הטובות ביותר מיציאות מצלמת Google הפופולריות, אותן תוכל לחקור כאן. נעשה בו שימוש בעומסי עבודה של מציאות מדומה ורבודה, מה שמוביל את כעת מבוטלת פרויקט טנגו על Lenovo Phab 2 Pro ו ASUS ZenFone AR. עם זאת, רוב יצרני ה-OEM המיישמים מכשירי דגל של Snapdragon משתמשים ב- Hexagon DSP לעיבוד תמונה בצורה כזו או אחרת, שתוכל לאמת באמצעות כלים כמו Snapdragon Profiler.

אז מה חדש ב-DSP החדש? ה-Hexagon 690 הכפיל את מספר המאיצים הווקטוריים (HVX) משניים לארבעה כדי לעבוד במקביל לארבעת החוטים הסקלאריים, אשר רואים גם ביצועים משופרים של 20%. נוסף על כך, ה-Hexagon 690 מביא את מאיץ הטנזור הראשון לנייד עם מאיץ טנזור משושה (HTA). זוהי תוספת משמעותית: היא משמשת כהאצת חומרה עבור כפל מטריצות יקר, ו משלב גם פונקציות לא-לינאריות (כמו sigmoid ו-ReLU) ברמת החומרה, ומאיץ עוד יותר הסקה. שינויים אלה ב-DSP צריכים להיות מתורגמים ל ביצועים טובים יותר של עוזר הקולי, מזיהוי מילים חמות ועד לניתוח פקודות במכשיר, המציע ביטול הד משופר ודיכוי רעשים, למשל. קוואלקום מדגישה שהם מספקים פלטפורמת מחשוב הטרוגנית שלמה המאפשרת להתחבר לעומס העבודה של AI המעבד, ה-GPU או ה-DSP, או כל שילוב של שלושת הבלוקים -- במילותיו של גארי ברוטמן של קוואלקום, זה שֶׁלָה "יותר מליבה אחת, זה יותר מחומרה, זו מערכת שלמה". הדור הרביעי שלהם ל-"Qualcomm AI Engine" חורג מעבר לחומרה, מכיוון שאנו מוצאים תמיכה גם ב-Snapdragon Neural Processing SDK ו-Hexagon NN לגישה הבלוקים שהוזכרו לעיל, כמו גם ה-Android NN API, ומסגרות ML פופולריות כגון Caffe/Caffe 2, TensorFlow/Lite ו-ONNX (Open Neural Network לְהַחלִיף). במצטבר, Snapdragon 855 יכול להציע פי שלושה מביצועי AI גולמי של קודמו (ופעמיים בהשוואה ל-Huawei), מעלה מעלה 7 טריליון פעולות בשנייה (TOPs). זכור, עם זאת, שקוואלקום ממשיכה להתמקד בפתרון מחשוב הטרוגני על פני התמקדות בבלוק ייעודי יחיד.

למידע נוסף על Hexagon DSP, בדוק היצירה של השנה שעברה המפרט כיצד זה עוזר עם עומסי עבודה של AI.


לסיכום, חבילת המחשוב של Snapdragon 855 מביאה כמה מהשיפורים המשפיעים יותר משנה לשנה שראינו בשנים האחרונות. ספקטרה 380 ISP-CV, שאותו סיקרנו במאמר נפרד, מביא גם חיזוקים אדירים לביצועים וליעילות החשמל, ומאפשר תכונות חדשות מצוינות כמו הקלטת וידאו 4K 60FPS HDR עם מצב דיוקן או החלפת רקע (די הגמישות!).

כפי שהוסבר במאמר זה, ההתקדמות והתכונות החדשות הללו אמורות להופיע באופן מוחשי לאורך כל חווית המשתמש. אנו מצפים ל-Qualcomm Snapdragon 855 ולבחון אותו לעומק בקרוב, אז הישאר מעודכן ל-XDA-Developers לקבלת החדשות והניתוחים האחרונים של Snapdragon 855!