גארי ברוטמן של קוואלקום וזיאד אסגר ישבו עם XDA לראיון על מצב הבינה המלאכותית ומה חדש ב-Hexagon 690 DSP ב-Snapdragon 855.
כאשר קוואלקום חשפה את החדש שלהם פלטפורמת Snapdragon 855 לנייד, הם ציינו שיפורים מהותיים בכל ההיבטים של מחשוב נייד. עבור המשתמש הממוצע, קל להבין את יתרונות משתמש הקצה מאחורי שיפורים במעבד וב-GPU שקוואלקום יצרה ב-Snapdragon 855. ביצועי מעבד טובים יותר מתורגמים לטעינת אפליקציות מהירה יותר וביצועי GPU טובים יותר מתורגמים לקצבי פריימים טובים יותר בזמן משחקים. מה שפחות אינטואיטיבי למשתמשים להבין הוא AI (בינה מלאכותית), ובאופן ספציפי, טכניקות למידת מכונה שאפליקציות ושירותים מאמצים יותר ויותר, כמו עצבים מלאכותיים רשתות. קוואלקום השיגה הישגים עצומים בביצועי עומס העבודה בינה מלאכותית עם ה-Snapdragon 855 הודות לשיפורים במחשוב בכל הלוח, ובמיוחד בזכות ה- Hexagon 690 DSP המחודש. ישבנו עם גארי ברוטמן, ראש תחום אסטרטגיית AI ו- Machine Learning ותכנון מוצר בקוואלקום, וזיאד אסגר, סגן נשיא תכנון מפת הדרכים של Snapdragon ו-AI, XR, אסטרטגיה תחרותית בקוואלקום, כדי ללמוד עוד על השיפורים שעשתה קוואלקום בעומסי עבודה של AI.
מריו סרפרו: "אז, ה-DSP החדש. בשנה שעברה, שאלתי אותך לגבי אסטרטגיית ההתקפה ביחס לאופן שבו קוואלקום דחפה, קידמה, שיווקה ותקשרה את ה-DSP וה-HVX, בפרט. בזמנו, כבלוק בינה מלאכותית, הוא עדיין היה חדש יחסית לרוב הקוראים והצרכנים. אז אנחנו תוהים איך ראיתם את זה מתפתח מאז עם הקידום הנוסף של ה-845".
גארי ברוטמן: "בראש ובראשונה, כשהתחלנו לעשות זאת עם ה-820, זה עדיין היה מאוד ממוקד מעבד ו-GPU, ומינוף DSP ו יכולות העיבוד הווקטוריות לכך באמת נוצרו כתוצאה מהמקום שבו גוגל מנסה להגיע עם TensorFlow ו-8 סיביות מתמטיקה. אז זה המקום שבו באמת מתחנו את הרגליים ב-DSP, או נניח במעבדי הווקטור. בהתחשב בבגרות של המעבד הווקטורי שיש לנו ב-Hexagon והדרך שבה הצלחנו לקדם את מפת הדרכים הזו כל כך מהר בשניים הבאים דורות, ומקרי השימוש שראינו, שבאותה עת, רשתות סיווג בסיסיות היו די פשוטות עם לא הרבה משקל. הם יכולים לפעול מצוין עם מתמטיקה של 8 סיביות. מאיץ ייעודי, אפילו בשנה שעברה, היה סיכון בעצם הקצאת שטח למשהו שאולי לא יתרגל. המפגש למקרי שימוש, וזה כל דבר ממצלמה יחידה סטנדרטית, רזולוציית סופר או פילוח בזמן אמת. הדברים האלה קורים במקרים מסוימים, במקביל, את הדרישה לקבל לפחות רמה מסוימת של האצה ייעודית שאתה יכול לבטל ועדיין לקרוא מחזורים במעבד הווקטור או אפילו ב-GPU. זה היה הזמן הנכון.
זה בהחלט משהו שהיינו צריכים לתכנן הרבה יותר מוקדם מאשר כשדיברנו בפעם הקודמת, אבל אני חושב שכולם נכנסים העסק הזה מהמר שהם יודעים בדיוק, או קרוב בדיוק, מה עומדים להיות עומסי העבודה האלה. איזה סוג של דיוק צריך להיות נחוץ, ואם עשית או לא תקציב מספיק חישוב כדי לספק את המפגש הזה של מקרי שימוש שמגיעים. אנחנו די מכוונים בזה - קוואלקום תמיד הייתה ממוקדת במקרה של שימוש - ולא רצינו להפעיל את סיכון של תאוצה ייעודית שלא הייתה בשימוש כי היא עלולה להיות לא מעודכנת באחרונה מחזור. אנו רואים מספיק במונחים של קונבולציה כללית בלבד שמאיץ ייעודי יכול לעשות עבודה נפלאה. שוב, לשחרר את המחזורים במקום אחר. מבחינת האסטרטגיה שיש לנו עם המאיץ החדש הזה: הוא ייעודי, זו ארכיטקטורה חדשה. זה לא נגזרת משושה. אבל אם אתה חושב על רשת היום, ישנן פונקציות מסוימות של אי-לינאריות שאינן פועלות היטב בחלק מההאצה הייעודית -"
מריו סרפרו: "כן, סיגמואיד, ReLU -"
גארי ברוטמן: "בדיוק, סופטמקס. ואתה צריך להעביר אותם למקום אחר, או למעבד. אבל במקרה שלנו, בדרך שבה הנדסנו את זה מתחת למכסה המנוע, ה-DSP הוא למעשה השליטה. הוא קובע היכן הרשת פועלת והיכן רצות השכבות ויכול להחליט אם יש דברים מסוימים שצריכים לפעול על ה-DSP כ-fallback לעומת ריצה על מעבד הטנסור. אז הזיווג הזה באמת היה לנו הגיוני מאוד. אבל זה לא גורע מהאמונות שלנו ומהאסטרטגיה שלנו שלפיה לכל ליבה ראשית ב-SoC שלנו יש תפקיד, אז אנחנו עושים אופטימיזציה בכל הלוח, אבל עדיין יש הרבה שונות וזה הולך לְהַמשִׁיך."
מריו סרפרו: "נושא נוסף שאנחנו רוצים לדבר עליו הוא מקרי שימוש. כמו שאמרת, קוואלקום מאוד ממוקדת מקרה שימוש, ראינו AI מגיע למובייל בשלושה תחומים עיקריים: זיהוי דיבור, חיזוי רצף כמו עם מחרוזות והקלדה, וכמובן ראיית מחשב כמו מסנני AI, [ואובייקט הַכָּרָה]. ראיית המחשב התפוצצה, עכשיו אתה רואה את זה בכל מקום. ראיתי עם זיהוי דיבור, לכל אחד יש עוזר AI משלו, לכל אחד יש עוזר משלו. כעת, כל מה שניתן לעשות בקצה עם זמן אחזור קטן ואבטחה מושלמת. אבל מה הלאה עבור מקרי שימוש של למידת מכונה, והאם כל מקרי השימוש האלה יפותחו על ידי החברות הגדולות בעולם - כל הסנאפצ'טים בעולם, הפייסבוקים שם בחוץ? איך אתה רואה את זה מתגלגל?"
גארי ברוטמן: "אני לא חושב שאני יכול להצביע על מקרה שימוש רוצח. אבל היכולות מאפשרות יותר מורכבות חישובית ובמקרה של ראייה, רזולוציית הקלט יכולה להיות גבוהה יותר. אתה לא עובד על תמונות ברזולוציה נמוכה כדי לעשות בוקה. היה דיון מוקדם יותר בראיון השני שהיה לנו סביב הזרמת 4K כדוגמה. אני לא מתכוון לחזות שזה אפשרי, אלא המפתחים שאנחנו עובדים איתם, בין אם זה חברות גדולות כמו גוגל או שלנו שותפי פיתוח תוכנה שבונים למעשה את האלגוריתמים שמניעים הרבה מהתכונות הנייד האלה, הם רק רוצים לדחוף יותר. הם רוצים ללכת רחוק יותר. אם יש משהו שהייתי רואה במונחים של השלבים הבאים, זה כנראה יהיה פחות על מה שקורה מעל הקו או ברמת האפליקציה, ו עוד על מה שקורה במערכת כמו שיפור אופן הפעולה של המוצר, ניהול צריכת חשמל ואפילו בצנרת המצלמה, לא רק על זה. הזכרת אודיו, ובכמה מילות מפתח אתה הולך לתמוך או אם תוכל לבצע ביטול רעשים במכשיר. עניין מילות המפתח מעניין כי זה לא קל לבנות את הספרייה - אתה מוגבל בזיכרון. אז עדיין יהיה איזון בין מה מקומי למה שהולך לקרות בענן".
זיאד אסגר: "אני יכול להוסיף קצת. אז לפחות שני התחומים שבהם זה גדל הרבה הם אודיו והדמיה, היום. אנחנו יכולים לראות שיש לו הרבה מקרי שימוש. ג'ק דיבר על זה מנקודת מבט של מצלמה, היה לנו מנוע AI שבו אתה יכול למנף הרבה מזה עבור מקרי שימוש בהדמיה. כמה מאלה שהוצגו היום. ואז אם אתה מסתכל על אודיו, לא דיברנו על זה כל כך הרבה, אבל למעשה הוספנו כמה יכולות אודיו לבלוק האודיו גם כן. אנו מסוגלים לבצע הפעלה קולית טובה יותר בסביבות רועשות יותר. אנחנו מסוגלים לבצע ביטול רעשים טוב יותר [בהדמיה]. כל היכולות האלה בעצם כבר מתרחשות. יש את השותפים שגארי הראה היום עבור ISP, יש הרבה יותר כאלה שמגיעים. אז אני חושב שאלו שני המימדים שאנחנו יותר מתמקדים בהם היום".
גארי ברוטמן: "ואז השלב הבא - אני לא מתכוון לחזות מתי זה יקרה - האם יש מספיק מחשוב עכשיו איפה למידה במכשיר וניסויים סביב למידה בפועל במכשיר יתרחשו ככל הנראה בשלב הבא מחזור."
מריו סרפרו: "זה כנראה נושא שיותר כיף לדון בו, וזו העובדה שקוואלקום נצמדת לכינוי Hexagon DSP ו-HVX בעוד חברות אחרות בוחרות ב"עצבי" כך וכך. איך קוואלקום רואה את הפער הזה ואת האסטרטגיות והגישות השונות האלה עם בעיקר את שיווק, אבל אנחנו יכולים להיכנס קצת מאוחר יותר על המחשוב ההטרוגני לעומת סיביות בלוק ספציפיות כמו נו."
גארי ברוטמן: "מכיוון של-Hexagon כבר יש הון עצמי שנבנה ב-DSP, אפשר מיד לחשוב שאנחנו רק מרחיבים את אסטרטגיית ה-DSP שלנו. למעשה לגבי המותג, אם אתה מסתכל על כל שלושת המעבדים, הסקלאר שלך, הווקטור שלך, ועכשיו מאיץ הטנזור הייעודי שלך, הם לא כולם DSP. Hexagon הוא באמת מותג ברמה גבוהה יותר מאשר רק DSP. יש קומץ של DSPs. אני חושב שלשאלות השיווקיות כנראה קצת יותר קשה לענות כי כל אזור שונה. סין מאוד ממוקדת ב-NPU כי זה כינוי שהוצג בשנה שעברה, ונראה שזה אחד שהשתרש. לא הייתי אומר שזה עבד במקומות אחרים ברחבי העולם. לגוגל יש מעבד טנסור, ונראה שהטנזור מהדהד".
מריו סרפרו: "להרבה אנשים יש שמות שונים משלהם."
גארי ברוטמן: "בסופו של דבר, זה מסתכם במה שה-OEM רוצה לעשות. אם זה חשוב ללקוחות שלהם, חובה עליהם להבין איך הם יכולים למנף את יכולת העיבוד הזו ולהבדיל בה מבחינת יכולות. המנוע שלנו, ואני חושב שחלק גדול מיכולת העיבוד שיש לנו, עדיין יהיה מאוד וקטור וממוקד טנזור מבחינת התמהיל הכולל. העיבוד הייעודי עצמו, האופן שבו הוא עושה כפל מטריצות, זה אותו סוג של מעבד ייעודי ש-NPU ישתמש בו. השאלה השיווקית היא שאלה מעניינת, ואני שוכח מה הייתה התשובה של קית'?"
זיאד אסגר: "התשובה שלו הייתה, 'אתה יכול לקרוא לזה איך שאתה רוצה, כדי שתוכל למכור יותר מוצר'."
גארי ברוטמן: "זה היה פחות או יותר זה; זה היה נכון, זו הייתה תשובה מאוד בוטה".
זיאד אסגר: "אני חושב שגארי כיסה את זה ממש טוב. חלק מהאנשים משתמשים בכינוי הזה כמונח בצורה שכמעט מצהירה או מרמזת שזה רק מגביל אותו לבלוק הזה. אבל מה שאנחנו רואים זה שכל הגישה ההטרוגנית הזו של היכולת להשתמש במעבד, או ב-GPU, או בטנזור משושה וקטור, נותן לך פשרות שונות בספקטרום שלם של דיוק על כוח וביצועים, וזה מה שאתה צריך היום. כי אנחנו לא יודעים איזה יישום דורש איזו מידת דיוק, מה דורש ביצועים מתמשכים, או מה לא דורש זאת. אז אנחנו מאמינים שזהו פתרון כולל ומלא, כי כך אתה מקבל את החוויה הטובה ביותר"
גארי ברוטמן: "וזה מעולם לא השתנה באף אחת מהשיחות שלנו, אפילו עם מאיץ ייעודי. זו תוספת, זה לא תחליף".
מריו סרפרו: "כן, אני חושב שזה היה קית' בשנה שעברה שאמר, 'איפה שיש מחשוב, יהיה AI'. ועכשיו יש יותר מחשוב."
גארי ברוטמן: "יותר מחשוב בכל בלוק, זה בדיוק נכון."
מריו סרפרו: "נאוו שאנחנו בנושא, שמענו הרבה השוואות עם מתחרה "מסתורי" 7nm באנדרואיד. כן, עדיין אין לנו מושג מי זה". (נֱאֶמַר בצחוק)
גארי ברוטמן: "אין לי מושג." (נאמר בצחוק)
מריו סרפרו: "אבל, אתה יכול לרמז לנו על ההשוואות האלה? איך הם נמדדו? אילו אזהרות כדאי לקחת בחשבון? עוד הערות שאולי לא הספקתם להרחיב עליהן בשקופיות או בשאלות ותשובות? אני יודע שזה די קשה למדוד [ולתקשר] בגלל מגוון הדגמים, אז אני חושב שזה נושא מעניין להרחיב עליו כדי ליידע אנשים מדוע זה לא כל כך קל להכין אותם השוואות."
גארי ברוטמן: "למעשה זה די פשוט. אני אתן לך תשובה פשוטה מאוד על מדד אחד ספציפי; אנחנו הולכים לעשות יותר בנצ'מרקינג בינואר. נדבר יותר על הרשתות השונות המשמשות למדידת המספרים שעליהם אנו מבססים, וזו תהיה Inception v3 סטנדרטית. מכאן אנו שואבים את הביצועים ואת ההבנה שלנו לגבי המקום שבו התחרות ממוקמת. אבל במונחים של זה שהכריז ויצא עם מוצרים בשוק, לשם מגיעים ה-2x וה-3x מ-ובכן ה-3x היה נגד מה שהיה לנו ב-845, בעוד שה-2x הוא מדד הביצועים ומצב הביצועים שלהם יחסית לשלנו."
זיאד אסגר: "יש לך מכשירים זמינים, אתה באמת יכול לרכוש אותם ולעשות חלק מהבדיקות האלה בעצמך. אבל אני חושב שהדבר היחיד שממנו אשמור, זה סוג של מערב פרוע של בנצ'מרקינג AI. יש אנשים שמשתמשים במונחים כלליים מאוד, או תמהילים של רשתות שעשויים להועיל להם בצורה מסוימת או לא. "האם זה יתיישר היטב עם עומס עבודה מודאלי?" זה לא משהו שאנשים לוקחים בחשבון. חלק מהאמות מידה שצפו מסביב עושות הרבה יותר מזה, ואנחנו מאוד קרובים אז אנחנו יודע שיש אנשים שגורמים לאמות המידה האלה להתנודד בדרך זו או אחרת, תלוי באילו טובות אוֹתָם. לכן זה הרבה יותר על מקרי שימוש בפועל. זה גם הרבה יותר על הביצועים הטובים מסוגו עבור מקרה השימוש הזה, ואז זה על לעשות את זה הכי מהר. אני חושב שאלו כל הגורמים שאנו מסתכלים עליהם. אבל אני חושב שזה ישתפר, זה יתכנס. נכון לעכשיו, יש מגוון אפשרויות שונות בחוץ. אני חושב שיישארו אמות מידה מסוימות שהגיוניות יותר. היום, אולי אתה יכול לטעון כי Inception v3 הוא טוב יותר יחסית בנקודת זמן זו."
גארי ברוטמן: "מבחינת רשתות, יש קומץ. יש ResNet, VGG, רשתות פילוח, רשתות ברזולוציה סופר - ביצועים גולמיים שאפשר למדוד איתם. הנקודה שיש לקחת ממנה במונחים של מדדים כמו חברות או גופים שעושים בנצ'מרקינג בינה מלאכותית, והם יש תערובות של דיוקים, רשתות ונוסחאות משתנות, הן כל כך משתנות שהתוצאות משתנות משבוע לשבוע. זה המקום שבו זה באמת המערב הפרוע, ואנחנו שומרים על מרחק זרוע. אנחנו לא מניחים את ההימורים שלנו בשום מקום, כי יש כל כך הרבה שונות בכל הנוגע לביצועים בפועל של חלק מהרשתות האלה שמשמשים במקרים של שימוש, אנחנו בטוחים שאנחנו עדיין בהחלט מדורגים שם במונחים של ביצועים ביחס ל- תַחֲרוּת. אני צריך לומר לא דירוג אלא ההכפלה שדיברנו עליה, ביצועים גולמיים".
מריו סרפרו: "אחד הנושאים שאנו מתעניינים בהם כאתר בעיקר למפתחים הוא הדמוקרטיזציה של למידת מכונה. ברור שיש לנו ספריות קוד פתוח שהן מעולות, כולם מציעים גם את ה-SDK המדהימים האלה, ויש המון חינוך. ועכשיו אנדרואיד NN זמין וגוגל הוציאה זה עתה ערכת ML מה שמפשט את התהליך. אתה פשוט קורא ל-API, מזין לו את הקלט שלך, הם משתמשים במודל מיומן, אתה לא צריך לדאוג לגבי זה, אתה לא צריך לחשוב על זה, אתה לא צריך לדעת שום סטטיסטיקה או שום חשבון וקטור. איך אתה רואה שהנוף התפתח בהקשר זה בהפיכתו לנגיש יותר, תוך פישוט ה-API, פישוט התיעוד, ה-SDKs וקידום הכללת מפתחי צד שלישי, לא רק גדולים חברות?"
גארי ברוטמן: "זה מצחיק כשאנחנו בעצם מתמקדים בחברות גדולות, זה עוזר גם למפתחים הקטנים יותר. התחלנו עם יותר מחסנית קניינית בכל הנוגע לתכנות עבור Snapdragon, במיוחד להפעלת AI. אבל עם הזמן, ובשני הדורות האחרונים, הוספנו עוד כלים. אנחנו מנסים למצוא איזון בין הפשטה ברמה גבוהה וקלות שימוש, לבין גישה ברמה נמוכה יותר, שמצריכה מישהו להיות הרבה יותר מתמצא במיוחד כשמדובר בהתמודדות עם חלק מהליבות הקנייניות שלנו כמו המעבד הווקטור או ה-NPU. אנחנו רואים את זה מתפתח מנקודת מבט של דמוקרטיזציה. יש לנו את אבני הבניין הבסיסיות כמו ספריות מתמטיקה של Hexagon ו-Qualcomm, אבל אולי API ברמה קצת יותר גבוהה שמפשט לפחות חלק מהמשימות הכבדות האלה, אבל נותן מספיק גמישות למפתח כדי להיות מסוגל להשתמש באופרטורים מותאמים אישית משלו, או להיות מסוגלים לצבוט מעט במונחים של ביצועים בתחתית רָמָה. אז הפורטפוליו ימשיך לכלול יותר כלים, ובוודאי דברים כמו NN API שבו Onyx הוא דוגמה ליכולת בעצם אמור "הנה מה שאתה מתכנת, במה אתה מבטא את הרשת שלך." כל עוד החומרה תומכת בזה, אתה כן טוֹב.
כפי שציינתי במצגת שלנו, אנחנו אחראים לנוף ריבוי מערכות הפעלה. יש Windows, יש לינוקס, יש אנדרואיד, אז זה לא קשור רק לאנדרואיד. כשאנחנו מסתכלים על זה, אם אנחנו הולכים לבנות איזשהו ממשק API שיהיה SoC, Cross-SoC או חוצה פלטפורמות מנקודת מבט של מערכת ההפעלה, עלינו להסתכל ולראות כיצד למצוא משותף במה שאנו בונים תחת בַּרדָס. המחסנית עם ספריות ותמיכה במפעילים ובעלת זה להיות מסוגל להתחבר ל-NN API או Windows ML, כדוגמה. אבל בהחלט, עברנו מהמטוטלת להיות כאן, שם אף אחד לא באמת יודע מה לעשות, כמו פשוטו כמשמעו, לא לדעת. "אני לא יודע באיזו מסגרת להשתמש. האם אני משתמש ב- TensorFlow, או שעלי להשתמש בקפה או לפיד?" ולא יודע מה לעשות כדי לייעל ברמה הנמוכה יותר. אז כולם מרוצים מקריאת API. עכשיו, תוך עניין של כמה שנים, קל להעמיק. אז הכלים נמצאים שם, בין אם הם כלי קוד פתוח נפוצים, או אפילו בפורטפוליו כמו שאנחנו מציעים או שהמתחרים מציעים, הכלים האלה הופכים נגישים יותר וקלים יותר לשימוש."
מריו סרפרו: "אם כבר מדברים על קהילות מפתחים. בפעם הקודמת שהזכרנו את אחת הקהילות הכי בוגרות שיש לנו היא קהילת המשחקים, וקוואלקום די משובצת בזה. כעת, אנו רואים זאת יותר מתמיד עם השותפויות עם מנועי המשחק שמקודמים ומשווקים. אז דיברנו על זה בהקשר של בינה מלאכותית ואיך היא מתפתחת שם."
מישאל רחמן: "דיברת על איך אתה רוצה להשקיע יותר במהלך 12 החודשים הבאים. זה חזר בפעם האחרונה שהיינו כאן".
מריו סרפרו: "במיוחד בקהילת מפתחי המשחקים, קצת להרחיב על זה ועל מה שאנחנו רואים היום."
גארי ברוטמן: "אני לא זוכר את ההערה הספציפית על השקעה בקהילת המשחקים, אבל אם אתה מסתכל על קטגוריה שראינו נוהגת הצורך בהאצה ייעודית, ומשחקים הם מרכיב של זה, אבל זה לא מקרה השימוש העיקרי בהכרח - VR בתור דוגמא. בחוויית VR עשירה וסוחפת, כל ליבה בעצם ממונפת. אתה מבצע עיבוד גרפי על ה-GPU, עיבוד ויזואלי על המעבד הווקטורי והצורך בכך קחו רשת אחת או יותר והפעילו אותן בנפרד על מאיץ ייעודי ללא דאגה של מקבילות פְּגִיעָה. זו אחת הסיבות שהובילו אותנו בדרך של האצה ייעודית. אין לי הרבה מידע ביחס לאופן בו מינוף AI במשחקים כיום. יש הרבה עבודה עם סוכנים - לפתח סוכנים להילחם נגדך או ללמד אותך."
מריו סרפרו: "כמו הבינה המלאכותית המסורתית במשחקים."
גארי ברוטמן: "בדיוק. אבל להיות יותר מבוסס רשת עצבית."
מריו סרפרו: "כן, לא המינימקס."
גארי ברוטמן: "חלק מהאחריות של זיאד גם היא מניע את אסטרטגיית ה-XR."
זיאד אסגר: "מבחינת XR, אם אתה מסתכל על זה היום, השקנו מכשירים חדשים שהם מכשירי HMD All-in-One עם הפעלת 6DOF מלאה. מכשירים כמו Oculus Quest שהושק למעשה עם ה-Snapdragon 835, אז אנחנו מתחילים להגיע לנקודה טובה מאוד מבחינת רתימת היכולת המלאה של מכשירי XR. בעבר, חלק מהמכשירים לא ממש העניקו את החוויה הבתולית הזו מכיוון שחלק מהאנשים לא קיבלו ממנה את החוויה הטובה ביותר. אני חושב ש-XR עכשיו מצליח מצוין. מה שאנחנו גם מסתכלים עליו בעתיד כפי שהוא משתלב עם 5G, זה מאפשר לך עכשיו להיות מסוגל לקחת המכשיר שלך שהוא למעשה הרבה יותר נייד מה שאומר שאתה יכול לדמיין שאתה בעצם הולך על א רְחוֹב. ואז יש קישור כמו 5G אומר שזה כמו הדגמה שגארי הראה של Google Lens. עכשיו תאר לעצמך שאם היית מרכיב איזשהו משקפי גוגל או משהו כזה ואתה באמת יכול להביא מידע על מה שאתה מסתכל עליו דרך העיניים שלך, עכשיו יש לך מקרה שימוש שבאמת יכול להיות מאוד משכנע. אני חושב ששם ההשקעה לטווח ארוך שאתה מדבר עליה, זה סוג של הכיוון שאליו היא הולכת.
אבל כרגע, אנחנו מרגישים שאנחנו במצב טוב מאוד מבחינת XR וכל החברות השונות שהושקו עם XR. Oculus Go מבוסס גם על Snapdragon 820, אז אני חושב שאנחנו מתחילים להגיע לנקודה טובה מאוד שבה אנשים קולטים את זה ועושים איתו הרבה דברים. והשלב הבא כמו שציינתי הוא שאנחנו מתחילים להביא קישוריות 5G מה שנעשה ואז מעבר שכמובן AR וכמה דברים שאפילו ידרשו הרבה יותר מבחינת ביצועים, אך מוגבלים כּוֹחַ. וזה הולך להיות מאתגר ביותר, ואני חושב שעם מה שדיברנו עליו היום, קוואלקום היא כנראה הטובה ביותר מבחינת ביצוע של כל אחד ממקרי השימוש האלה מבחינת כוח. אם תסתכל על גרפיקה, אם תבחן את אחד מהמתחרים, תראה שהביצועים שלנו ליחידה הם הטובים ביותר מסוגו. וכתוצאה מכך, התרמיות, הביצועים המתמשכים הם מה שחשוב ב-XR, ובעניין הזה אנחנו ממש קדימה - זו הסיבה שאנשים משתמשים בנו ל-XR."
מריו סרפרו: "מאז שנה שעברה, ראינו את Hexagon 685 DSP סוף סוף הגיע לטווח הביניים הפרימיום עם 710 ואת טווח הביניים המתאים עם ה 670 ו 675. אז עכשיו אנחנו מקבלים את הרחבות וקטור המשושים עושות את דרכן במורד הזרם, בעוד שמתחרים אחרים לא ממש עושים את זה עם יחידות העיבוד העצבי שלהם. איך אתה רואה שהרחבת טווח ההתנסויות האלה, ורציתי לשאול האם בעבר ראית שהפערים בביצועים ב-AI עושים הבדל? כי אנחנו עדיין נמצאים באימוץ מוקדם של AI."
זיאד אסגר: "אני מסתכל על מפת הדרכים הכוללת. אם אתה מחפש את הביצועים הטובים ביותר בכיתה, זה יהיה בדרגת הפרימיום. מה שאנחנו עושים זה שאנחנו לוקחים באופן סלקטיבי חלק מיכולות ההקסגון ומורידים אותה. מנוע הבינה המלאכותית הראשון, או המשושה הראשון, הופעל עם ה-Snapdragon 820. אז הורדנו את זה ל-Snapdragon 660 ול-670, וגם ל-710 יש את זה. אז התוכנית שלנו היא לראות איך זה מתפרץ לחוויות הפוטנציאליות.
בתור מנוע בינה מלאכותית, יש לנו רכיבים ישנים בסיסיים: מעבד, GPUs, טנזור משושה, וקטור משושה וסקלאר. מה שאנחנו עושים זה שאנחנו מביאים חלקים מזה באופן סלקטיבי למטה יותר לתוך מפת הדרכים כשאנחנו רואים שהיכולות האלה יורדות והולכות לאוזניות מהדרג הנמוך יותר. אתה תראה למעשה, ככל שנתקדם יותר בשנה. אתה תראה שנעשה יותר מזה. השקנו את Snapdragon 675 בפסגת 4G/5G. דיברנו על זה שיורד עם ה-675, ומה שתראה הוא שככל שמקרי השימוש האלה הופכים יותר נפוץ, כפי שהראינו עם ArcSoft וכל החבר'ה האחרים האלה היום, למעשה נביא את היכולות האלה נמוך יותר. בשכבה התחתונה תוכל להפעיל את מקרה השימוש הזה, אבל כדי להיות מסוגל לקבל את פרופיל הכוח הנכון כמוני דיברו עליו קודם, אם אתה רוצה לקבל את הביצועים המתמשכים האלה, אתה רוצה שהגוש המסוים הזה יגיע נמוך יותר. אז שוב, הביצועים הטובים בכיתה יהיו למעלה, אבל ככל שתרד נמוך יותר תהיה השפלה או הדרגה גדולה של..."
מריו סרפרו: "ירידה בשיפוע, אפשר לומר." (נאמר בצחוק)
זיאד אסגר: "כן בדיוק. זה בערך איך שאנחנו עושים עם טכנולוגיות אחרות גם במפת הדרכים ובינה מלאכותית לא תהיה שונה מאוד במובן הזה. זה כנראה הבדל אחד, אולי מאיפה אתה בא, מכיוון שהוא כנראה יורד מהר יותר באמצעות טכנולוגיות אחרות שהורדנו במפת הדרכים, כך שההתבוננות הזו הייתי מסכים עם."
אם אתה מעוניין ללמוד עוד על AI בפלטפורמות הנייד של קוואלקום, אנו ממליצים לקרוא את הראיון שלנו מהשנה שעברה עם גארי ברוטמן. אתה יכול להתחיל עם חלק 1 של הראיון שלנו או עבור אל חלק 2.
כל הגרפיקה המוצגת בראיון זה מקורה במצגת של גארי ברוטמן במהלך פסגת הטכנולוגיה Snapdragon. אתה יכול לצפות בשקופיות כאן.