Як Qualcomm покращила продуктивність, ігри та AI на Snapdragon 855

Нова мобільна платформа Qualcomm Snapdragon 855 значно покращує продуктивність, ігри та штучний інтелект, і ми розбираємо, як вони це зробили.

На саміті Qualcomm Snapdragon 2018 компанія анонсували свій новий флагманський чіпсет преміум-класу: платформу Snapdragon 855. Цей новий продукт стане основою більшості плідних флагманів 2019 року, приносячи з собою обіцянку неймовірної швидкості передачі даних через модем Snapdragon X50. Крім того, Snapdragon 855 вносить безліч покращень у кожен блок системи на чіпі, з деякі обчислювальні блоки спостерігають найбільше підвищення продуктивності та енергоефективності порівняно з минулим роком історії.

Ми вже описували Spectra 380 ISP-CV, наприклад, що ще більше покращує фотографію на смартфоні, а також забезпечує користувачам здорову економію заряду акумулятора. Хоча ми все більше звертаємо увагу на периферійні компоненти, такі як Hexagon DSP, основні блоки, на які ентузіасти звертають найбільше увага до, а саме, ЦП і ГП, також отримали більш ніж скромні переваги завдяки вдосконаленню архітектури та переходу до нового процесу вузол. У цій статті ми коротко підсумуємо, що нового та що відомо про процесор, графічний процесор і DSP Snapdragon 855, а також те, як покращення та нові функції можуть вплинути на це.

ваш досвід користувача в 2019 році.


Процесор Kryo 485 на базі A76 і перехід на 7-нм

Snapdragon 855 переходить на новітній 7-нм технологічний процес FinFET від TSMC. Зазвичай ми бачимо перегляд вузла раз на рік або два зі зменшенням розміру або оптимізацією в середині циклу (наприклад, перехід від «Ранній з низьким енергоспоживанням» (LPE) до "Low-Power Plus" (LPP) у вузлах Samsung-LSI), тому ви, ймовірно, чули про ці показники в тих чи інших новинах стаття. Але що це означає? У цьому контексті він описує розмір транзисторних функцій процесора, які, у свою чергу, підказують нам, яких покращень щільності транзисторів ми можемо очікувати з кожним новим поколінням. Завдяки більшій кількості транзисторів на одиницю площі продуктивність процесора може бути збільшена. Ця функція також важлива, оскільки менші вузли процесу дозволяють реалізовувати дизайни процесорів у меншому масштабі, що інтуїтивно зменшує простір між елементами процесора, у свою чергу, скорочуючи відстань, яку повинні пройти електрони обчислення. Це покращує продуктивність, а менші процеси також мають нижчу ємність, тобто транзистори можуть вмикатися та вимикатися з меншою затримкою та меншою енергією. Для довідки TSMC стверджує, що перехід на їхній 7-нм техпроцес досягнув продуктивність і енергоефективність на рівні 20% і 40% відповідно, хоча це порівняно з власним 10-нм процесом FinFET TSMC.

Протягом кількох останніх флагманських чіпсетів Snapdragon ми бачили, як Qualcomm співпрацює з Samsung і реалізує їхній 14-нм і 10-нм процес LPP/LPE. Однак перехід на 7-нм техпроцес від TSMC для Snapdragon 855 не є несподіваним, враховуючи, що 7-нм техпроцес Samsung мав щойно почав масове виробництво в жовтні, хоча на той час повідомлялося, що на ньому буде створено чіпсет 5G Qualcomm. Крім того, дизайн Samsung 7LPP виготовлено за вдосконаленою технікою літографії, відомою як ультрафіолетова літографія (EUVL), зменшуючи площу на 40% при однаковій складності конструкції, на 20% швидше або на 50% менше енергоспоживання порівняно з 10-нм FinFET попередників. Кожен новий стрибок до менших вузлів процесу відзначається саме тому, що їх так важко досягти. Наприклад, коли транзистори стають меншими, вони можуть демонструвати більший «витік» або струм, що протікає через транзистори, які «вимкнені», збільшуючи статичне енергоспоживання в режимі очікування. І хоча менші мікросхеми з більшою кількістю транзисторів можуть дозволити отримати максимальну віддачу від даної кремнієвої пластини, продуктивність, як правило, нижча через вищезгаданий витік, а також труднощі з отриманням процесорів із «вищими ланками», які працюють із (високим) посиланням частоти. Це просто дещо багатьох перешкод у розвитку, які, звичайно, усуваються до того часу, коли новий вузол процесу потрапляє в масове виробництво, але в Коротше кажучи, існує багато проблем, пов’язаних із дослідженнями та розробками, а також виробництвом, які збільшують витрати на впровадження нового розміру процесу ринку.

Остання архітектура ARM A76, ліцензована для Kryo 485, є ще одним великим внеском у значні щорічні покращення, які ми бачимо з Qualcomm Snapdragon 855. Ядро A76 — це абсолютно новий чистий дизайн від офісів ARM в Остіні, що містить нову мікроархітектуру, створену з нуля, щоб забезпечити те, що ARM називає «продуктивністю класу ноутбуків з ефективність мобільних пристроїв". Це все ще напівспеціальний дизайн, і Qualcomm внесла такі вдосконалення, як оптимізоване попереднє вилучення даних для кращої ефективності та більшого нестандартного виконання вікно. Ця нова конструкція пропонує деякі надзвичайні покращення продуктивності в порівнянні з A75, на якому базувалися ядра Gold Snapdragon 845: вона обіцяє 35% покращення продуктивності та 40% підвищення енергоефективності. Порівнюючи A75 на 10-нм техпроцесі з A76 на 7-нм техпроцесі за тієї самої огинаючої потужності 750 мВт/ядро, перевага в продуктивності зростає до 40% на користь нового ядра, а економія енергії також може зрости до 50%. Більше того, інші вдосконалення конвеєрів Asymmetric Single Instruction Multiple Data (ASIMD) і інструкції з добутку у сукупності досягає ~3,9-кратного покращення продуктивності завдань машинного навчання, як-от логічний висновок у згорткових нейронних мережах. Усе це забезпечує найкращу в галузі продуктивність на певну ділянку та чудове доповнення до нового 7-нанометрового технологічного процесу, оскільки «основне ядро» Qualcomm 2,84 ГГц наближається до еталонної тактової частоти ARM 3 ГГц. використовували при деталізації нового ядра. Загалом, Qualcomm обіцяє величезне підвищення продуктивності ЦП на 45%. понад 845, найбільше зростання в порівнянні з минулим роком.

Говорячи про «основне ядро» Snapdragon 855, також не дивно бачити, що Qualcomm переходить із цією новою конфігурацією кластера, враховуючи покращення порівняно з великими. LITTLE дозволено ARM DynamIQ технологічні платформи. По суті, DynamIQ забезпечує більшу гнучкість і масштабованість багатоядерного дизайну процесора, дозволяючи створювати кілька ядер в одному кластері, а також детально керувати напругою для кожного ядра. (РЕДАГУВАТИ: у запитаннях і відповідях Qualcomm підтвердила, що ядро ​​Prime ділиться своєю потужністю з кластером продуктивності, обмежуючи описану тут утиліту). A76 особливо добре підходить для такого самотнього ядра преміум-класу з власним годинником, враховуючи, що він розширює межі, коли справа доходить до однопотокового продуктивність із на 25% більшою цілочисельною інструкцією за такт, ніж A75, і на 35% вищою продуктивністю ASIMD і з плаваючою комою, пропонуючи при цьому на 90% вищу продуктивність пропускна здатність пам'яті. Коротше кажучи, A76 представляє більший підйом поколінь, ніж попередні покоління, що, безсумнівно, також сприяло Qualcomm більший, ніж зазвичай, приріст продуктивності Snapdragon 855 у порівнянні з минулим роком (для довідки, Qualcomm назвала підвищення на 25-30% для 845 порівняно з 835). Цього може бути достатньо, щоб результуюча продуктивність Qualcomm Snapdragon 855 випередила ядро ​​Mongoose 3 (M3) Samsung LSI, яке міститься в Exynos 9810, хоча ця конкретна конструкція страждала від енергоефективності, ніж чіпи Qualcomm, і що Snapdragon 855, швидше за все, не буде або.

Що це означає для кінцевого користувача? Звичайно, ми повинні очікувати збільшення тестових ядер — ARM прогнозує на 28% вищі показники Geekbench для мобільних пристроїв і на 35% покращену продуктивність Javascript. Окрім контрольних показників, які можуть мати невелике відношення до досвіду кінцевого користувача, A76 продовжує фокусувати увагу A75 на стійка продуктивність, тобто користувачі повинні очікувати меншого дроселювання під час тривалих ігрових сеансів. Перехід до 7-нм техпроцесу в поєднанні з новим дизайном ядра, безсумнівно, призведе до помітного акумулятора покращення життя кінцевих користувачів, і це, мабуть, найпривабливіша функція цього набору оновлення. Нове ядро ​​«Prime» також цікаве, враховуючи, що одиночне ядро, зосереджене на найвищій однопотоковій продуктивності, може виявляється корисним у програмах і процесах, які не налаштовані на належне використання переваг багатопотоковість. Звичайно, 7-нм виробничий процес також впливає на інші блоки Snapdragon 855, забезпечуючи таке ж енергозбереження. до інших обчислювальних блоків, які також задіяні в повсякденній роботі користувача, таких як обробка зображень для фотографії на смартфоні.


«Snapdragon Elite Gaming Experience» і графічний процесор Adreno 640

Цього разу Qualcomm Snapdragon 855 зосереджений на іграх, що не дивно, враховуючи популярність ігор як-от Fortnite і PlayerUnknown’s Battlegrounds, а також зростаюча популярність мобільного кіберспорту (так, це щось) в Азії. Згідно з даними Qualcomm від Звіт Newzoo 2017 Global Games Market, мобільні ігри мають тенденцію до зростання з очікуваним загальним доходом у 2018 році в розмірі 70,3 мільярда доларів США, що становить 51% усіх доходів від ігор завдяки збільшенню на 25,5% у порівнянні з минулим роком.

Графічний процесор Adreno 640 забезпечує здорову роботу 20% підвищення продуктивності графіки, що ще більше посилює перевагу Qualcomm над конкурентами в цій конкретній галузі. Для довідки, однак, Snapdragon 845 приніс 30% приріст у порівнянні з Snapdragon 835, який також запропонував 30% покращення в порівнянні з Snapdragon 821. Тим не менш, це повинно тримати Qualcomm попереду в графічній продуктивності, і, що найважливіше, продуктивності на ват, якщо їм вдасться покращити і це. Окрім цієї цифри, Qualcomm залишається таємничим, як ніколи, коли йдеться про Adreno: ми чули про інтегрований мікроконтролер для керування живленням, і як 640 має найнижчі накладні витрати на драйвер, хоча компанія згадала про включення На 50% більше арифметико-логічних блоків (ALU), які ще більше прискорять роботу ШІ.

Одна річ, про яку Qualcomm багато говорила на брифінгах, це їхнє бажання запровадити «фізично орієнтоване рендеринг» (PBR) у більше мобільних ігор. PBR — це модель затінення, яка дозволяє відтворювати реалістичну графіку, точно моделюючи потік світла відповідно до матеріалу, представленого в текстурах, або тесселяції поверхні. Це дозволяє об’єктам у грі належним чином імітувати візуальні властивості матеріалів реального світу, зокрема належне відтворення мікроповерхонь, таких як потертості та дзеркальні відблиски. Однак найпомітніші покращення полягають у тому, що він дозволяє точніше відображати відбивну здатність і блиск усіх поверхонь, навіть із плоских і непрозорих (імітованих) матеріалів.

Qualcomm і розробники популярного Unity Engine працювали над тим, щоб зробити PBR доступнішим, але компанія також співпрацює з іншими розробниками двигунів і ігор в оптимізації мобільних ігор для Snapdragon пристроїв. Ігрові движки, такі як Unity, Unreal, Messiah і NeoX, уже оптимізовані для пристроїв Snapdragon, наприклад, а Snapdragon 855 підтримує найновіші графічні API, такі як новий Вулкан 1.1. Такі студії, як NetMarble, яка стоїть за Lineage II: Revolutions, також працювали з Qualcomm у минулому, щоб якнайкраще продемонструвати сильні сторони платформи Snapdragon. Крім того, з Snapdragon 675, ми бачили розмови про спеціальний алгоритм, який досягав до На 90% менше дронів у порівнянні з тією ж платформою без оптимізації, і ті самі зміни відбулися на Snapdragon 855. Досі незрозуміло, що передбачають ці оптимізації, і ми не очікуємо, що вони будуть застосовні кожній грі, але це, безперечно, означатиме кращу продуктивність принаймні у більших заголовках Android.

Крім того, хоча Snapdragon 835 і 845 дозволяли відтворювати та знімати (відповідно) 10-бітове, справжнє відео HDR, Qualcomm Snapdragon 855 стане першим мобільним чіпсетом, який дозволяє справжні ігри HDR. Це вимагатиме справжніх дисплеїв із підтримкою HDR, які, на щастя, стають все більш поширеними серед флагманських смартфонів. Через це користувачі можуть очікувати насиченіші кольори з більшою тональною глибиною, ширшим динамічним діапазоном (як випливає з назви) і покращеною контрастністю. Це необов’язково обов’язкова функція, але це, звичайно, приємно, враховуючи поточні ігри HDR налаштування потребують дорогих телевізорів і моніторів із підтримкою HDR, а також потужних комп’ютерів і спеціальних ігор консолі. З Qualcomm Snapdragon 855 HDR в іграх, мабуть, стане доступнішим і зручнішим (без сенсорного керування, звичайно).


Новий Hexagon 690 DSP для робочих навантажень AI

Хоча компанія явно не називає це «нейронним процесором» у своїх маркетингових матеріалах, робочі навантаження штучного інтелекту також виграють від нового та покращеного Hexagon 690 DSP. Qualcomm тихо представила ці співпроцесори багато поколінь тому (з належним впровадженням QDSP6 v6 разом із 820), але лише нещодавно вони почали пропонувати їх як одні з кращих блоків SoC для ШІ. Спочатку розроблена для прискорення робочих навантажень обробки зображень, архітектура DSP — зокрема, із включенням Hexagon Vector eXtensions (HVX) — стала чудовою придатністю для завдань ML. DSP є більш програмованим, ніж апаратне забезпечення з фіксованою функцією, але все ще зберігає частину продуктивності та переваги ефективності, які характеризують блоки процесора для конкретної програми, значно прискорюють скалярну та векторну операції. Це виявилося чудовим для постійно мінливих алгоритмів обробки зображень, які можна перенести на DSP, але також, природно, піддаються навантаженню ШІ. Hexagon DSP був a благо для машинного навчання на периферійних пристроях завдяки чудовій багатопоточності та паралельним обчисленням на апаратному рівні, здатним обробляти тисячі бітів векторних одиниць за цикл обробки в порівнянні з сотнями біт середнього процесорного ядра за цикл і обслуговуванням багаторазового розвантаження сесії.

Hexagon DSP особливо добре підходить для завдань обробки зображень, оскільки він може передавати дані безпосередньо з датчика зображення в локальну пам’ять DSP (кеш L2), минаючи контролер пам’яті DDR пристрою. Google, наприклад, використовував обробку зображень Hexagon DSP для забезпечення алгоритмів HDR+ Pixel і Pixel 2, перш ніж представити свої власні Pixel Visual Core. Це також готові до Hexagon пристрої, які дають найкращі результати завдяки популярним портам Google Camera, які ви можете дослідити тут. Він використовувався в робочих навантаженнях віртуальної та доповненої реальності, відомий як живлення нині неіснуючий Проект Танго на Lenovo Phab 2 Pro і ASUS ZenFone AR. Тим не менш, більшість OEM-виробників, які впроваджують флагманські пристрої Snapdragon, так чи інакше використовують Hexagon DSP для обробки зображень, що можна перевірити за допомогою таких інструментів, як Snapdragon Profiler.

Отже, що нового в новому DSP? Hexagon 690 подвоїв кількість векторних прискорювачів (HVX) з двох до чотирьох, щоб працювати в тандемі з чотирма скалярними потоками, які також мають покращену продуктивність на 20%. Крім того, Hexagon 690 пропонує перший тензорний прискорювач для мобільних пристроїв Hexagon Tensor Accelerator (HTA). Це суттєве доповнення: воно служить апаратним прискоренням для дорогого множення матриць і також інтегрує функції нелінійності (наприклад, sigmoid і ReLU) на апаратному рівні, що ще більше прискорює висновок. Ці зміни в DSP мають бути перетворені на краща продуктивність голосового помічника, від виявлення гарячих слів до синтаксичного аналізу команд на пристрої, пропонуючи, наприклад, покращене придушення відлуння та придушення шуму. Qualcomm наголошує, що вони надають повну гетерогенну обчислювальну платформу, яка дозволяє використовувати робоче навантаження ШІ центральний процесор, графічний процесор або DSP, або будь-яка комбінація трьох блоків – за словами Гарі Бротмана з Qualcomm, це його "більш ніж одне ядро, це більше, ніж апаратне забезпечення, це повна система". Їх «Qualcomm AI Engine» 4-го покоління також виходить за рамки апаратного забезпечення, оскільки ми також знаходимо підтримку Snapdragon Neural Processing SDK і Hexagon NN для доступу вищезгадані блоки, а також Android NN API та популярні фреймворки ML, такі як Caffe/Caffe 2, TensorFlow/Lite та ONNX (відкрита нейронна мережа). Обмін). У сукупності Snapdragon 855 може запропонувати втричі вища продуктивність штучного інтелекту свого попередника (і вдвічі порівняно з Huawei), перевершуючи 7 трильйонів операцій в секунду (ТОП). Однак майте на увазі, що Qualcomm продовжує зосереджуватися на гетерогенних обчислювальних рішеннях, а не на одному виділеному блоці.

Щоб дізнатися більше про Hexagon DSP, перегляньте минулорічний твір детально описуючи, як це допомагає з робочими навантаженнями ШІ.


Підводячи підсумок, можна сказати, що обчислювальний пакет Snapdragon 855 забезпечує деякі з найбільш вражаючих покращень, які ми спостерігали за останні роки. Spectra 380 ISP-CV, про які ми розповідали в окремій статті, також значно підвищує продуктивність і енергоефективність, забезпечуючи чудові нові функції, такі як запис відео 4K 60FPS HDR з портретний режим або заміна фону (дуже гнучко!).

Як пояснюється в цій статті, ці вдосконалення та нові функції мають відчутно відчути себе в роботі користувача. Ми з нетерпінням чекаємо на Qualcomm Snapdragon 855 і незабаром зможемо його детально протестувати, тож слідкуйте за новинами XDA-Developers, щоб отримати останні новини та аналіз Snapdragon 855!