ARM анонсує процесор Cortex-A78, графічний процесор Mali-G78, процесор Ethos N78

click fraud protection

ARM анонсувала архітектуру процесора Cortex-A78, а також графічний процесор Mali-G78. Обидва є наступниками процесора Cortex-A77 і графічного процесора Mali-G77.

У рамках TechDay 2020 компанія ARM зробила три важливі оголошення. Основним оголошенням є програма Cortex-X Custom (CXC), яка містить нове Ядро процесора Cortex-X1. Cortex-X1 забезпечує більш високу пікову продуктивність, ніж будь-який процесор серії Cortex-A, порушуючи при цьому конверт PPA серії Cortex-A. Інші два оголошення ARM були набагато більш рутинними. ЦП Cortex-A78 і Mali-G78 тепер офіційні, і вони діють як наступники Кортекс-А77 ЦП і Малі-G77 ЦП відповідно. Розглянемо ці оголошення одне за одним:

ARM Cortex-A78

З Cortex-A78 основна увага ARM була зосереджена на вимогах до ефективності, таких як вимоги до довшого терміну служби батареї, нові форм-фактори мобільних пристроїв і зменшення площі SoC. Стійка продуктивність є тут ключовим словом для Cortex-A78, тоді як Cortex-X1 прагне до зірок із метою досягнення максимальної короткострокової пікової продуктивності.

ARM стверджує, що Cortex-78 є «найкращим» приводом для високої продуктивності з найкращою в своєму класі ефективністю. Це теж не просто порожні слова. За останні пару років Cortex-A76 і Cortex-A77 продемонстрували найкращу в своєму класі енергоефективність і найкращий у своєму класі PPA (продуктивність, потужність і площа). Вони не мали дизайну, необхідного для конкуренції з чіпами Apple серії A, але через нижчий рівень генерованої електроенергії, їхня енергоефективність була в гіршому випадку такою ж, як у Apple, а в кращому – навіть вищою, ніж Яблуко.

Покращення продуктивності A78 охоплюють випадки використання продуктивності, зв’язку, безпеки та завдань на основі камери, розширених ігор, XR і досвіду на основі ML.

У стабільній продуктивності Cortex-A78 покращує двозначні показники. Він забезпечує 20% покращення стійкої продуктивності в порівнянні зі своїм попередником, Cortex-A77, у тій самій мобільній зоні теплової потужності. AnandTech переглянув цифри та пояснив, що цифра 20% є комбінацією 7% вищого IPC порівняно з A77, тоді як решта 13% приросту продуктивності приписується 5-нм техпроцесу, на якому будуть працювати всі SoC наступного покоління сфабриковані. ARM відзначає важливість сталої продуктивності, кажучи, що мобільні пристрої мають обмежену здатність розсіюють потужність, а стабільна продуктивність дозволяє уникнути обмеження потужності для програм, які потребують багато потужність. Це, у свою чергу, покращує UX, уникаючи затримок або падінь кадрів.

Поштовх до енергоефективності перетворюється на вищу енергоефективність, оскільки ці дві пов’язані, але різні концепції. За даними ARM, у точках високої продуктивності, таких як ті, які є піковими для сучасних мобільних пристроїв, Cortex-A78 забезпечує 50% економії енергії порівняно з пристроями 2019 року. при однаковій продуктивності як Cortex-A77. Це вражає, і це робить A78 найбільш енергоефективним процесором Cortex-A, який коли-небудь створював ARM.

Зосередження ARM на стабільній продуктивності принесе користь наступній хвилі мобільних інновацій, таких як нові форм-фактори (складні телефони), а також покращене «цифрове занурення» через 5G. Перевірка реальності полягає в тому, що це не так для нинішнього покоління, і це не матиме великого значення навіть у наступному поколінні.

Одним із варіантів використання, який буде покращено завдяки Cortex-A78, є мобільні ігри AAA у поєднанні з власним новим графічним процесором Mali-G78 від ARM. Поєднання цих двох націлене на те, щоб забезпечити високоякісні ігрові враження на мобільних пристроях. Їх більша продуктивність у поєднанні з високою швидкістю 5G і високою пропускною спроможністю дозволить грати преміум-класу на мобільних пристроях. Ефективність A78 тут має перевагу, оскільки він забезпечить довший час автономної роботи для тривалих ігор. ARM заявляє, що також працює з екосистемою для подальшого підвищення продуктивності та створення більш багатих ігрових вражень, і наводить приклад своєї роботи з Unity, щоб перенести Burst Compiler на Android.

Продуктивність машинного навчання (ML) є ще одним пріоритетом для ARM. Центральний процесор є процесором першого вибору для обчислень ML на мобільних пристроях, хоча сьогодні висококласні системи на системі процесора постачаються з окремими блоками нейронної обробки (NPU). Процесори ARM підтримують найпопулярніші реальні програми ML і сценарії використання на смартфонах, такі як фільтри соціальних мереж, диктування, безпека та безпека. Cortex-A78 споживає в середньому на 8% менше енергії для завдань на основі ML порівняно з A77, що призводить до 10% офіційного підвищення ефективності.

ARM Cortex-A78 - Архітектура

ARM Cortex-A78 має ту саму архітектуру, що й попереднє покоління (це все ще ядро ​​ARM v8.2). Однак ARM додав мікроархітектурні функції, спрямовані на підвищення продуктивності за площею та енергоефективністю. ARM економить площу та енергію, зберігаючи необхідні рівні продуктивності. Знову ж таки, ARM зосереджена на серії Cortex-A, як і раніше, на площі та енергоефективності, а не на максимальній продуктивності, яку зараз виконує програма Cortex-X.

Покращення продуктивності Cortex-A78 забезпечується завдяки додатковим мікроархітектурним функціям, які оптимізують ширину та глибину. Ширина декодування інструкцій залишається на рівні 4 ширини, як у A77 та A76. (З іншого боку, ширина декодування Cortex-X1 становить 5, тоді як A13 має ширину декодування 7.) ARM додав покращене передбачення розгалужень для пропускної здатності та точності, а також випадки злиття інструкцій. Ці архітектурні вдосконалення дозволяють на 7% збільшити однопотокову продуктивність порівняно з A77.

Ефективність була максимізована завдяки зменшенню структур, які мають низьку продуктивність і площу, наприклад у кешах L1-I та L1-D. ARM оптимізував існуючі структури, щоб споживати менше енергії, наприклад, структури прогнозування бренду. ARM каже, що це призводить до 4% меншої продуктивності на мВт і на 5% меншої площі продуктивності на мм2 порівняно з A77.

A78 зосереджується на стабільній продуктивності з найкращою в своєму класі ефективністю на рівні кластера. Кластер DynamIQ із 4 процесорів Cortex-A77 і 4 процесорів Cortex-A55 можна оновити до 4 ядер A78 і 4 ядер A55. Це забезпечує стійке підвищення продуктивності на 20% на 15% меншій площі. Додатки, які вимагають паралельного виконання декількох високопродуктивних потоків, наприклад ігри з високою точністю, виграють завдяки постійному підвищенню продуктивності.

ARM відзначає, що підвищена ефективність зони кластера A78 DynamIQ робить його ідеальним для складних телефонів і кількох і більших дисплеїв. Інша увага приділяється підготовці смартфонів до 5G завдяки покращенню продуктивності та енергоспоживання. 5G нібито забезпечує «набагато більшу швидкість», «набагато меншу затримку» та «набагато швидше та повсюдне підключення для мобільних пристроїв для програм із високою пропускною здатністю». Це може статися через кілька років, але наразі більшість цих переваг непомітні для кінцевих споживачів.

Загалом, Cortex-A78 — надійний продукт. Флагманські SoC наступного покоління включатимуть кілька ядер A78, які доповнюватимуть одне ядро ​​Cortex-X1, яке має вищі вимоги до потужності та площі, а деякі цінно-орієнтовані SoC навіть вирішать пропустити Cortex-X1 повністю. Для ринку SoC середнього класу A78 буде обраним ядром процесора для SoC 2021 року, і його акцент на стабільній продуктивності вітається.


ARM Mali-G78

Серія графічних процесорів Mali від ARM, м’яко кажучи, не була настільки успішною, як серія процесорів Cortex. Рік за роком графічні процесори Mali стабільно перевершують як за продуктивністю, так і за енергоефективністю користувацькі графічні процесори Apple і користувацькі графічні процесори Adreno від Qualcomm. Минулорічний запуск нової архітектури Valhall і графічного процесора Mali-G77, на жаль, нічого не змінив. Системи на процесорі з Mali-G77 включали Exynos 990 і MediaTek Dimensity 1000L відповідно. Обидва, на жаль, мали слабкі реалізації, що означало, що продуктивність їх GPU може не конкурує з графічним процесором Adreno 650 від Qualcomm, не кажучи про провідні в своєму класі графічні процесори Apple в Apple A12 і A13. Mali відставав роками, і його вдосконалень було недостатньо, щоб змінити статус-кво у сфері мобільних GPU.

Тим не менш, ARM є нічим іншим, як оптимістичним. Він зазначає, що його партнери постачають понад один мільярд графічних процесорів Mali щорічно, що робить Mali номер один у світі. Імовірно, це число лише зросте, оскільки багато різних типів пристроїв дають можливість використовувати інтенсивну графіку, наприклад розширені мобільні ігри та XR (VR та AR). Згідно з ARM, це робить Mali найбільш широко використовуваним GPU для мобільної розробки в екосистемі.

ARM зазначає, що у 2019 році анонсувала свій перший GPU на основі архітектури Valhall – Mali-G77. У 2020 році на зміну G77 прийде Mali-G78, який також базується на архітектурі Valhall. Хоча ARM каже, що це найпродуктивніший графічний процесор для мобільних пристроїв преміум-класу на сьогоднішній день, цифри цього не підтверджують, незважаючи на те, що ARM іронічно говорить про те, що це факт, підтверджений цифрами. G78 покращує продуктивність на 25% порівняно з G77, що, м’яко кажучи, небагато. Розрив у максимальній продуктивності графічного процесора між G77 і графічним процесором Apple A13 був значним, що означає, що G78 не зможе наздогнати A13, не кажучи вже про майбутній графічний процесор Apple A14. Qualcomm також залишатиметься на крок попереду завдяки власним поступовим покращенням продуктивності.

Картинна графіка, що змінює правила гри, і цілий день ігор на мобільних пристроях уже можливі на інших графічних процесорах, тому маркетинг ARM тут виглядає трохи пустим.

За словами ARM, Mali-G78 створено з урахуванням розробників і кінцевих користувачів. Це забезпечує високоякісні мобільні ігри завдяки консольним іграм, які тепер доступні на мобільних пристроях. G78 забезпечує довший термін служби батареї для мобільних пристроїв преміум-класу. Це також приносить додатковий приріст продуктивності ML для більш складних ігор, відео, камери, безпеки ML функцій на мобільних пристроях.

ARM позитивно оцінює перспективи мобільних ігор. У 2019 році мобільні ігри займали понад 46% світового ринку ігор, досягнувши доходу в 68,2 мільярда доларів. Він також збирається продовжувати розвиватися протягом наступних кількох років, оскільки він випереджатиме як комп’ютерні, так і консольні ігри. На мобільні пристрої з’являється більше ігор преміум-класу, і користувачі очікують подібного досвіду на мобільних пристроях, ніж на консолях.

Щоб зробити ці враження можливими, Mali-G78 має необхідне підвищення продуктивності. Його щільність продуктивності для ігрового вмісту покращена на 15% порівняно з G77. Для такої ж площі, як і попереднє покоління, G78 забезпечить більшу продуктивність. Це підвищення стало можливим завдяки чотирьом ключовим характеристикам:

  • Підтримка до 24 ядер
  • Асинхронний верхній рівень
  • Покращення плиточника
  • Покращене відстеження залежностей фрагментів

У той час як максимальна кількість ядер у G77 становила 16, ARM збільшила максимальну кількість ядер у G78 до 24 ядер. Звичайно, те, що існує максимум, не означає, що постачальники мобільних чіпів дійсно включатимуть 24 ядра. Найширший варіант ядра G77, який ми бачили досі, — це Mali-G77MP11 на Exynos 990, тоді як Dimensity 1000 має Mali-G77MC9.

ARM вважає, що Asynchronous Top Level є функцією, що змінить гру для продуктивності GPU. Кажуть, що це вичавлює якомога більше продуктивності з мобільних ігор, забезпечуючи максимальну продуктивність.

З іншого боку, вдосконалення Tiler додають мобільним іграм додатковий рівень якості. Ігри, перенесені з ПК і консолей, часто мають надзвичайно складні ресурси та складні сцени, які спричиняють проблеми з продуктивністю та вузькі місця. Удосконалення тайлера зменшують вершинне навантаження на GPU для цих складних сцен і ресурсів. Це покращує продуктивність для складного ігрового контенту, схожого на консоль.

ARM також покращила відстеження залежності фрагментів на G78. Особливо це стосується мобільних ігор зі складними ігровими сценами, пов’язаними з димом, деревами та травою. Результати свідчать про те, що продуктивність ARM у кращих мобільних іграх зросла на 17% порівняно з G77.

Mali-G78 має на 10% кращу енергоефективність, ніж його попередник. Знову ж таки, цього буде недостатньо, щоб наздогнати ні Qualcomm, ні Apple. Цілі ARM тут здаються особливо консервативними. Функція Asynchronous Top Level відіграє важливу роль у забезпеченні енергоефективності, оскільки дозволяє зменшити споживання електроенергії, таким чином дозволяючи генерувати контент екологічно. Таким чином, коли пристрій виводить вміст із бажаною частотою кадрів, він може зменшити частоту для економії енергії. Підвищення верхнього рівня для цього завдання споживає трохи більше енергії, але енергозбереження від зменшення частоти ядер шейдерів набагато більше. Це тому, що шейдерні ядра використовують 90-95% енергетичного бюджету GPU.

Краща енергоефективність у G78 також досягається завдяки Fused multiply-add (FMA). Він був повністю перероблений з нуля, що призвело до 30% зниження споживання електроенергії. Модуль FMA відповідає за більшість обчислень, які відбуваються всередині графічного процесора, і тому для ARM було доцільно націлити його на скорочення енергії.

Можливість паралельної обробки даних GPU робить його придатним для виконання робочих навантажень ML, хоча ARM визнає, що CPU та GPU залишаються основними процесорами для ML. Оскільки випадки використання стають складнішими, деякі робочі навантаження будуть перевантажені на GPU. Основні сценарії використання графічного процесора ML пов’язані з функціями безпеки на пристрої, різними режимами камери та відео, а також програмами з функціями AR.

Роль машинного навчання на графічному процесорі забезпечує такі можливості, як відстеження обличчя в фото- чи відеорамці, ігри, які використовують функції AR, тощо. Для виконання цих завдань на основі ML Mali-G78 має середнє підвищення продуктивності на 15% для різних робочих навантажень ML порівняно з G77. G77 покращив продуктивність ML на 60% у порівнянні з попередніми поколіннями, тому цього року покращення порівняно з минулим роком набагато менше. Асинхронний верхній рівень життєво важливий для підвищення продуктивності ML, оскільки тактова частота ядер шейдерів допомагає з різними варіантами використання ML на GPU.

Крім того, є анонс Mali-G68. Це не що інше, як вужчий варіант Mali-G78, так само як Mali-G57 був вужчим варіантом Mali-G77. ARM каже, що це перший GPU Mali для пристроїв 2021 року невисокого класу. Він має всі функції G78, такі як покращення плитки та новий блок FMA у системі виконання, але підтримує до 6 ядер замість 24. Практична продуктивність за нижчою ціною є метою цього GPU.

ARM розробила цей рівень GPU суб-преміум-класу, вислухавши відгуки партнерів, які бажали преміум-функцій у своєму портфоліо пристроїв. G68 має меншу площу кремнію, як і очікувалося, і надає високопродуктивні ігри ширшій аудиторії розробників і споживачів.

Нарешті, ARM згадує про партнерство з розробниками. Це дозволяє розробникам легко оптимізувати свій вміст для кращої роботи на графічних процесорах Mali (теоретично). Одним із прикладів є Performance Advisor. По-друге, це співпраця ARM з Unity для впровадження пакетного компілятора. Подробиці про це можна прочитати у вихідній статті.

Mali-G78 - Outlook

Прогноз для Mali-G78 похмурий. Схоже, що ARM просто не зацікавлена ​​в суттєвому покращенні продуктивності з року в рік у тій самій формі, що робить Apple, у тій же формі, що Qualcomm робила в минулому. Хоча темпи вдосконалення Qualcomm також уповільнилися, його базовий рівень перебуває вище, ніж ARM. Виглядає погано для екосистеми Android, коли рецензенти стверджують числові докази того, що стабільна продуктивність графічного процесора A13 вища, ніж пікова продуктивність Snapdragon 865. Розбіжність у продуктивності графічних процесорів Apple і Android зростає, і вона лише зростає.

G78, таким чином, не є магічним рішенням для вирішення проблем ARM Mali GPU і виведення їх на вершину графіків продуктивності. Він як і раніше буде нижче графічних процесорів Apple і Qualcomm. Це буде вибір за умовчанням для деяких SoC просто тому, що це стандартна IP-адреса графічного процесора ARM, а спеціальні рішення мають бар’єри для входу та коштують дорожче, ніж Ну.

Наступного року сумнівно, чи Samsung Systems LSI дійсно використовуватиме Mali-G78. Samsung був відомим клієнтом графічних процесорів Mali, але минулого року вона підписала партнерство з AMD, щоб представити архітектуру GPU RDNA до своїх мобільних SoC у 2021 році. Якщо ця дорожня карта буде відповідати плану — а на даний момент у нас немає підстав підозрювати, що він не відповідає плану — тоді наступник Exynos 990 матиме графічний процесор AMD RDNA замість графічного процесора Mali. Це справді буде великою втратою дизайну для ARM. Навіть інші постачальники, такі як MediaTek, сьогодні мають більше можливостей. Новинка Imagination Technologies Архітектура GPU серії A має проектну ціль для вищої продуктивності, ніж у G78, і цілком можливо, що MediaTek у майбутньому відмовиться від Mali. У Qualcomm, звичайно, немає причин відмовлятися від своїх зусиль Adreno GPU, які все ще залишаються найкращий у своєму класі з точки зору продуктивності та ефективності, якщо говорити виключно про Android ринок смартфонів.

Таким чином, зрозуміло, що ARM буде потрібно збільшити швидкість щорічного вдосконалення графічних процесорів Mali, щоб реально змінити ринок мобільних графічних процесорів. Якщо він не зможе цього зробити, він зіткнеться з ризиком залишитися заднім числом у просторі флагманських мобільних графічних процесорів преміум-класу.


ARM Ethos N78

Нарешті, ARM також анонсувала блок нейронної обробки (NPU) Ethos N78. Це наступник N77 NPU. Він забезпечує більші можливості ML на пристрої та на 25% більшу продуктивність. Можливість налаштування також є перевагою, оскільки доступні конфігурації варіюються від 1 TOP/s до 10 TOP/s. Щоб дізнатися більше, перевірте Повідомлення в блозі ARM. Цей NPU, ймовірно, матиме обмежені дизайнерські переваги, оскільки Qualcomm, Samsung, HiSilicon і MediaTek мають власні блоки нейронної обробки/системи штучного інтелекту.


Джерела: АРМ (1, 2), AnandTech (1, 2)