Най-голямата ревизия на архитектурата на ARM от десетилетие е тук - ARMv9 - с вграден SVE2 и други функции за сигурност.
По-рано днес, като част от събитието Vision Day, ARM разкри някои подробности за новата си архитектура ARMv9, която компанията очаква да бъде използвана в над 300 милиарда чипа през това десетилетие.
Последната голяма ревизия на ISA на ARM беше v8, която беше въведена през октомври 2011 г. с 64-битов набор от инструкции AArch64. Въпреки това, ARM разшири ARMv8 през годините с нови функции като маркиране на паметта в ARMv8.5. С ARMv9 компанията е продължава да използва AArch64 като базов набор от инструкции, но го разшири с нови функции, насочени към подобряване на сигурността и производителност.
Според ARM, ето основните нови характеристики на архитектурата ARMv9-A:
- SVE2: разширяване на предимствата на мащабируемите вектори за много повече случаи на употреба
- Разширение за управление на сфера (RME): разширяване на Confidential Compute on Arm платформи за всички разработчици.
- БРБЕ: предоставяне на информация за профилиране, като Auto FDO
- Вградено разширение за проследяване (ETE) и Разширение на буфер за проследяване (TRBE): подобрени възможности за проследяване за Armv9
- TME: поддръжка на хардуерна транзакционна памет за архитектурата Arm
За по-задълбочено потапяне в промените на високо ниво, идващи с ARMv9, препоръчвам да прочетете репортажа на Андрей Фрумусану на AnandTech, но ще предоставя резюме на основните промени, за които трябва да знаете.
NEON е наследен от SVE2
NEON е усъвършенствано разширение на архитектурата с множество данни (SIMD) с една инструкция. SIMD тук се отнася до единична инструкция, работеща паралелно върху множество елементи от данни. Тези елементи от данни са организирани в регистри, които съдържат вектори от битове.
Scalable Vector Extensions или SVE е разширение към ARMv8.2 или по-нова версия, което разширява векторната обработка способността на AArch64 да отговаря на изчислителните изисквания на високопроизводителни изчислителни задачи (HPC) и машина изучаване на. Важно е, че той също така позволява дължини на векторни регистри между 128 до 2048 бита. От гледна точка на разработката на софтуер, предимството на променливата дължина на векторния регистър е, че кодът трябва да се компилира само веднъж, за да се възползва напълно от бъдещите процесори с по-дълги векторни регистри. По същия начин този код може да се изпълнява и на процесори с по-малко SIMD изпълнителни тръбопроводи, като тези в IoT устройства.
Тъй като SVE беше насочен повече към HPC работни натоварвания и също така не беше толкова гъвкав набор от инструкции като NEON, ARM представи SVE2 в началото на 2019 г., за да се справи с тези проблеми. SVE2 добави нови инструкции, насочени към DSP работни натоварвания, които все още разчитат на NEON. Сега с ARMv9, SVE2 наследява NEON като базова характеристика на процесорите ARMv9.
Подобрения в машинното обучение
ARM вижда натоварванията за машинно обучение да стават все по-популярни през следващото десетилетие, ето защо предишни ревизии на ARMv8 въведе нови инструкции за умножение на матрици. Това ще бъдат базови характеристики на процесорите ARMv9, позволяващи натоварванията на ML с по-малък обхват да се изпълняват директно на процесора, а не на специални ускорители. Очевидно е желателно да се изпълняват ML работни натоварвания на специални ускорители, когато човек предпочита висока производителност или енергийна ефективност, но не винаги е възможно да се направи това на целия хардуер.
Поверителната изчислителна архитектура на ARMv9
В опит да подобри сигурността, ARMv9 въвежда нова конфиденциална изчислителна архитектура (CCA). Като AnandTech обяснява, CCA на ARM е отклонение от текущата ситуация със софтуерен стек, при която защитените приложения, работещи на устройство, трябва да се доверят на операционната система и хипервайзора, на които работят. Настоящият модел на сигурност се основава на факта, че по-привилегированите нива на софтуер могат да наблюдават изпълнение на по-малко привилегировани софтуерни нива, което може да бъде проблематично, когато операционната система или хипервайзорът са компрометиран.
Как CCA коригира този проблем е чрез динамично създаване на "сфери", които са сигурни, контейнеризирани среди за изпълнение, които са непрозрачни за операционната система или хипервайзора. Приложенията в рамките на „сфери“ могат да удостоверят надеждността си пред „мениджър на области“, код, който е малка част от размера на хипервайзор, който сега е единствено отговорен за разпределението на ресурсите и планирането. Ползата от използването на "сфери" е, че веригата на доверие е намалена, което позволява сигурност приложенията да се изпълняват на всяко устройство, независимо от основната операционна система, която ще бъде прозрачна проблеми със сигурността.
Източник: ARM. Чрез: AnandTech.
Според AnandTech, ARM не уточнява точно как "сферите" са отделени от операционната система и хипервайзора, но те спекулират, че това разделяне произтича от хардуерно поддържани адресни пространства, които не могат да взаимодействат с взаимно.
Бъдещи дизайни на ARM CPU и GPU
Въпреки че не е пряко свързано с ARMv9, ARM сподели прогнозните си очаквания за производителност за бъдещи дизайни на процесори, базирани на v9. През следващите две поколения дизайни на мобилни IP ядра, ARM очаква съвкупност от 30% печалби в IPC производителността. Това означава, че действителното увеличение на производителността за поколенията възлиза на около 14%, както AnandTech обяснява. Очевидно темпът на подобрение се е забавил донякъде в сравнение с предходни години.
Видяхме как внедренията на CPU от компании като Qualcomm, Samsung и Huawei не достигат очакваните прогнози за производителност на нови дизайни на ядрото на ARM, факт, който ARM посочва в слайд, който подробно описва как производителността на процесора може да бъде подобрена чрез подобряване на пътя на паметта, кеш паметта или честотите.
Източник: ARM. Чрез: AnandTech.
Все пак ARMv9 обещава да донесе добре дошли подобрения в производителността, сигурността и машинното обучение, когато новите процесори, базирани на ISA, се доставят в търговски устройства в началото на 2022 г.
Що се отнася до бъдещите графични процесори на Mali, ARM разкри, че работи върху технологии като засенчване с променлива скорост (VRS) и проследяване на лъчи. Тези функции станаха популярни сред хардуера на GPU за компютри от висок клас и деветото поколение конзоли за видеоигри, като напр. PlayStation 5 на Sony и Xbox Series X/S на Microsoft.
Кредити за представени изображения: ARM чрез AnandTech