Megérkezett az ARM utasításkészlet-architektúrájának egy évtizede legnagyobb átdolgozása – ARMv9 – az alaplapon található SVE2-vel és egyéb biztonsági funkciókkal.
A mai napon a Vision Day rendezvény részeként az ARM nyilvánosságra hozott néhány részletet az új ARMv9 architektúrájáról, amelyet a vállalat várakozásai szerint ebben az évtizedben több mint 300 milliárd chipben fognak használni.
Az ARM ISA utolsó jelentős változata a v8 volt, amelyet 2011 októberében vezettek be a 64 bites AArch64 utasításkészlettel. Az ARM azonban az évek során új funkciókkal bővítette az ARMv8-at, például a memóriacímkézést az ARMv8.5-ben. Az ARMv9 esetében a cég az továbbra is az AArch64-et használja alapszintű utasításkészletként, de új funkciókkal bővítette a biztonság és a biztonság javítása érdekében. teljesítmény.
Az ARM szerint itt vannak az ARMv9-A architektúra főbb újdonságai:
- SVE2: a skálázható vektorok előnyeinek kiterjesztése sokkal több felhasználási esetre
- Realm Management Extension (RME): a Confidential Compute on Arm platformok kiterjesztése minden fejlesztőre.
- BRBE: profilalkotási információk megadása, például Auto FDO
- Embedded Trace Extension (ETE) és Nyomkövetési puffer kiterjesztés (TRBE): továbbfejlesztett nyomkövetési képességek az Armv9 számára
- TME: hardveres tranzakciós memória támogatása az Arm architektúrához
Ha mélyebbre szeretne merülni az ARMv9-el érkező magas szintű változásokban, azt javaslom, olvassa el Andrei Frumusanu beszámolóját a következő címen: AnandTech, de összefoglalom azokat a legfontosabb változtatásokat, amelyekről tudnia kell.
A NEON-t az SVE2 váltotta fel
A NEON egy fejlett, egyutasításos többszörös adat (SIMD) architektúra kiterjesztés. A SIMD itt egyetlen utasításra vonatkozik, amely több adatelemen párhuzamosan működik. Ezek az adatelemek regiszterekbe vannak rendezve, amelyek bitvektorokat tartalmaznak.
A Scalable Vector Extensions vagy SVE az ARMv8.2 vagy újabb kiterjesztése, amely kiterjeszti a vektorfeldolgozást az AArch64 képessége a nagy teljesítményű számítástechnikai (HPC) feladatok és gépek számítástechnikai követelményeinek kielégítésére tanulás. Fontos, hogy 128 és 2048 bit közötti vektorregiszterhosszúságot is lehetővé tesz. Szoftverfejlesztési szempontból a változó vektorregiszter-hosszúság előnye, hogy a kódot csak egyszer kell lefordítani, hogy teljes mértékben kihasználhassuk a hosszabb vektorregiszterekkel rendelkező jövőbeni CPU-k előnyeit. Hasonlóképpen, ez a kód futtatható kevesebb SIMD-végrehajtási folyamattal rendelkező CPU-kon is, például az IoT-eszközökön.
Mivel az SVE inkább a HPC-munkaterhelésekre irányult, és nem volt olyan sokoldalú utasításkészlet, mint a NEON, az ARM 2019 elején bemutatta az SVE2-t, hogy megoldja ezeket a problémákat. Az SVE2 új utasításokat adott azokra a DSP-munkaterhelésekre vonatkozóan, amelyek továbbra is NEON-ra támaszkodnak. Az ARMv9-cel az SVE2 követi a NEON-t az ARMv9 CPU-k alapfunkciójaként.
A gépi tanulás fejlesztései
Az ARM úgy látja, hogy a következő évtizedben a gépi tanulási terhelések egyre népszerűbbek lesznek, ezért az ARMv8 korábbi verziói új mátrixszorzási utasításokat vezetett be. Ezek az ARMv9 CPU-k alapfunkciói lesznek, lehetővé téve, hogy a kisebb hatókörű ML-munkaterhelések közvetlenül a CPU-n fussanak a dedikált gyorsítók helyett. Nyilvánvalóan az ML munkaterhelések dedikált gyorsítókon való futtatása kívánatos, ha valaki a gyors teljesítményt vagy az energiahatékonyságot részesíti előnyben, de ez nem mindig lehetséges minden hardveren.
Az ARMv9 bizalmas számítási architektúrája
A biztonság javítása érdekében az ARMv9 új bizalmas számítási architektúrát (CCA) vezet be. Mint AnandTech kifejti, az ARM CCA egy elmozdulás a jelenlegi szoftververem-helyzettől, amelyben az eszközön futó biztonságos alkalmazásoknak megbízniuk kell az operációs rendszerben és a hipervizorban, amelyen futnak. A jelenlegi biztonsági modell arra épül, hogy a kiváltságosabb szoftverszintek felügyelhetik a kevésbé privilegizált szoftverszintek végrehajtása, ami problémás lehet, ha az operációs rendszer vagy a hipervizor veszélyeztetett.
A CCA úgy oldja meg ezt a problémát, hogy dinamikusan hoz létre „tartományokat”, amelyek biztonságos, konténeres végrehajtási környezetek, amelyek átlátszatlanok az operációs rendszer vagy a hypervisor számára. A „tartományokon” belüli alkalmazások tanúsíthatják megbízhatóságukat a „tartománymenedzser” előtt, amely kód töredéke egy hipervizor méretének, és amely mostantól kizárólag az erőforrások elosztásáért és ütemezéséért felelős. A "birodalmak" használatának az az előnye, hogy csökken a bizalmi lánc, ami biztonságosságot tesz lehetővé Az alkalmazások bármely eszközön futtathatók, függetlenül az alapul szolgáló operációs rendszertől, amely számára átlátható lesz biztonsági kérdések.
Forrás: ARM. Keresztül: AnandTech.
Alapján AnandTech, az ARM nem részletezte pontosan, hogyan választják el a „tartományokat” az operációs rendszertől és a hipervizortól, de feltételezik, hogy ez a szétválasztás olyan hardverrel támogatott címterekből adódik, amelyekkel nem lehet kölcsönhatásba lépni egymás.
Jövőbeli ARM CPU és GPU tervek
Bár nem kapcsolódik közvetlenül az ARMv9-hez, az ARM megosztotta a jövőbeli v9-alapú CPU-tervek várható teljesítményével kapcsolatos elvárásait. A mobil IP magtervek következő két generációjában az ARM összességében 30%-os IPC teljesítménynövekedést vár. Ez azt jelenti, hogy a tényleges generációs teljesítménynövekedés körülbelül 14%, as AnandTech magyarázza. Nyilvánvaló, hogy a javulás üteme valamelyest lelassult a korábbi évekhez képest.
Láttuk, hogy a Qualcomm, a Samsung és a Huawei CPU-megvalósításai nem érik el a várt teljesítmény-előrejelzéseket új ARM magkialakítások, erre az ARM rámutat egy dián, amely részletezi, hogyan javítható a CPU teljesítménye a memóriaút, a gyorsítótárak vagy a frekvenciák javításával.
Forrás: ARM. Keresztül: AnandTech.
Ennek ellenére az ARMv9 azt ígéri, hogy örvendetes javulást hoz a teljesítmény, a biztonság és a gépi tanulás terén, amikor 2022 elején az ISA-n alapuló új CPU-k kereskedelmi forgalomba kerülnek.
Ami a jövőbeli Mali GPU-kat illeti, az ARM nyilvánosságra hozta, hogy olyan technológiákon dolgozik, mint a változó sebességű árnyékolás (VRS) és a sugárkövetés. Ezek a funkciók népszerűvé váltak a csúcskategóriás PC GPU-hardverek és a videojáték-konzolok kilencedik generációja körében, mint pl. Sony PlayStation 5 és A Microsoft Xbox Series X/S.
Kiemelt képek: ARM via AnandTech