Największa od dekady aktualizacja architektury zestawu instrukcji firmy ARM jest już dostępna – ARMv9 – z wbudowanym SVE2 i innymi funkcjami bezpieczeństwa.
Dzisiaj rano w ramach wydarzenia Vision Day firma ARM ujawniła pewne szczegóły na temat swojej nowej architektury ARMv9, która, jak oczekuje firma, zostanie wykorzystana w tej dekadzie w ponad 300 miliardach chipów.
Ostatnią poważną wersją ISA ARM była wersja 8, która została wprowadzona w październiku 2011 roku z 64-bitowym zestawem instrukcji AArch64. Jednak przez lata ARM rozszerzył ARMv8 o nowe funkcje, takie jak tagowanie pamięci w ARMv8.5. Dzięki ARMv9 firma jest nadal używa AArch64 jako podstawowego zestawu instrukcji, ale rozszerzył go o nowe funkcje mające na celu poprawę bezpieczeństwa i wydajność.
Według ARM oto najważniejsze nowe funkcje architektury ARMv9-A:
- SVE2: rozszerzenie korzyści skalowalnych wektorów na znacznie więcej przypadków użycia
- Rozszerzenie zarządzania obszarami (RME): rozszerzenie poufnych obliczeń na platformach ARM na wszystkich programistów.
- BRBE: dostarczanie informacji profilujących, takich jak Auto FDO
- Wbudowane rozszerzenie śledzenia (ETE) I Rozszerzenie bufora śledzenia (TRBE): ulepszone możliwości śledzenia dla Armv9
- TME: sprzętowa obsługa pamięci transakcyjnej dla architektury ARM
Aby głębiej zagłębić się w zmiany na wysokim poziomie, które nadejdą wraz z ARMv9, polecam przeczytać raport Andrei Frumusanu pod adresem AnandTech, ale przedstawię podsumowanie kluczowych zmian, o których warto wiedzieć.
NEON zastąpiony przez SVE2
NEON to zaawansowane rozszerzenie architektury z pojedynczą instrukcją i wieloma danymi (SIMD). SIMD odnosi się tutaj do pojedynczej instrukcji działającej równolegle na wielu elementach danych. Te elementy danych są zorganizowane w rejestry przechowujące wektory bitów.
Scalable Vector Extensions (SVE) to rozszerzenie ARMv8.2 lub nowszego, które rozszerza przetwarzanie wektorów możliwości AArch64 w celu spełnienia wymagań obliczeniowych zadań i maszyn o wysokiej wydajności obliczeniowej (HPC). uczenie się. Co ważne, pozwala również na długości rejestrów wektorowych od 128 do 2048 bitów. Z punktu widzenia rozwoju oprogramowania zaletą zmiennej długości rejestrów wektorowych jest to, że kod wystarczy skompilować tylko raz, aby w pełni wykorzystać przyszłe procesory z dłuższymi rejestrami wektorowymi. Podobnie kod ten można również uruchomić na procesorach z mniejszą liczbą potoków wykonawczych SIMD, takich jak te w urządzeniach IoT.
Ponieważ SVE był bardziej ukierunkowany na obciążenia HPC i nie był tak wszechstronnym zestawem instrukcji jak NEON, ARM wprowadził SVE2 na początku 2019 r., aby rozwiązać te problemy. SVE2 dodało nowe instrukcje dotyczące obciążeń DSP, które nadal opierają się na NEON. Teraz, dzięki ARMv9, SVE2 zastępuje NEON jako podstawową funkcję procesorów ARMv9.
Ulepszenia uczenia maszynowego
ARM przewiduje, że w następnej dekadzie obciążenia związane z uczeniem maszynowym będą coraz bardziej popularne i dlatego właśnie poprzednie wersje ARMv8 wprowadzono nowe instrukcje mnożenia macierzy. Będą to podstawowe funkcje procesorów ARMv9, umożliwiające uruchamianie obciążeń ML o mniejszym zakresie bezpośrednio na procesorze zamiast na dedykowanych akceleratorach. Oczywiście uruchamianie obciążeń ML na dedykowanych akceleratorach jest pożądane, gdy preferuje się dużą wydajność lub energooszczędność, ale nie zawsze jest to możliwe na każdym sprzęcie.
Poufna architektura obliczeniowa ARMv9
Aby poprawić bezpieczeństwo, ARMv9 wprowadza nową architekturę poufnych obliczeń (CCA). Jak AnandTech wyjaśnia, CCA firmy ARM oznacza odejście od obecnej sytuacji stosu oprogramowania, w której bezpieczne aplikacje działające na urządzeniu muszą ufać systemowi operacyjnemu i hypervisorowi, na którym działają. Obecny model bezpieczeństwa opiera się na fakcie, że bardziej uprzywilejowane poziomy oprogramowania mogą monitorować wykonywanie mniej uprzywilejowanych warstw oprogramowania, co może być problematyczne w przypadku systemu operacyjnego lub hiperwizora skompromitowany.
CCA rozwiązuje ten problem poprzez dynamiczne tworzenie „dziedzin”, czyli bezpiecznych, kontenerowych środowisk wykonawczych, nieprzezroczystych dla systemu operacyjnego lub hiperwizora. Aplikacje w „dziedzinach” mogą poświadczyć swoją wiarygodność „menedżerowi dziedzin”, czyli kodowi stanowiącemu ułamek wielkości hiperwizora, który jest teraz wyłącznie odpowiedzialny za alokację zasobów i planowanie. Zaletą korzystania z „dziedzin” jest ograniczenie łańcucha zaufania, co pozwala na bezpieczeństwo aplikacje, które można uruchamiać na dowolnym urządzeniu, niezależnie od systemu operacyjnego, dla którego będą niewidoczne Problemy z bezpieczeństwem.
źródło: ARM. Przez: AnandTech.
Według AnandTech, ARM nie szczegółowo opisał, w jaki sposób „dziedziny” są oddzielone od systemu operacyjnego i hiperwizora, ale tak spekulują, że ta separacja wynika z przestrzeni adresowych wspieranych sprzętowo, z którymi nie można wchodzić w interakcję nawzajem.
Przyszłe projekty procesorów i procesorów graficznych ARM
Chociaż nie jest to bezpośrednio związane z ARMv9, ARM podzieliło się przewidywanymi oczekiwaniami dotyczącymi wydajności dla przyszłych projektów procesorów opartych na wersji 9. W ciągu następnych dwóch generacji projektów rdzeni mobilnych IP ARM spodziewa się łącznie wzrostu wydajności IPC o 30%. Oznacza to, że faktyczny wzrost wydajności pokoleniowej wynosi około 14%, as AnandTech wyjaśnia. Wyraźnie widać, że tempo poprawy nieco spadło w porównaniu do lat poprzednich.
Widzieliśmy, jak wdrożenia procesorów przez firmy takie jak Qualcomm, Samsung i Huawei nie osiągają oczekiwanych prognoz wydajności nowych projektów rdzeni ARM, fakt, który ARM wskazuje na slajdzie szczegółowo opisującym, w jaki sposób można poprawić wydajność procesora poprzez poprawę ścieżki pamięci, pamięci podręcznej lub częstotliwości.
źródło: ARM. Przez: AnandTech.
Mimo to ARMv9 obiecuje przynieść pożądane ulepszenia wydajności, bezpieczeństwa i uczenia maszynowego, gdy nowe procesory oparte na ISA zostaną wprowadzone do urządzeń komercyjnych na początku 2022 roku.
Jeśli chodzi o przyszłe procesory graficzne Mali, ARM ujawnił, że pracuje nad technologiami takimi jak cieniowanie o zmiennej szybkości (VRS) i śledzenie promieni. Funkcje te stały się popularne wśród wysokiej klasy sprzętu GPU do komputerów PC i konsol do gier wideo dziewiątej generacji, takich jak PlayStation 5 firmy Sony I Xbox Series X/S firmy Microsoft.
Autorzy wyróżnionych obrazów: ARM via AnandTech