ARM oznamuje jádro CPU Cortex-A77 s 20-35% zlepšením výkonu

Společnost ARM oznámila jádro CPU Cortex-A77. Jedná se o nástupce loňského Cortex-A76 a přináší 20-35% zlepšení výkonu.

Na každoroční akci TechDay společnosti ARM oznámila společnost ARM jádro CPU Cortex-A77. Oznámení Cortex-A77 přichází spolu s oznámením GPU ARM Mali-G77, což je první GPU, který má zcela novou architekturu GPU „Valhall“. Společně tyto dva produkty uspěly v loňském roce CPU Cortex-A76 a GPU Mali-G76.

Britská společnost ARM, kterou v roce 2016 koupila japonská Softbank, je jednou z nejdůležitějších společností v technologickém průmyslu. Každý smartphone na světě je poháněn instrukční sadou ARM. Qualcomm používá částečně zakázkovou licenci „Made for Cortex“, která společnosti umožňuje začlenit přizpůsobené varianty IP CPU společnosti ARM v jejích produktech (například Kryo 485 Gold je polozakázková varianta Cortex-A76). skupina HiSilicon společnosti Huawei byl další významný držitel licence na IP CPU ARM, používající sériové verze jader CPU ARM, zatímco Samsung Systems LSI a Apple používají plně vlastní jádra nad instrukční sadou ARM. Samsung a HiSilicon také licencují GPU Mali Mali od ARM pro své vlastní SoC, zatímco Qualcomm a Apple se rozhodnou použít svá vlastní řešení GPU (například Qualcomm používá vlastní GPU Adreno).

To je důvod, proč když ARM učiní nové oznámení, má to významný dopad na průmysl chytrých telefonů. Dobrou zprávou je, že ARM je již nějakou dobu v kurzu, pokud jde o vytváření nových mikroarchitektur CPU. Cortex-A72, Cortex-A73 a Cortex-A75 byly všechny úctyhodné návrhy, které kompenzovaly chyby Cortex-A57. Loňský Cortex-A76 však udělal z hlediska výkonu o krok dále, protože sliboval „výkon třídy notebooků“ s 35% zlepšením výkonu oproti již schopnému Cortex-A75. v souladu s tím Qualcomm slíbil 45% zlepšení výkonu u Snapdragonu 855největší výkonnostní nárůst ze všech Snapdragon SoC v historii.

Cortex-A76 byl vysoce výkonný v oblasti IPC, PPA a účinnosti. Měl nejlepší PPA v oboru s malou velikostí oblasti matrice. Těžilo z vynikajícího 7nm FinFET procesu TSMC, ale také se podepsala vylepšení IPC, která přinesla. Podařilo se mu překonat vlastní jádro Samsung Exynos M3 v Exynos 9810, přestože má užší šířku dekódování (4-široký vs. 6-široký). I letošní vydání jádra Exynos M4 v Exynos 9820 nestačilo k tomu, aby získalo výkonnostní výhodu ARM (ačkoli to zacelilo mezeru), protože Cortex-A76 stále má výhodu ve výkonu a efektivitě přes Exynos M4. (Exynos byl také zklamán horším výrobním procesem: 8nm LPP vs. 7nm FinFET). Zejména energetická účinnost Cortex-A76 byla shledána neuvěřitelnou. SoC využívající Cortex-A76 zahrnují vlajkové SoC, jako je např HiSilicon Kirin 980 a Qualcomm Snapdragon 855, ale také jsme jej začali vidět u SoC střední třídy ve formě Qualcomm Snapdragon 675 a Snapdragon 730/730G. Dopad na výkon byl účinný.

V mobilním prostoru je Cortex-A76 stále horší než vlastní jádra Apple, jak je vidět na Apple A11 a Apple A12, pokud jde o instrukce na takt (IPC). ARM však neprokázal žádné známky zpomalení tempa zlepšování. V srpnu společnost představila svůj plán jádra CPU s jádrem „Deimos“ pro rok 2019 a jádrem „Hercules“ pro rok 2020, oba založené na Cortex-A76. Působivé je, že společnost slíbila 20-25% zlepšení výkonu CAGR každý rok s každou novou čipovou sadou v rodině jader Austin. ARM se žene vpřed.

Cortex-A77 je jádro CPU „Deimos“ a bude se vydávat na konec roku 2019 a začátek roku 2020 vlajková loď SoC. Je to evoluce Cortex-A76 a je to druhá iterace jádra Austin rodina. CPU je přímým mikroarchitektonickým nástupcem A76 a většina jeho základních funkcí je stejná. Prodejci budou moci upgradovat SoC IP bez velkého úsilí. Pokud jde o architekturu, zůstává to jádro CPU ARM v8.2, které má být spárováno s „malým“ jádrem Cortex-A55 namísto clusteru DynamIQ Shared Unit (DSU).

Velikosti mezipaměti Cortex-A77 jsou: 64 KB L1 instrukční a datové mezipaměti, 256 a 512 KB L2 cache a až 4 MB sdílené L3 cache. Zlepšení výkonu budou muset pocházet z mikroarchitektonických vylepšení, protože se neočekává, že frekvence jádra změna (ARM stále cílí na 3 GHz jako A76, ale stejně jako u A76 je pravděpodobné, že uvidíme návrhy dodavatelů s nižším taktem jádra). Neočekává se, že vylepšení procesů pro příští generaci SoC budou tak zásadní jako v roce 2018. (TSMC letos přešlo na 7nm EUV proces, který bude pravděpodobně základem příštích čipových sad Kirin a Snapdragon.)

Cortex-A77 má proto vylepšenou mikroarchitekturu, která má za následek 20%-35% zlepšení výkonu. A76 se lišil od svých předchůdců z hlediska architektury a měl sloužit jako a základní linie pro další dva návrhy v rodině jader Austin: Cortex-A77 v roce 2019 a „Hercules“ v roce 2020.

Primárními cíli ARM bylo zvýšit IPC architektury a také se nadále zaměřovat na poskytování nejlepších PPA (výkon, výkon a oblast) v oboru. Velikost plochy a výhody energetické účinnosti A76 zůstanou výhodami pro A77.

Pokud jde o mikroarchitekturu, ARM se hodně změnil. Na front-endu má jádro vyšší načítací šířku pásma se zdvojnásobením schopnosti prediktoru značky, nový makro-OP struktura mezipaměti fungující jako mezipaměť instrukcí L0, nový kanál ALU s celočíselnou hodnotou a přepracované fronty načítání/ukládání a problém schopnost. V závěsu jsou také dynamické optimalizace kódu, které jsou podrobně vysvětleny v příspěvku na blogu ARM. Šířka dekódování zůstává na 4-šířce.

Back-end jádra také obsahuje vylepšení a uživatelům doporučuji přečíst AnandTech's Dosah pro mnohem více detailů. ARM přidal další celé číslo ALU. Vylepšeny byly také prefetchery dat, což je dobrá zpráva vzhledem k tomu, že A76 již měl vynikající prefetchery podle AnandTech. Pro zlepšení přesnosti předběžného načítání byly přidány nové další moduly předběžného načítání. To vše souvisí s paměťovým subsystémem jádra, což je zásadní aspekt. Paměťový subsystém CPU se skládá z latence paměti a šířky pásma paměti.

ARM slibuje 20-35% zlepšení výkonu pro Cortex-A77

Podle ARM má Cortex-A77 o 20 % vyšší výkon IPC s jedním vláknem oproti svému předchůdce v Geekbench 4, 23 % v SPECint2006, 35 % v SPECfp2006, 20 % v SPECint 2017 a 25 % v SPECfp2017. Všechny jsou projektovány 7nm procesem a frekvencí 3GHz. Pokud se tato vylepšení projeví, SoC nové generace by mohly u budoucích smartphonů zajistit úžasný výkon a výdrž baterie. Zejména vylepšení FP jsou významným generačním zlepšením. A77 samozřejmě nebude bez konkurence, protože Samsung se v roce 2020 vrátí s Exynos M5 a předtím je A13 od Applu jistotou, že bude součástí nových iPhonů.

ARM také uvádí, že energetická účinnost A77 zůstane stejná jako u A76 SoC. Co to znamená je, že špičkový výkon, jádra CPU spotřebují stejné množství energie (měřeno v joulech) k dokončení a úkol. Síla a energie jsou však dva různé pojmy. A77 bude mít zvýšenou spotřebu energie, která je lineární se zvýšeným výkonem. To může vést k problémům s limity TDP v telefonech. Abychom tomu zabránili, vidíme, že hlavní výrobci přijímají nekonvenční konfigurace jádra velká + střední + malá (2+2+4 v případě HiSilicon a 1+3+4 v případě Qualcommu). A77 bude také o 17 % větší než A76, což znamená, že je na dobré cestě mít stále nejlepší PPA ve své třídě.

Byl jsem velkým fanouškem implementací A76, protože to funguje tak dobře i v SoC střední třídy, jako je Snapdragon 675. Snapdragon 855 a Kirin 980 jsou oba vysoce výkonné vlajkové lodě SoC a nemohu se dočkat, až uvidím úroveň vylepšení, která přináší implementace A77 v SoC nové generace. ARM uvádí, že její hlavní klienti se stále silně zaměřují na nejlepší PPA a je snadné vidět, že společnost v tomto poskytuje nejlepší řešení považovat.

Kdy uvidíme A77 v SoC? Před nedávnými bouřlivými událostmi s Huawei bych řekl, že by se určitě očekávalo, že HiSilicon Kirin 985 bude v roce 2019 obsahovat A77 a také GPU Mali-G77 pro skutečnou SoC nové generace. Nicméně, když se ARM rozhodl přerušit vztahy s Huawei, pochybuji, že je to možné, pokud se hořlavá situace s Huawei v nadcházejících týdnech nevyřeší. Další vlajková loď Snapdragon SoC společnosti Qualcomm se pravděpodobně zákazníkům nedodá dříve než v prvním čtvrtletí roku 2020, takže spotřebitelé, kteří chtějí používat nejnovější jádro CPU ARM, si možná budou muset chvíli počkat.

Zdroj: PAŽE

Přes: AnandTech