ARM tillkännager Cortex-A77 CPU-kärnan med 20-35% prestandaförbättringar

ARM har tillkännagett Cortex-A77 CPU-kärnan. Detta är efterföljaren till förra årets Cortex-A76, och den ger 20-35% prestandaförbättringar.

På ARMs årliga TechDay-evenemang har ARM tillkännagett Cortex-A77 CPU-kärnan. Cortex-A77-meddelandet kommer tillsammans med tillkännagivandet av ARM Mali-G77 GPU, som är den första GPU som har den helt nya "Valhall" GPU-arkitekturen. Tillsammans efterträder dessa två produkter fjolårets Cortex-A76 CPU respektive Mali-G76 GPU.

Storbritannien-baserade ARM, köpt av Japan-baserade Softbank 2016, är ett av de viktigaste företagen i teknikbranschen. Varje smartphone i världen drivs av ARMs instruktionsuppsättning. Qualcomm använder en semi-anpassad "Made for Cortex"-licens som tillåter företaget att införliva skräddarsydda varianter av ARMs CPU IP i sina produkter (till exempel är Kryo 485 Gold en semi-anpassad variant av Cortex-A76). Huaweis HiSilicon-grupp var en annan högprofilerad licenstagare av ARM: s CPU IP, med standardversioner av ARMs CPU-kärnor, medan Samsung Systems LSI och Apple använder helt anpassade kärnor ovanpå ARM: s instruktionsuppsättning. Samsung och HiSilicon licensierar också ARMs Mali GPU: er för sina interna SoC: er, medan Qualcomm och Apple väljer att gå med sina anpassade GPU-lösningar (till exempel använder Qualcomm sina egna Adreno GPUs).

Det är därför när ARM gör ett nytt tillkännagivande har det betydande konsekvenser för smartphoneindustrin. Den goda nyheten är att ARM har varit på gång ett tag nu när det kommer till att göra nya CPU-mikroarkitekturer. Cortex-A72, Cortex-A73 och Cortex-A75 var alla respektabla konstruktioner som kompenserade för misstagen i Cortex-A57. Förra årets Cortex-A76 tog dock ett steg längre än vad gäller prestanda eftersom den lovade "prestanda i bärbar dator" med en prestandaförbättring på 35 % jämfört med den redan kapabla Cortex-A75. Följaktligen, Qualcomm lovade en prestandaförbättring på 45 % med Snapdragon 855den största prestandauppgången av någon Snapdragon SoC i historien.

Cortex-A76 var en högpresterande inom områdena IPC, PPA och effektivitet. Den hade den bästa PPA i branschen med små formstorlekar. Den gynnades av TSMC: s utmärkta 7nm FinFET-process, men IPC-förbättringarna den medförde gjorde också sina spår. Den lyckades överträffa Samsungs Exynos M3 anpassade kärna i Exynos 9810, trots att de har en smalare avkodningsbredd (4-wide vs. 6-bredd). Även årets release av Exynos M4-kärnan i Exynos 9820 var inte tillräckligt för att ta ARM: s prestandafördel (även om det minskade gapet), eftersom Cortex-A76 har fortfarande en prestanda- och effektivitetsfördel över Exynos M4. (Exynos blev också sviken av en underlägsen tillverkningsprocess: 8nm LPP vs. 7nm FinFET). Speciellt har energieffektiviteten hos Cortex-A76 visat sig vara otrolig. SoCs som använder Cortex-A76 inkluderar flaggskepp SoCs som HiSilicon Kirin 980 och den Qualcomm Snapdragon 855, men vi har också börjat se det i mellanklass SoCs i form av Qualcomm Snapdragon 675 och den Snapdragon 730/730G. Effekten på prestandan har varit effektiv.

I det mobila utrymmet är Cortex-A76 fortfarande sämre än Apples anpassade kärnor som ses på Apple A11 och Apple A12 när det gäller instruktioner per klocka (IPC). ARM har dock inte visat några tecken på att bromsa förbättringstakten. I augusti presenterade företaget sin CPU-kärna-färdplan med en "Deimos"-kärna för 2019 och en "Hercules"-kärna för 2020, båda baserade på Cortex-A76. Imponerande nog lovade företaget en 20-25% CAGR-förbättring i prestanda varje år med varje ny chipset i Austins kärnfamilj. ARM rusar framåt.

Cortex-A77 är "Deimos" CPU-kärnan, och den kommer att ta sig till slutet av 2019 och början av 2020 flaggskepp SoCs. Det är en utveckling av Cortex-A76 och är den andra iterationen av Austin-kärnan familj. CPU: n är en direkt mikroarkitektonisk efterföljare till A76, och de flesta av dess kärnfunktioner är desamma. Leverantörer kommer att kunna uppgradera SoC IP utan mycket ansträngning. När det gäller arkitektur förblir det en ARM v8.2 CPU-kärna som är tänkt att paras ihop med en Cortex-A55 "liten" kärna istället för ett DynamIQ Shared Unit (DSU)-kluster.

Cachestorlekarna för Cortex-A77 är: 64KB L1-instruktions- och datacache, 256 och 512KB L2-cache, och upp till 4MB delad L3-cache. Prestandaförbättringarna måste komma från mikroarkitektoniska förbättringar, eftersom frekvensen av kärnan inte förväntas ändra (ARM riktar sig fortfarande mot 3GHz som A76, men som med A76 är det troligt att vi kommer att se leverantörer leverera design med lägre klockfrekvens kärnor). Processförbättringarna för nästa generations SoC förväntas inte bli lika stora som de var 2018. (TSMC har flyttat till en 7nm EUV-process i år, vilket sannolikt kommer att vara grunden för nästa Kirin- och Snapdragon-chipset.)

Cortex-A77 har därför en förbättrad mikroarkitektur som resulterar i 20-35% prestandaförbättringar. A76 skilde sig från sina föregångare när det gäller arkitekturen, och den var tänkt att fungera som en baslinjen för de kommande två designerna i Austins kärnfamilj: Cortex-A77 2019 och "Hercules" i 2020.

ARM: s primära mål var att öka IPC för arkitekturen samt att fortsätta fokusera på att leverera den bästa PPA (kraft, prestanda och area) i branschen. Områdesstorleken och energieffektivitetsfördelarna med A76 kommer fortfarande att förbli fördelar för A77.

När det gäller mikroarkitekturen har ARM förändrats ganska mycket. På fronten har kärnan en högre hämta bandbredd med en fördubbling av varumärkets prediktorförmåga, en ny makro-OP cachestruktur som fungerar som en L0-instruktionscache, en ny heltals ALU-pipeline och förnyade laddnings-/butiksköer och problem förmåga. Det finns också dynamiska kodoptimeringar på släp, och de förklaras i detalj i ARM: s blogginlägg. Avkodningsbredden förblir 4-bredd.

Back-end av kärnan innehåller också förbättringar, och jag rekommenderar användare att läsa AnandTechs rapportering för mycket mer detaljer. ARM har lagt till ytterligare en heltals-ALU. Dataförhämtare har också förbättrats, vilket är goda nyheter med tanke på att A76 redan hade suveräna förhämtare enl. AnandTech. Nya ytterligare förhämtningsmotorer har lagts till för att förbättra förhämtningsnoggrannheten. Allt detta är relaterat till minnesundersystemet i kärnan, vilket är en grundläggande aspekt. Minnesundersystemet för en CPU består av minneslatens och minnesbandbredd.

ARM lovar 20-35% prestandaförbättringar för Cortex-A77

Enligt ARM har Cortex-A77 en 20% IPC enkeltråds prestandaförbättring jämfört med sin föregångare i Geekbench 4, 23 % i SPECint2006, 35 % i SPECfp2006, 20 % i SPECint2017 och 25 % i SPECfp2017. Alla dessa projiceras vid en 7nm-process och vid 3GHz-frekvens. Om dessa förbättringar slår igenom kan nästa generations SoC: er ge fantastiska prestanda och batterilivsupplevelser på framtida smartphones. Framför allt FP-förbättringarna är en betydande generationsförbättring. Naturligtvis kommer A77 inte att vara utan konkurrens, eftersom Samsung kommer att vara tillbaka med Exynos M5 2020, och innan dess är Apples A13 med säkerhet en del av de nya iPhones.

ARM uppger också att energieffektiviteten för A77 kommer att förbli densamma som A76 SoCs. Vad betyder detta är att toppprestanda kommer CPU-kärnor att använda samma mängd energi (mätt i joule) för att slutföra en uppgift. Men kraft och energi är två olika begrepp. A77 kommer att ha ökad strömförbrukning som är linjär med den ökade prestandan. Detta kan leda till problem med TDP-gränser i telefoner. För att motverka detta ser vi redan att de stora leverantörerna använder stora + medelstora + små okonventionella kärnkonfigurationer (2+2+4 i HiSilicons fall och 1+3+4 i Qualcomms fall). A77 kommer också att vara 17 % större än A76, vilket betyder att den är på väg att fortfarande ha klassens bästa PPA.

Jag har varit ett stort fan av A76:s implementeringar, eftersom det bara fungerar så bra även i mellanklass-SoCs som Snapdragon 675. Snapdragon 855 och Kirin 980 är båda högpresterande flaggskepps-SoCs, och jag kan inte vänta på att se nivån av förbättringar som A77:s implementeringar har åstadkommit i nästa generations SoCs. ARM uppger att dess stora kunder fortfarande fokuserar starkt på att ha den bästa PPA, och det är lätt att se att företaget levererar de bästa lösningarna i detta betrakta.

När kommer vi att se A77 i en SoC? Innan de senaste tumultartade händelserna med Huawei skulle jag ha sagt att HiSilicon Kirin 985 säkerligen skulle förväntas ha A77 såväl som Mali-G77 GPU för en sann nästa generations SoC under 2019. Men med ARM beslutat att bryta banden med Huawei, tvivlar jag på om detta är möjligt längre, om inte den brännbara situationen med Huawei löses under de kommande veckorna. Qualcomms nästa flaggskepp Snapdragon SoC kommer förmodligen inte att levereras till konsumenterna förrän första kvartalet 2020, så konsumenter som vill använda ARMs senaste CPU-kärna kan behöva vänta ett tag.

Källa: ÄRM

Via: AnandTech