ARM har annonceret Cortex-A77 CPU-kernen. Dette er efterfølgeren til sidste års Cortex-A76, og det bringer 20-35% præstationsforbedringer.
Ved ARMs årlige TechDay-begivenhed har ARM annonceret Cortex-A77 CPU-kernen. Cortex-A77-meddelelsen kommer sammen med annonceringen af ARM Mali-G77 GPU, som er den første GPU, der har den helt nye "Valhall" GPU-arkitektur. Tilsammen efterfølger disse to produkter sidste års Cortex-A76 CPU og Mali-G76 GPU henholdsvis.
UK-baserede ARM, købt af Japan-baserede Softbank i 2016, er en af de vigtigste virksomheder i teknologiindustrien. Hver smartphone i verden er drevet af ARMs instruktionssæt. Qualcomm bruger en semi-tilpasset "Made for Cortex"-licens, der giver virksomheden mulighed for at inkorporere tilpassede varianter af ARMs CPU IP i dets produkter (f.eks. er Kryo 485 Gold en semi-brugerdefineret variant af Cortex-A76). Huaweis HiSilicon-gruppe var en anden højprofileret licenstager af ARMs CPU IP, ved at bruge standardversioner af ARMs CPU-kerner, hvorimod Samsung Systems LSI og Apple bruger fuldt tilpassede kerner oven på ARMs instruktionssæt. Samsung og HiSilicon licenserer også ARMs Mali GPU'er til deres interne SoC'er, mens Qualcomm og Apple vælger at gå med deres brugerdefinerede GPU-løsninger (f.eks. bruger Qualcomm sine egne Adreno GPU'er).
Dette er grunden til, at når ARM laver en ny meddelelse, har det betydelige konsekvenser for smartphone-industrien. Den gode nyhed er, at ARM har været på vej i et stykke tid nu, når det kommer til at lave nye CPU-mikroarkitekturer. Cortex-A72, Cortex-A73 og Cortex-A75 var alle respektable designs, der gjorde op for fejlene i Cortex-A57. Sidste års Cortex-A76 tog dog et skridt videre med hensyn til ydeevne, da den lovede "bærbar-klasse ydeevne" med en 35% ydelsesforbedring i forhold til den allerede kapable Cortex-A75. Derfor, Qualcomm lovede en ydelsesforbedring på 45 % med Snapdragon 855det største præstationsbump af enhver Snapdragon SoC i historien.
Cortex-A76 var en højtydende inden for IPC, PPA og effektivitet. Det havde den bedste PPA i branchen med små matricearealstørrelser. Det drage fordel af TSMC's fremragende 7nm FinFET-proces, men de IPC-forbedringer, det medførte, gjorde også deres præg. Det lykkedes at overgå Samsungs Exynos M3 brugerdefinerede kerne i Exynos 9810, på trods af at have en smallere afkodningsbredde (4-bred vs. 6-bred). Selv dette års udgivelse af Exynos M4-kernen i Exynos 9820 var ikke nok til at snuppe ARMs ydeevnefordel (selvom det lukkede hullet), da Cortex-A76 stadig nyder godt af en præstations- og effektivitetsfordel over Exynos M4. (Exynos blev også svigtet af en ringere fremstillingsproces: 8nm LPP vs. 7nm FinFET). Især energieffektiviteten af Cortex-A76 har vist sig at være utrolig. SoC'er, der bruger Cortex-A76 inkluderer flagskibs SoC'er, såsom HiSilicon Kirin 980 og Qualcomm Snapdragon 855, men vi er også begyndt at se det i mid-range SoCs i form af Qualcomm Snapdragon 675 og Snapdragon 730/730G. Indvirkningen på ydeevnen har været effektiv.
På det mobile område er Cortex-A76 stadig ringere end Apples brugerdefinerede kerner som set på Apple A11 og Apple A12 med hensyn til instruktioner per ur (IPC). ARM har dog ikke vist nogen tegn på at bremse sin forbedringshastighed. I august afslørede virksomheden sin CPU-kerne-køreplan med en "Deimos"-kerne for 2019 og en "Hercules"-kerne for 2020, begge baseret på Cortex-A76. På imponerende vis lovede virksomheden en 20-25% CAGR-forbedring i ydeevne hvert år med hvert nyt chipset i Austin-kernefamilien. ARM suser fremad.
Cortex-A77 er "Deimos" CPU-kernen, og den vil finde vej til slutningen af 2019 og begyndelsen af 2020 flagskibs-SoC'er. Det er en udvikling af Cortex-A76 og er den anden iteration af Austin-kernen familie. CPU'en er en direkte mikroarkitektonisk efterfølger af A76, og de fleste af dens kernefunktioner er de samme. Leverandører vil være i stand til at opgradere SoC IP uden en stor indsats. Med hensyn til arkitektur forbliver det en ARM v8.2 CPU-kerne, der er beregnet til at blive parret med en Cortex-A55 "lille" kerne i stedet for en DynamIQ Shared Unit (DSU) klynge.
Cachestørrelserne på Cortex-A77 er: 64KB L1-instruktions- og datacache, 256 og 512KB L2-cache og op til 4MB delt L3-cache. Ydeevneforbedringerne skal komme fra mikroarkitektoniske forbedringer, da frekvensen af kernen ikke forventes at ændring (ARM sigter stadig mod 3GHz som A76, men som med A76 er det sandsynligt, at vi vil se leverandører sende design med lavere clock kerner). Procesforbedringerne for den næste generation af SoC'er forventes ikke at blive så store, som de var i 2018. (TSMC er flyttet til en 7nm EUV-proces i år, som sandsynligvis vil være grundlaget for de næste Kirin- og Snapdragon-chipsæt.)
Cortex-A77 har derfor en forbedret mikroarkitektur, der resulterer i 20%-35% ydeevneforbedringer. A76 adskilte sig fra sine forgængere med hensyn til arkitekturen, og den var beregnet til at fungere som en baseline for de næste to designs i Austin-kernefamilien: Cortex-A77 i 2019 og "Hercules" i 2020.
ARMs primære mål var at øge arkitekturens IPC samt at fortsætte med at fokusere på at levere den bedste PPA (kraft, ydeevne og areal) i branchen. Arealets størrelse og energieffektivitetsfordelene ved A76 vil stadig forblive fordele for A77.
Med hensyn til mikroarkitekturen har ARM ændret sig ret meget. På frontenden har kernen en højere hente-båndbredde med en fordobling af brandets forudsigelsesevne, en ny makro-OP cachestruktur, der fungerer som en L0-instruktionscache, en ny heltals ALU-pipeline og fornyede load/store køer og problem evne. Der er også dynamiske kodeoptimeringer på slæb, og de er forklaret detaljeret i ARMs blogindlæg. Afkodningsbredden forbliver på 4-bredden.
Back-end af kernen indeholder også forbedringer, og jeg anbefaler brugere at læse AnandTech's dækning for mange flere detaljer. ARM har tilføjet en ekstra heltal ALU. Dataforhentere er også blevet forbedret, hvilket er godt nyt i betragtning af, at A76 allerede havde suveræne forhentere iflg. AnandTech. Nye ekstra forhentningsmotorer er blevet tilføjet for at forbedre præhentningsnøjagtigheden. Alt dette er relateret til kernens hukommelsesdelsystem, som er et grundlæggende aspekt. Hukommelsesundersystemet i en CPU består af hukommelsesforsinkelse og hukommelsesbåndbredde.
ARM lover 20-35% præstationsforbedringer for Cortex-A77
Ifølge ARM har Cortex-A77 en 20% IPC single-thread ydeevneforbedring i forhold til sin forgænger i Geekbench 4, 23 % i SPECint2006, 35 % i SPECfp2006, 20 % i SPECint2017 og 25 % i SPECfp2017. Alle disse projekteres ved en 7nm-proces og ved 3GHz-frekvens. Hvis disse forbedringer udspiller sig, kan næste generations SoC'er give nogle fantastiske ydelser og batterilevetid oplevelser på fremtidige smartphones. Især FP-forbedringerne er en væsentlig generationsforbedring. Selvfølgelig vil A77 ikke være uden konkurrence, da Samsung vil være tilbage med Exynos M5 i 2020, og før det er Apples A13 med sikkerhed en del af de nye iPhones.
ARM oplyser også, at energieffektiviteten af A77 vil forblive den samme som A76 SoCs. Hvad betyder dette er, at den højeste ydeevne vil CPU-kerner bruge den samme mængde energi (målt i joule) for at fuldføre en opgave. Imidlertid er kraft og energi to forskellige begreber. A77 vil have øget strømforbrug, der er lineært med den øgede ydeevne. Dette kan føre til problemer med TDP-grænser i telefoner. For at imødegå dette ser vi allerede de store leverandører vedtage store + mellemstore + små ukonventionelle kernekonfigurationer (2+2+4 i HiSilicons tilfælde og 1+3+4 i Qualcomms tilfælde). A77 vil også være 17 % større end A76, hvilket betyder, at den er på vej til stadig at have klassens bedste PPA.
Jeg har været en stor fan af A76's implementeringer, da det bare fungerer så godt selv i mellemklasse SoC'er såsom Snapdragon 675. Snapdragon 855 og Kirin 980 er begge højtydende flagskibs-SoC'er, og jeg kan ikke vente med at se niveauet af forbedringer medført af A77's implementeringer i næste generations SoC'er. ARM udtaler, at dets store kunder stadig fokuserer stærkt på at have den bedste PPA, og det er let at se, at virksomheden leverer de bedste løsninger på dette område. hensyn.
Hvornår vil vi se A77 i en SoC? Forud for de seneste tumultariske begivenheder med Huawei ville jeg have sagt, at HiSilicon Kirin 985 helt sikkert ville forventes at have A77 såvel som Mali-G77 GPU for en ægte næste generations SoC i 2019. Men med ARMs beslutning om at afbryde båndene til Huawei, tvivler jeg på, om dette er muligt længere, medmindre den brændbare situation med Huawei er løst i de kommende uger. Qualcomms næste flagskib Snapdragon SoC sendes sandsynligvis ikke til forbrugerne før første kvartal af 2020, så forbrugere, der ønsker at bruge ARMs nyeste CPU-kerne, kan blive nødt til at vente et stykke tid.
Kilde: ARM
Via: AnandTech