ARM hat den Cortex-A77-CPU-Kern angekündigt. Dies ist der Nachfolger des letztjährigen Cortex-A76 und bringt Leistungsverbesserungen von 20–35 %.
Auf der jährlichen TechDay-Veranstaltung von ARM hat ARM den Cortex-A77-CPU-Kern angekündigt. Die Cortex-A77-Ankündigung geht mit der Ankündigung des einher ARM Mali-G77 GPU, die erste GPU, die über die brandneue „Valhall“-GPU-Architektur verfügt. Zusammen sind diese beiden Produkte der Erfolg des letzten Jahres Cortex-A76-CPU bzw. Mali-G76-GPU.
Das in Großbritannien ansässige Unternehmen ARM, das 2016 von der japanischen Softbank gekauft wurde, ist eines der wichtigsten Unternehmen der Technologiebranche. Jedes Smartphone auf der Welt wird mit dem Befehlssatz von ARM betrieben. Qualcomm verwendet eine semi-kundenspezifische „Made for Cortex“-Lizenz, die es dem Unternehmen ermöglicht, maßgeschneiderte zu integrieren Varianten der CPU-IP von ARM in seinen Produkten (z. B. ist der Kryo 485 Gold eine semi-kundenspezifische Variante des Cortex-A76).
Huaweis HiSilicon-Gruppe War ein weiterer hochkarätiger Lizenznehmer des CPU-IP von ARM, wobei Standardversionen der CPU-Kerne von ARM verwendet werden, während Samsung Systems LSI und Apple vollständig benutzerdefinierte Kerne zusätzlich zum Befehlssatz von ARM verwenden. Samsung und HiSilicon lizenzieren auch die Mali-GPUs von ARM für ihre hauseigenen SoCs, während Qualcomm und Apple sich für ihre benutzerdefinierten GPU-Lösungen entscheiden (Qualcomm verwendet beispielsweise seine eigenen Adreno-GPUs).Aus diesem Grund hat eine neue Ankündigung von ARM erhebliche Auswirkungen auf die Smartphone-Branche. Die gute Nachricht ist, dass ARM schon seit einiger Zeit auf dem Vormarsch ist, wenn es um die Entwicklung neuer CPU-Mikroarchitekturen geht. Der Cortex-A72, Cortex-A73 und Cortex-A75 waren alles respektable Designs, die die Fehler des Cortex-A57 wettmachten. Allerdings ging der letztjährige Cortex-A76 hinsichtlich der Leistung noch einen Schritt weiter, denn er versprach „Leistung der Laptop-Klasse“ mit einer Leistungssteigerung von 35 % gegenüber dem bereits leistungsfähigen Cortex-A75. Entsprechend, Qualcomm versprach mit dem Snapdragon 855 eine Leistungssteigerung von 45 %der größte Leistungsschub aller Snapdragon-SoCs in der Geschichte.
Der Cortex-A76 war ein Spitzenreiter in den Bereichen IPC, PPA und Effizienz. Es hatte das beste PPA der Branche mit kleinen Chipflächengrößen. Es profitierte zwar vom hervorragenden 7-nm-FinFET-Prozess von TSMC, aber auch die damit verbundenen IPC-Verbesserungen hinterließen Spuren. Es gelang ihm, den benutzerdefinierten Exynos M3-Kern von Samsung zu übertreffen Exynos 9810, obwohl es eine schmalere Dekodierungsbreite hat (4-breit vs. 6 breit). Sogar die diesjährige Veröffentlichung des Exynos M4-Kerns im Exynos 9820 reichte nicht aus, um den Leistungsvorteil von ARM zu nutzen (obwohl es die Lücke schloss), wie der Cortex-A76 genießt immer noch einen Leistungs- und Effizienzvorteil über den Exynos M4. (Der Exynos wurde auch durch einen minderwertigen Herstellungsprozess enttäuscht: 8 nm LPP vs. 7-nm-FinFET). Insbesondere die Energieeffizienz des Cortex-A76 hat sich als unglaublich erwiesen. Zu den SoCs, die den Cortex-A76 verwenden, gehören Flaggschiff-SoCs wie der HiSilicon Kirin 980 und das Qualcomm Snapdragon 855, aber wir sehen es auch in Mittelklasse-SoCs in Form des Qualcomm Snapdragon 675 und das Löwenmaul 730/730G. Die Auswirkungen auf die Leistung waren wirksam.
Im mobilen Bereich ist der Cortex-A76 in Bezug auf die Anweisungen pro Takt (IPC) immer noch den benutzerdefinierten Kernen von Apple unterlegen, wie sie beim Apple A11 und beim Apple A12 zu sehen sind. ARM hat jedoch keine Anzeichen einer Verlangsamung seiner Verbesserungsrate gezeigt. Im August stellte das Unternehmen seine CPU-Kern-Roadmap mit einem „Deimos“-Kern für 2019 und einem „Hercules“-Kern für 2020 vor, beide basierend auf dem Cortex-A76. Beeindruckend ist, dass das Unternehmen mit jedem neuen Chipsatz der Austin-Kernfamilie eine jährliche jährliche Steigerung der Leistung um 20–25 % versprach. ARM schreitet voran.
Der Cortex-A77 ist der „Deimos“-CPU-Kern und wird Ende 2019 und Anfang 2020 auf den Markt kommen Flaggschiff-SoCs. Es ist eine Weiterentwicklung des Cortex-A76 und die zweite Iteration des Austin-Kerns Familie. Die CPU ist ein direkter mikroarchitektonischer Nachfolger des A76 und die meisten ihrer Kernfunktionen sind dieselben. Anbieter können die SoC-IP ohne großen Aufwand aktualisieren. In Bezug auf die Architektur handelt es sich weiterhin um einen ARM v8.2-CPU-Kern, der mit einem „kleinen“ Cortex-A55-Kern gepaart werden soll, anstelle eines DynamIQ Shared Unit (DSU)-Clusters.
Die Cache-Größen des Cortex-A77 betragen: 64 KB L1-Befehls- und Daten-Caches, 256 und 512 KB L2-Caches und bis zu 4 MB gemeinsam genutzter L3-Cache. Die Leistungsverbesserungen müssen durch Verbesserungen der Mikroarchitektur erfolgen, da dies bei der Frequenz des Kerns nicht zu erwarten ist Änderung (ARM zielt immer noch auf 3 GHz wie der A76, aber wie beim A76 ist es wahrscheinlich, dass Anbieter Designs mit niedrigerer Taktung ausliefern Kerne). Die Prozessverbesserungen für die nächste Generation von SoCs werden voraussichtlich nicht so groß sein wie im Jahr 2018. (TSMC ist dieses Jahr auf einen 7-nm-EUV-Prozess umgestiegen, der wahrscheinlich die Grundlage für die nächsten Kirin- und Snapdragon-Chipsätze bilden wird.)
Der Cortex-A77 verfügt daher über eine verbesserte Mikroarchitektur, die zu Leistungssteigerungen von 20–35 % führt. Der A76 unterschied sich architektonisch von seinen Vorgängern und sollte als dienen Grundlage für die nächsten beiden Designs der Austin-Kernfamilie: der Cortex-A77 im Jahr 2019 und „Hercules“ im Jahr 2019 2020.
Die Hauptziele von ARM bestanden darin, den IPC der Architektur zu erhöhen und sich weiterhin auf die Bereitstellung der besten PPA (Leistung, Leistung und Fläche) der Branche zu konzentrieren. Die Flächengrößen- und Energieeffizienzvorteile der A76 bleiben auch weiterhin Vorteile für die A77.
In Bezug auf die Mikroarchitektur hat sich bei ARM einiges verändert. Am Front-End verfügt der Kern über eine höhere Abrufbandbreite mit einer Verdoppelung der Markenvorhersagefähigkeit, einem neuen Makro-OP Cache-Struktur, die als L0-Befehlscache fungiert, eine neue Integer-ALU-Pipeline und überarbeitete Lade-/Speicherwarteschlangen und Ausgabe Fähigkeit. Es gibt auch dynamische Codeoptimierungen, die im Blogbeitrag von ARM ausführlich erläutert werden. Die Dekodierungsbreite bleibt bei 4-breit.
Das Backend des Kerns enthält ebenfalls Verbesserungen, und ich empfehle Benutzern, diese zu lesen AnandTechs Abdeckung für viel mehr Details. ARM hat eine zusätzliche Ganzzahl-ALU hinzugefügt. Auch die Daten-Prefetcher wurden verbessert, was eine gute Nachricht ist, wenn man bedenkt, dass der A76 bereits über hervorragende Prefetcher verfügte AnandTech. Neue zusätzliche Prefetching-Engines wurden hinzugefügt, um die Prefetching-Genauigkeit zu verbessern. All dies hängt mit dem Speichersubsystem des Kerns zusammen, das einen grundlegenden Aspekt darstellt. Das Speichersubsystem einer CPU besteht aus Speicherlatenz und Speicherbandbreite.
ARM verspricht 20-35 % Leistungssteigerungen für den Cortex-A77
Laut ARM weist der Cortex-A77 eine IPC-Single-Thread-Leistung von 20 % gegenüber seinem Vorgänger auf Vorgänger in Geekbench 4, 23 % in SPECint2006, 35 % in SPECfp2006, 20 % in SPECint2017 und 25 % in SPECfp2017. All dies wird in einem 7-nm-Prozess und einer 3-GHz-Frequenz projiziert. Wenn diese Verbesserungen zum Tragen kommen, könnten die SoCs der nächsten Generation für erstaunliche Leistung und Akkulaufzeit auf zukünftigen Smartphones sorgen. Insbesondere die FP-Verbesserungen stellen eine erhebliche Generationsverbesserung dar. Natürlich wird das A77 nicht konkurrenzlos sein, denn 2020 meldet sich Samsung mit dem Exynos M5 zurück und davor wird mit Sicherheit auch Apples A13 zu den neuen iPhones gehören.
ARM gibt außerdem an, dass die Energieeffizienz des A77 die gleiche bleiben wird wie die der A76-SoCs. Was das bedeutet bedeutet, dass CPU-Kerne bei Spitzenleistung die gleiche Energiemenge (gemessen in Joule) verbrauchen, um a abzuschließen Aufgabe. Allerdings sind Leistung und Energie zwei verschiedene Konzepte. Der A77 wird einen höheren Stromverbrauch haben, der linear mit der gesteigerten Leistung zusammenhängt. Dies kann zu Problemen mit TDP-Grenzwerten in Telefonen führen. Um dem entgegenzuwirken, sehen wir bereits, dass die großen Anbieter große, mittlere und kleine unkonventionelle Kernkonfigurationen übernehmen (2+2+4 im Fall von HiSilicon und 1+3+4 im Fall von Qualcomm). Der A77 wird außerdem 17 % größer sein als der A76, was bedeutet, dass er auf dem besten Weg ist, immer noch das beste PPA seiner Klasse zu haben.
Ich bin ein großer Fan der Implementierungen des A76, da er selbst in Mittelklasse-SoCs wie dem Snapdragon 675 einfach so gut funktioniert. Der Snapdragon 855 und der Kirin 980 sind beide hochleistungsfähige Flaggschiff-SoCs, und ich kann es kaum erwarten, das Ausmaß der Verbesserungen zu sehen, die die Implementierungen des A77 im bringen SoCs der nächsten Generation. ARM gibt an, dass seine Großkunden immer noch stark darauf achten, das beste PPA zu haben, und es ist leicht zu erkennen, dass das Unternehmen in diesem Bereich die besten Lösungen liefert betrachten.
Wann werden wir den A77 in einem SoC sehen? Vor den jüngsten turbulenten Ereignissen mit Huawei hätte ich gesagt, dass der HiSilicon Kirin 985 im Jahr 2019 sicherlich mit der A77- und der Mali-G77-GPU ausgestattet sein wird, um einen echten SoC der nächsten Generation zu erhalten. Angesichts der Entscheidung von ARM, die Beziehungen zu Huawei abzubrechen, bezweifle ich jedoch, dass dies noch möglich ist, es sei denn, die explosive Situation mit Huawei wird in den kommenden Wochen gelöst. Qualcomms nächstes Flaggschiff-Snapdragon-SoC wird wahrscheinlich erst im ersten Quartal 2020 an Verbraucher ausgeliefert, sodass Verbraucher, die den neuesten CPU-Kern von ARM verwenden möchten, möglicherweise eine Weile warten müssen.
Quelle: ARM
Über: AnandTech