Die neue mobile Plattform Qualcomm Snapdragon 855 bringt große Verbesserungen in Bezug auf Leistung, Gaming und KI, und wir erläutern, wie sie das gemacht haben.
Auf dem Snapdragon Summit 2018 von Qualcomm präsentierte das Unternehmen kündigte seinen neuesten Premium-Flaggschiff-Chipsatz an: die Snapdragon 855-Plattform. Dieses neue Produkt wird das Herzstück der meisten produktiven Flaggschiffe des Jahres 2019 sein und verspricht unglaubliche Datengeschwindigkeiten durch das Snapdragon X50-Modem. Darüber hinaus bringt der Snapdragon 855 jedoch eine Reihe von Verbesserungen für jeden System-on-Chip-Block mit Einige Recheneinheiten verzeichneten in letzter Zeit die größten jährlichen Leistungs- und Energieeffizienzverbesserungen Geschichte.
Wir haben den Spectra 380 ISP-CV bereits detailliert beschrieben, was zum Beispiel die Smartphone-Fotografie weiter verbessert und den Nutzern gleichzeitig erhebliche Batterieeinsparungen beschert. Während wir uns zunehmend auf Peripheriekomponenten wie den Hexagon DSP konzentrieren, zahlen Enthusiasten am meisten auf die Kernblöcke Die Konzentration auf CPU und GPU hat durch Architekturverbesserungen und die Umstellung auf einen neuen Prozess ebenfalls mehr als bescheidene Fortschritte gemacht Knoten. In diesem Artikel werden wir kurz zusammenfassen, was es Neues und Bekanntes über die CPU, GPU und DSP des Snapdragon 855 gibt und welche Auswirkungen die Verbesserungen und neuen Funktionen haben könnten
dein Benutzererfahrung im Jahr 2019.A76-basierte Kryo 485-CPU und die Umstellung auf 7 nm
Der Snapdragon 855 wechselt zum neuesten 7-nm-FinFET-Herstellungsprozess von TSMC. Normalerweise sehen wir alle ein bis zwei Jahre eine Knotenrevision mit Verkleinerungen oder Optimierungen in der Mitte des Zyklus (z. B. die Umstellung von „Low-Power Early“). (LPE) zu „Low-Power Plus“ (LPP) in Samsung-LSI-Knoten), daher haben Sie wahrscheinlich in der einen oder anderen Nachricht von diesen Kennzahlen gehört Artikel. Aber was bedeutet es? In diesem Zusammenhang beschreibt es die Größe der Transistorfunktionen des Prozessors, die uns wiederum Aufschluss darüber geben, welche Art von Verbesserungen der Transistordichte wir mit jeder neuen Generation erwarten können. Mit mehr Transistoren pro Flächeneinheit lässt sich die resultierende Leistung des Prozessors steigern. Diese Funktion ist auch wichtig, da kleinere Prozessknoten die Implementierung von Prozessordesigns in kleinerem Maßstab ermöglichen, was intuitiv ist verkleinert den Raum zwischen den Prozessorelementen und verkürzt damit wiederum die Distanz, die die Elektronen zurücklegen müssen Berechnung. Dies führt zu Leistungsverbesserungen und kleinere Prozesse haben auch eine geringere Kapazität, was bedeutet, dass Transistoren mit geringerer Latenz und mit geringerer Energie ein- und ausgeschaltet werden können. Als Referenz behauptet TSMC, dass die Umstellung auf ihren 7-nm-Prozess erfolgreich sei Leistung und Energieeffizienz in der Größenordnung von 20 % bzw. 40 %, Allerdings wird dies mit TSMCs eigenem 10-nm-FinFET-Prozess verglichen.
Bei den letzten Snapdragon-Flaggschiff-Chipsätzen haben wir gesehen, dass Qualcomm mit Samsung zusammenarbeitet und deren 14-nm- und 10-nm-LPP/LPE-Prozess implementiert hat. Der Wechsel zum 7-nm-Prozess von TSMC für den Snapdragon 855 ist jedoch nicht unerwartet, wenn man bedenkt, dass der 7-nm-Prozess von Samsung dies getan hat ist gerade im Oktober in die Massenproduktion gegangen, obwohl damals berichtet wurde, dass ein 5G-Chipsatz von Qualcomm darauf gebaut werden würde. Darüber hinaus wird das 7LPP-Design von Samsung mit einer verbesserten Lithographietechnik hergestellt, die als Extrem-Ultraviolett-Lithographie (EUVL) bekannt ist. Dies führt zu einer Flächenreduzierung von 40 % bei gleicher Designkomplexität, mit 20 % höheren Geschwindigkeiten oder 50 % weniger Stromverbrauch im Vergleich zu 10-nm-FinFET Vorgänger. Jeder neue Sprung zu kleineren Prozessknoten wird gerade deshalb gefeiert, weil sie so schwer zu erreichen sind. Wenn beispielsweise Transistoren kleiner werden, kann es sein, dass sie einen größeren „Leckstrom“ oder Stromfluss durch „ausgeschaltete“ Transistoren aufweisen, was den statischen Stromverbrauch im Leerlauf erhöht. Und während kleinere Chips mit einer höheren Transistoranzahl es ermöglichen könnten, das Beste aus einem bestimmten Siliziumwafer herauszuholen, ist die Ausbeute tendenziell geringer aufgrund der oben erwähnten Leckage sowie der Schwierigkeit, Prozessoren mit „höherer Klassifizierung“ zu erhalten, die mit ihrer (hohen) Referenz laufen Frequenzen. Das sind einfach manche einer der vielen Entwicklungshürden, die natürlich beseitigt sind, wenn ein neuer Prozessknoten in die Massenproduktion geht, aber in Kurz gesagt, es gibt viele F&E- und Fertigungsherausforderungen, die die Kosten für die Einführung einer neuen Prozessgröße erhöhen Markt.
Die neueste ARM A76-Architektur, die für den Kryo 485 lizenziert wurde, trägt ebenfalls wesentlich zu den erheblichen Verbesserungen bei, die wir im Vergleich zum Vorjahr beim Qualcomm Snapdragon 855 sehen. Der A76-Kern ist ein brandneues, leeres Design aus den ARM-Büros in Austin und verfügt über eine neue Mikroarchitektur, die von Grund auf neu entwickelt wurde, um das zu liefern, was ARM als „Leistung der Laptop-Klasse“ bezeichnet mobile Effizienz.“ Es handelt sich immer noch um ein semi-kundenspezifisches Design, und Qualcomm hat Verbesserungen vorgenommen, wie z. B. einen optimierten Datenvorabruf für eine bessere Effizienz und eine größere Out-of-Order-Ausführung Fenster. Dieses neue Design bietet einige enorme Leistungsverbesserungen gegenüber dem A75, auf dem die Goldkerne des Snapdragon 845 basierten: Es verspricht a 35 % Leistungssteigerung und 40 % bessere Energieeffizienz. Beim Vergleich des A75 in einem 10-nm-Prozess mit dem A76 in einem 7-nm-Prozess bei derselben Leistungshüllkurve von Mit einer Leistung von ca. 750 mW/Kern wächst der Leistungsvorteil zugunsten des neuen Kerns auf 40 % und auch die Energieeinsparungen können steigen auf 50 %. Darüber hinaus gibt es weitere Verbesserungen bei Asymmetric Single Instruction Multiple Data (ASIMD)-Pipelines und Skalarproduktanweisungen Insgesamt ergeben sich ca. 3,9-fache Verbesserungen bei der Leistung maschineller Lernaufgaben, wie z. B. Inferenz in Faltungs-Neuronalen Netzen. All dies führt zu einer branchenführenden Leistung pro Fläche und ist eine großartige Ergänzung zum neuen 7-nm-Prozess, wobei Qualcomms 2,84-GHz-Prime-Core nahe an die ARM-Referenztaktraten von 3 GHz herankommt hatte verwendet bei der Detaillierung des neuen Kerns. Insgesamt, Qualcomm verspricht eine absolut gewaltige Verbesserung der CPU-Leistung um 45 % über 845, der bislang größte Anstieg gegenüber dem Vorjahr.
Apropos „Prime Core“ des Snapdragon 855: Angesichts der übergroßen Verbesserungen ist es auch nicht überraschend, dass Qualcomm mit diesem neuen Cluster-Setup einsteigt. LITTLE aktiviert durch ARMs DynamIQ Technologieplattformen. Im Wesentlichen ermöglicht DynamIQ mehr Flexibilität und Skalierbarkeit beim Multi-Core-Prozessordesign und ermöglicht mehrere Core-Designs in einem bestimmten Cluster sowie eine feinkörnige Spannungssteuerung pro Kern. (BEARBEITEN: In einer Frage-und-Antwort-Runde bestätigte Qualcomm, dass der Prime-Kern seine Leistungsdomäne mit dem Leistungscluster teilt, was den hier beschriebenen Nutzen einschränkt.) Der A76 passt besonders gut zu einem so einsamen Premium-Kern mit eigenem Takt, da er in Sachen Single-Thread neue Maßstäbe setzt Leistung mit 25 % mehr Integer-Befehlen pro Takt als der A75 und 35 % höherer ASIMD- und Gleitkomma-Leistung bei 90 % höherer Leistung Speicherbandbreite. Kurz gesagt, der A76 stellt einen größeren Generationswechsel dar als frühere Generationen, was zweifellos auch zu Qualcomms Erfolg beigetragen hat Im Vergleich zum Vorjahr ist die Leistungssteigerung beim Snapdragon 855 größer als üblich (als Referenz nannte Qualcomm eine Steigerung von 25 bis 30 % für den 845). die 835). Dies könnte ausreichen, um die resultierende Leistung des Qualcomm Snapdragon 855 vor dem Mongoose 3 (M3)-Kern von Samsung LSI im Exynos 9810 zu platzieren. Dieses spezielle Design litt jedoch in einer Weise unter der Energieeffizienz, wie dies bei Qualcomm-Chips nicht der Fall war und was beim Snapdragon 855 höchstwahrscheinlich auch nicht der Fall sein wird entweder.
Was bedeutet das für den Endbenutzer? Natürlich sollten wir mit mehr Benchmark-Kernen rechnen – ARM prognostiziert 28 % höhere Geekbench-Werte für Mobilgeräte und eine um 35 % verbesserte Javascript-Leistung. Über Benchmarks hinaus, die möglicherweise wenig mit der Endbenutzererfahrung zu tun haben, setzt der A76 den Schwerpunkt des A75 fort nachhaltige LeistungDies bedeutet, dass Benutzer bei längeren Spielesitzungen mit weniger Drosselung rechnen müssen. Die Umstellung auf 7 nm in Kombination mit dem neuen Kerndesign wird mit Sicherheit zu einer spürbaren Akkuleistung führen Lebensverbesserungen für Endbenutzer, und das ist vielleicht das attraktivste Merkmal dieser Reihe Upgrades. Interessant ist auch der neue „Prime“-Kern, da dies ein einzelner Kern sein könnte, der sich auf höchste Single-Threaded-Leistung konzentriert erweisen sich bei Anwendungen und Prozessen als vorteilhaft, die nicht darauf ausgelegt sind, die Vorteile richtig auszunutzen Multithreading. Natürlich wirkt sich der 7-nm-Herstellungsprozess auch auf andere Blöcke des Snapdragon 855 aus und bringt die gleichen Energieeinsparungen mit sich zu anderen Recheneinheiten, die ebenfalls an der alltäglichen Benutzererfahrung beteiligt sind, beispielsweise der Bildverarbeitung für die Smartphone-Fotografie.
„Snapdragon Elite Gaming Experience“ und Adreno 640 GPU
Der Qualcomm Snapdragon 855 konzentriert sich dieses Mal stark auf Spiele, was angesichts der Beliebtheit von Titeln keine Überraschung ist wie Fortnite und PlayerUnknown’s Battlegrounds sowie die zunehmende Beliebtheit von mobilen eSports (ja, das gibt es) in Asien. Nach Angaben von Qualcomm aus dem Newzoo 2017 Global Games Market-BerichtMobile Gaming verzeichnet einen Aufwärtstrend mit einem erwarteten Gesamtumsatz von 70,3 Milliarden US-Dollar für 2018, was dank einer Steigerung von 25,5 % gegenüber dem Vorjahr 51 % aller Gaming-Einnahmen ausmacht.
Die Adreno 640 GPU bringt ein gesundes Ergebnis 20 % Steigerung der Grafikleistung, was Qualcomms Vorsprung gegenüber der Konkurrenz in diesem speziellen Bereich weiter ausbaut. Als Referenz: Der Snapdragon 845 brachte eine 30-prozentige Steigerung gegenüber dem Snapdragon 835, der selbst ebenfalls eine 30-prozentige Verbesserung gegenüber dem Snapdragon 821 bot. Dies sollte Qualcomm jedoch bei der Grafikleistung und vor allem bei der Leistung pro Watt an der Spitze halten, wenn es ihnen gelingt, sich auch in dieser Hinsicht zu verbessern. Abgesehen von dieser Zahl ist Qualcomm in Bezug auf den Adreno so geheimnisvoll wie eh und je: Wir haben von dem Integrierten gehört Mikrocontroller für die Energieverwaltung und wie der 640 den geringsten Treiber-Overhead hat, obwohl das Unternehmen dies erwähnt hat Einbeziehung von 50 % mehr Recheneinheiten (ALUs), die die KI-Leistung weiter beschleunigen würden.
Eine Sache, über die Qualcomm in den Briefings viel gesprochen hat, ist ihr Wunsch, „Physically-Based Rendering“ (PBR) für mehr mobile Spielerlebnisse bereitzustellen. PBR ist ein Schattierungsmodell, das eine realistische Grafikwiedergabe ermöglicht und den Lichtfluss entsprechend dem in Texturen dargestellten Material oder der Tesselierung der Oberfläche genau modelliert. Dies ermöglicht es Objekten im Spiel, die visuellen Eigenschaften realer Materialien korrekt nachzuahmen, einschließlich der korrekten Wiedergabe von Mikrooberflächen wie Abrieb und spiegelnden Glanzlichtern. Die auffälligsten Verbesserungen bestehen jedoch darin, dass eine genauere Darstellung des Reflexionsvermögens und des Glanzes aller Oberflächen möglich ist, auch derer aus flachen und undurchsichtigen (simulierten) Materialien.
Qualcomm und die Entwickler hinter der beliebten Unity Engine haben daran gearbeitet, PBR zugänglicher zu machen. Das Unternehmen arbeitet aber auch mit anderen Engine- und Spieleentwicklern zusammen, um mobile Spiele für Snapdragon zu optimieren Geräte. Game-Engines wie Unity, Unreal, Messiah und NeoX sind beispielsweise bereits für Snapdragon-Geräte optimiert und der Snapdragon 855 unterstützt die neuesten Grafik-APIs wie die neue Vulkan 1.1. Studios wie NetMarble, der hinter Lineage II: Revolutions steht, haben in der Vergangenheit auch mit Qualcomm zusammengearbeitet, um die Stärken der Snapdragon-Plattform optimal zur Geltung zu bringen. Darüber hinaus mit der Löwenmaul 675, wir sahen Gespräche über einen benutzerdefinierten Algorithmus, der bis zu erreicht 90 % weniger Ruckeln im Vergleich zur gleichen Plattform ohne Optimierungen, und die gleichen Änderungen wurden auch beim Snapdragon 855 vorgenommen. Es ist immer noch nicht klar, was diese Optimierungen bedeuten, und wir gehen nicht davon aus, dass sie anwendbar sind in jedem Spiel, aber es wird auf jeden Fall eine bessere Leistung bedeuten, zumindest bei den größeren Titeln Android.
Darüber hinaus ermöglichten die Snapdragon 835 und 845 die Wiedergabe bzw. Aufnahme von 10-Bit, echtes HDR-Video, der Qualcomm Snapdragon 855 wird der erste mobile Chipsatz sein, der dies ermöglicht echtes HDR-Gaming. Dies erfordert echte HDR-fähige Displays, die glücklicherweise bei Flaggschiff-Smartphones immer häufiger anzutreffen sind. Aus diesem Grund können Benutzer sattere Farben mit größerer Tontiefe, größerem Dynamikumfang (wie der Name schon sagt) und verbessertem Kontrast erwarten. Dies ist nicht unbedingt ein Muss, aber es ist auf jeden Fall schön, aktuelles HDR-Gaming geboten zu haben Setups erfordern teure HDR-fähige Fernseher und Monitore sowie leistungsfähige Computer und spezielle Spiele Konsolen. Mit dem Qualcomm Snapdragon 855 wird HDR beim Spielen wohl zugänglicher und bequemer (natürlich ohne Touchscreen-Steuerung).
Ein neuer Hexagon 690 DSP für KI-Workloads
Während das Unternehmen es in seinen Marketingmaterialien nicht ausdrücklich als „neuronale Verarbeitungseinheit“ bezeichnet, werden auch KI-Workloads vom neuen und verbesserten Hexagon 690 DSP profitieren. Qualcomm hat diese Co-Prozessoren vor vielen Generationen stillschweigend eingeführt (mit der ordnungsgemäßen Einführung von QDSP6 v6 neben dem 820), aber erst vor kurzem begannen sie damit, sie als einige der besseren SoC-Blöcke für zu präsentieren KI. Ursprünglich für die Beschleunigung von Imaging-Workloads konzipiert, eignete sich die Architektur des DSP – insbesondere durch die Einbeziehung von Hexagon Vector eXtensions (HVX) – hervorragend für ML-Aufgaben. Der DSP ist besser programmierbar als Hardware mit fester Funktion, behält aber dennoch einen Teil der Leistung bei Effizienzvorteile, die anwendungsspezifische Prozessorblöcke charakterisieren und die Skalar- und Vektorverarbeitung erheblich beschleunigen Operationen. Dies erwies sich als hervorragend für die sich ständig ändernden Bildverarbeitungsalgorithmen, die auf den DSP verlagert werden können, sich aber natürlich auch für KI-Workloads eignen. Der Hexagon DSP ist ein Segen für maschinelles Lernen auf Edge-Geräten aufgrund seines hervorragenden Multithreadings und parallelen Computings auf Hardwareebene, das Tausende von Bits verarbeiten kann Vektoreinheiten pro Verarbeitungszyklus, verglichen mit Hunderten von Bits eines durchschnittlichen CPU-Kerns pro Zyklus und der Bereitstellung mehrerer Offloads Sitzungen.
Der Hexagon DSP eignet sich besonders gut für Bildgebungsaufgaben, da er Daten direkt vom Bildsensor in den lokalen Speicher des DSP (L2-Cache) streamen kann und dabei den DDR-Speichercontroller des Geräts umgeht. Google nutzte beispielsweise die Bildverarbeitung des Hexagon DSP, um die HDR+-Algorithmen des Pixels und Pixel 2 zu betreiben, bevor es eigene auf den Markt brachte Pixel Visual Core. Es sind auch Hexagon-fähige Geräte, die die besten Ergebnisse über die beliebten Google Camera-Anschlüsse erzielen, die Sie erkunden können Hier. Es wird in Virtual- und Augmented-Reality-Workloads eingesetzt und ist bekanntermaßen die Grundlage für die inzwischen nicht mehr vorhanden Projekt Tango auf der Lenovo Phab 2 Pro Und ASUS ZenFone AR. Allerdings nutzen die meisten OEMs, die Snapdragon-Flaggschiffgeräte implementieren, den Hexagon DSP auf die eine oder andere Weise für die Bildverarbeitung, was Sie mit Tools wie überprüfen können Snapdragon Profiler.
Was ist also neu am neuen DSP? Der Hexagon 690 verdoppelte die Anzahl der Vektorbeschleuniger (HVX) von zwei auf vier, um mit den vier Skalar-Threads zusammenzuarbeiten, die ebenfalls eine Leistungssteigerung von 20 % verzeichnen. Darüber hinaus bringt der Hexagon 690 den ersten Tensorbeschleuniger für Mobilgeräte mit Hexagon Tensor Accelerator (HTA). Dies ist eine bedeutende Ergänzung: Es dient als Hardwarebeschleunigung für die teure Matrixmultiplikation und Integriert auch Nichtlinearitätsfunktionen (wie Sigmoid und ReLU) auf Hardwareebene, was die Geschwindigkeit weiter erhöht Inferenz. Diese Änderungen am DSP sollten umgesetzt werden bessere Leistung des Sprachassistenten, von der Hot-Word-Erkennung bis zum Parsen von Befehlen auf dem Gerät, und bietet beispielsweise eine verbesserte Echounterdrückung und Rauschunterdrückung. Qualcomm betont, dass sie eine vollständig heterogene Rechenplattform bereitstellen, die den Zugriff auf KI-Workloads ermöglicht entweder die CPU, die GPU oder der DSP oder eine beliebige Kombination der drei Blöcke – in den Worten von Gary Brotman von Qualcomm: dies es ist „Mehr als ein Kern, es ist mehr als Hardware, es ist ein komplettes System“. Ihre „Qualcomm AI Engine“ der 4. Generation geht auch über die Hardware hinaus, da wir auch Unterstützung für das Snapdragon Neural Processing SDK und Hexagon NN finden, um darauf zuzugreifen die oben genannten Blöcke sowie die Android NN API und beliebte ML-Frameworks wie Caffe/Caffe 2, TensorFlow/Lite und ONNX (Open Neural Network). Austausch). Insgesamt kann der Snapdragon 855 bieten dreimal so viel wie die reine KI-Leistung seines Vorgängers (und das Doppelte im Vergleich zu Huawei) und übertrifft damit 7 Billionen Operationen pro Sekunde (TOPs). Bedenken Sie jedoch, dass sich Qualcomm weiterhin auf eine heterogene Computerlösung konzentriert und nicht auf einen einzelnen dedizierten Block.
Weitere Informationen zum Hexagon DSP finden Sie unter Das Stück vom letzten Jahr im Detail, wie es bei KI-Workloads hilft.
Zusammenfassend lässt sich sagen, dass das Rechenpaket des Snapdragon 855 einige der wirkungsvollsten Verbesserungen im Vergleich zum Vorjahr mit sich bringt, die wir in den letzten Jahren gesehen haben. Der Spectra 380 ISP-CV, worüber wir in einem separaten Artikel berichtet haben, bringt auch enorme Leistungssteigerungen und Energieeffizienz mit sich und ermöglicht hervorragende neue Funktionen wie 4K 60FPS HDR-Videoaufzeichnung mit Porträtmodus oder Hintergrundwechsel (ziemlich flexibel!).
Wie in diesem Artikel erläutert, sollten sich diese Fortschritte und neuen Funktionen im gesamten Benutzererlebnis spürbar bemerkbar machen. Wir freuen uns auf den Qualcomm Snapdragon 855 und darauf, ihn bald ausführlich zu testen. Bleiben Sie also auf dem Laufenden bei XDA-Developers, um die neuesten Nachrichten und Analysen zum Snapdragon 855 zu erhalten!