Het nieuwe mobiele platform Qualcomm Snapdragon 855 brengt grote verbeteringen met zich mee op het gebied van prestaties, gaming en AI, en we leggen uit hoe ze dat hebben gedaan.
Op Qualcomm's Snapdragon Summit 2018 presenteerde het bedrijf hebben hun nieuwste premium-tier vlaggenschip-chipset aangekondigd: het Snapdragon 855-platform. Dit nieuwe product zal de kern vormen van de meeste productieve vlaggenschepen van 2019, en brengt de belofte van ongelooflijke datasnelheden via de Snapdragon X50-modem met zich mee. Maar daarnaast brengt de Snapdragon 855 een hele reeks verbeteringen aan elk systeem-op-chip-blok, met Sommige rekeneenheden zien de laatste tijd de grootste prestatie- en energie-efficiëntieverbeteringen op jaarbasis geschiedenis.
We hebben de Spectra 380 ISP-CV al gedetailleerd beschreven, wat bijvoorbeeld de smartphonefotografie nog verder verbetert en gebruikers tegelijkertijd een gezonde batterijbesparing oplevert. Hoewel we steeds meer aandacht besteden aan randcomponenten zoals de Hexagon DSP, betalen de kernblokken het meest voor liefhebbers aandacht voor – namelijk de CPU en GPU – hebben ook meer dan bescheiden winst geboekt met architecturale verbeteringen en de overstap naar een nieuw proces knooppunt. In dit artikel zullen we snel samenvatten wat er nieuw is en wat er bekend is over de CPU, GPU en DSP van de Snapdragon 855, en hoe de verbeteringen en nieuwe functies van invloed kunnen zijn
jouw gebruikerservaring anno 2019.A76-gebaseerde Kryo 485 CPU en de overstap naar 7nm
De Snapdragon 855 maakt gebruik van TSMC's nieuwste 7nm FinFET-productieproces. Normaal gesproken zien we elk jaar of twee een herziening van het knooppunt, met inkrimpingen of optimalisaties halverwege de cyclus (zoals de overstap van 'Low-Power Early' (LPE) naar "Low-Power Plus” (LPP) in Samsung-LSI-nodes), dus u heeft waarschijnlijk wel eens van deze statistieken gehoord in een of ander nieuwsbericht artikel. Maar wat betekent het? In deze context beschrijft het de omvang van de transistorfuncties van de processor, die ons op hun beurt inzicht geven in wat voor soort verbeteringen in de transistordichtheid we bij elke nieuwe generatie kunnen verwachten. Met meer transistors per oppervlakte-eenheid kunnen de resulterende prestaties van de processor worden opgeschaald. Deze functie is ook belangrijk omdat kleinere procesknooppunten het mogelijk maken om processorontwerpen op kleinere schaal te implementeren, wat intuïtief is verkleint de ruimte tussen de elementen van de processor, waardoor de afstand die elektronen moeten afleggen kleiner wordt berekening. Dit levert verbeteringen in de prestaties op, en kleinere processen hebben ook een lagere capaciteit, wat betekent dat transistors met een lagere latentie en met lagere energie kunnen worden in- en uitgeschakeld. Ter referentie: TSMC beweert dat de overstap naar hun 7nm-proces wordt bereikt prestaties en energie-efficiëntie in de orde van respectievelijk 20% en 40%, hoewel dat wordt vergeleken met TSMC’s eigen 10nm FinFET-proces.
Voor de afgelopen paar vlaggenschipchipsets van Snapdragon hebben we Qualcomm met Samsung zien samenwerken en hun 14nm en 10nm LPP/LPE-proces zien implementeren. De overstap naar TSMC's 7 nm voor de Snapdragon 855 is echter niet onverwacht, aangezien het 7 nm-proces van Samsung is net in oktober in massaproductie gegaan, hoewel destijds werd gemeld dat er een 5G Qualcomm-chipset op zou worden gebouwd. Bovendien is het 7LPP-ontwerp van Samsung vervaardigd met behulp van een verbeterde lithografietechniek die bekend staat als extreme ultraviolette lithografie (EUVL). wat een gebiedsreductie van 40% oplevert bij gelijke ontwerpcomplexiteit, met 20% hogere snelheden of 50% minder energieverbruik vergeleken met 10nm FinFET voorgangers. Elke nieuwe sprong naar kleinere procesknooppunten wordt juist gevierd omdat ze zo moeilijk te verwezenlijken zijn. Naarmate transistors kleiner worden, kunnen ze bijvoorbeeld een grotere 'lekkage' of stroom vertonen die door transistors loopt die 'uit' zijn, waardoor het statische energieverbruik in inactieve toestand toeneemt. En hoewel kleinere chips met een dichter aantal transistors het mogelijk zouden kunnen maken om het maximale uit een bepaalde siliciumwafel te halen, is de opbrengst meestal lager vanwege de bovengenoemde lekkage, plus problemen bij het verkrijgen van 'hogere binned'-processors die op hun (hoge) referentie draaien frequenties. Dit zijn gewoon sommige van de vele ontwikkelingshindernissen die uiteraard worden weggenomen tegen de tijd dat een nieuw procesknooppunt de massaproductie bereikt, maar in Kortom, er zijn veel R&D- en productie-uitdagingen die de kosten van het introduceren van een nieuwe procesomvang vergroten markt.
De nieuwste ARM A76-architectuur met licentie voor de Kryo 485 levert opnieuw een grote bijdrage aan de substantiële verbeteringen die we jaar na jaar zien bij de Qualcomm Snapdragon 855. De A76-kern is een gloednieuw, blanco ontwerp van ARM's kantoren in Austin, met een nieuwe micro-architectuur die helemaal opnieuw is opgebouwd om wat ARM 'prestaties van laptopklasse' noemt te leveren met mobiele efficiëntie." Het is nog steeds een semi-aangepast ontwerp en Qualcomm heeft verbeteringen aangebracht, zoals het geoptimaliseerde vooraf ophalen van gegevens voor betere efficiëntie, en een grotere uitvoering buiten de bestelling raam. Dit nieuwe ontwerp biedt een aantal enorme prestatieverbeteringen ten opzichte van de A75, waarop de Gold-kernen van de Snapdragon 845 waren gebaseerd: het belooft een 35% prestatieverbetering en 40% betere energie-efficiëntie. Bij het vergelijken van de A75 op een 10 nm-proces versus de A76 op een 7 nm-proces met hetzelfde vermogensbereik van 750 mW/core groeit het prestatievoordeel tot 40% in het voordeel van de nieuwe core, en de energiebesparingen kunnen ook stijgen tot 50%. Bovendien zijn er andere verbeteringen in Asymmetrische Single Instruction Multiple Data (ASIMD)-pijplijnen en dot-productinstructies geaggregeerd tot ~3,9x verbeteringen in de prestaties van machine learning-taken, zoals gevolgtrekking in convolutionele neurale netwerken. Dit alles komt neer op toonaangevende prestaties per gebied en een geweldige aanvulling op het nieuwe 7nm-proces, waarbij Qualcomm's 2,84GHz 'Prime core' dicht bij de 3GHz-referentiekloksnelheden ARM komt. heeft gebruikt bij het detailleren van de nieuwe kern. Globaal genomen, Qualcomm belooft een absoluut enorme verbetering van de CPU-prestaties met 45% ten opzichte van de 845, de grootste stijging op jaarbasis tot nu toe.
Over de ‘Prime core’ van de Snapdragon 855 gesproken, het is ook niet verrassend om te zien dat Qualcomm met deze nieuwe clusteropstelling in zee gaat, gezien de te grote verbeteringen. LITTLE mogelijk gemaakt door ARM's DynamIQ technologieplatforms. In wezen zorgt DynamIQ voor meer flexibiliteit en schaalbaarheid in het ontwerp van multi-core processors, waardoor meerdere kernontwerpen in een bepaald cluster mogelijk zijn, evenals fijnmazige spanningsregeling per kern. (EDIT: in een vraag en antwoord bevestigde Qualcomm dat de Prime-kern zijn machtsdomein deelt met het prestatiecluster, waardoor het hier beschreven hulpprogramma wordt beperkt). De A76 past bijzonder goed bij zo'n eenzame premium kern met een eigen klok, aangezien hij de grenzen verlegt als het gaat om single-thread prestaties met 25% meer integer-instructies per klok dan de A75, en 35% hogere ASIMD- en floating-point-prestaties, terwijl ze 90% hogere prestaties bieden Geheugenbandbreedte. Kortom, de A76 biedt een grotere generatieverbetering dan voorgaande generaties, wat ongetwijfeld heeft bijgedragen aan de ook een groter dan gebruikelijke prestatieverbetering op jaarbasis voor de Snapdragon 855 (ter referentie: Qualcomm noemde een stijging van 25 tot 30% voor de 845 ten opzichte van de 835). Dit zou genoeg kunnen zijn om de resulterende prestaties van de Qualcomm Snapdragon 855 boven de Mongoose 3 (M3) kern van Samsung LSI te plaatsen die in de Exynos 9810 wordt aangetroffen. hoewel dat specifieke ontwerp te lijden had onder energie-efficiëntie op een manier die Qualcomm-chips niet hebben, en dat de Snapdragon 855 hoogstwaarschijnlijk niet zal doen of.
Wat betekent het voor de eindgebruiker? Natuurlijk mogen we meer benchmarkkernen verwachten: ARM projecteert 28% hogere Geekbench-scores voor mobiel en 35% verbeterde Javascript-prestaties. Naast benchmarks, die misschien weinig verband houden met de eindgebruikerservaring, zet de A76 de focus van de A75 voort op aanhoudende prestaties, wat betekent dat gebruikers minder throttling mogen verwachten tijdens langdurige gamesessies. De overstap naar 7 nm in combinatie met het nieuwe kernontwerp zal zeker resulteren in een merkbare batterij levensverbeteringen voor eindgebruikers, en dat is misschien wel het meest aantrekkelijke kenmerk van deze set upgrades. De nieuwe 'Prime'-kern is ook interessant, aangezien een enkele kern die zich richt op top-single-threaded prestaties nuttig blijken in toepassingen en processen die niet zijn opgezet om er goed gebruik van te maken multi-threading. Natuurlijk heeft het 7nm-productieproces ook een verdere impact op andere blokken van de Snapdragon 855, met dezelfde energiebesparingen als gevolg. naar andere rekeneenheden die ook betrokken zijn bij de dagelijkse gebruikerservaring, zoals beeldverwerking voor smartphonefotografie.
'Snapdragon Elite Gaming Experience' en Adreno 640 GPU
De Qualcomm Snapdragon 855 richt zich deze keer sterk op gaming, een niet verrassende gang van zaken gezien de populariteit van titels zoals Fortnite en PlayerUnknown’s Battlegrounds, evenals de toenemende populariteit van mobiele eSports (ja, dit bestaat) in Azië. Dat blijkt uit cijfers van Qualcomm van de Newzoo 2017 Global Games Market-rapportmobiele gaming is in opkomst met een verwachte totale omzet van 70,3 miljard dollar in 2018, wat 51% van alle gaming-inkomsten vertegenwoordigt, dankzij een stijging van 25,5% jaar-op-jaar.
De Adreno 640 GPU zorgt voor een gezonde 20% verbetering van de grafische prestaties, wat de voorsprong van Qualcomm op de concurrentie op dit specifieke gebied verder vergroot. Ter referentie: de Snapdragon 845 zorgde voor een stijging van 30% ten opzichte van de Snapdragon 835, die zelf ook een verbetering van 30% bood ten opzichte van de Snapdragon 821. Toch zou dit Qualcomm voorop moeten houden op het gebied van grafische prestaties, en vooral de prestaties per watt, als ze erin slagen ook op dat front te verbeteren. Afgezien van dat cijfer is Qualcomm net zo geheimzinnig als altijd als het om de Adreno gaat: we hoorden over de geïntegreerde microcontroller voor energiebeheer, en hoe de 640 de laagste driver-overhead heeft, hoewel het bedrijf de opname van 50% meer rekenkundige logische eenheden (ALU’s) die de AI-prestaties verder zouden versnellen.
Eén ding waar Qualcomm veel tijd aan besteedde tijdens briefings, is hun wens om ‘physically-based rendering’ (PBR) naar meer mobiele game-ervaringen te brengen. PBR is een schaduwmodel dat een realistische grafische weergave mogelijk maakt, waarbij de lichtstroom nauwkeurig wordt gemodelleerd in overeenstemming met het materiaal dat wordt weergegeven in texturen of de mozaïekpatroon van het oppervlak. Hierdoor kunnen in-game-objecten de visuele eigenschappen van materialen uit de echte wereld goed nabootsen, inclusief de juiste weergave van micro-oppervlakken zoals schaafwonden en spiegelende hooglichten. De meest opvallende verbeteringen zijn echter de manier waarop het een nauwkeuriger weergave mogelijk maakt van de reflectiviteit en glans van alle oppervlakken, zelfs die van platte en ondoorzichtige (gesimuleerde) materialen.
Qualcomm en de ontwikkelaars achter de populaire Unity Engine hebben gewerkt aan het toegankelijker maken van PBR. maar het bedrijf werkt ook samen met andere engine- en game-ontwikkelaars bij het optimaliseren van mobiele games voor Snapdragon apparaten. Game-engines zoals Unity, Unreal, Messiah en NeoX zijn bijvoorbeeld al geoptimaliseerd voor Snapdragon-apparaten, en de Snapdragon 855 ondersteunt de nieuwste grafische API’s zoals de nieuwe Vulkan 1.1. Studio's als NetMarble, die achter Lineage II: Revolutions zit, hebben in het verleden ook met Qualcomm samengewerkt om de sterke punten van het Snapdragon-platform zo goed mogelijk te laten zien. Bovendien is met de Leeuwebek 675, we zagen gesprekken over een aangepast algoritme dat tot 90% minder janken vergeleken met hetzelfde platform zonder de optimalisaties, en dezelfde veranderingen hebben hun weg gevonden naar de Snapdragon 855. Het is nog steeds niet duidelijk wat deze optimalisaties inhouden en we verwachten ook niet dat ze van toepassing zullen zijn elke game, maar het zal zeker betere prestaties betekenen in, in ieder geval, de grotere titels Android.
Bovendien, terwijl de Snapdragon 835 en 845 het afspelen en vastleggen (respectievelijk) van 10-bit, echte HDR-video, de Qualcomm Snapdragon 855 zal de eerste mobiele chipset zijn die dit mogelijk maakt echte HDR-gaming. Hiervoor zijn echte HDR-compatibele schermen nodig, die gelukkig steeds vaker voorkomen bij vlaggenschip-smartphones. Hierdoor kunnen gebruikers rijkere kleuren verwachten met meer toondiepte, een hoger dynamisch bereik (zoals geïmpliceerd door de naam) en een verbeterd contrast. Dit is niet per se een must-have-functie, maar het is zeker leuk om de huidige HDR-gaming te hebben gegeven Opstellingen vereisen dure HDR-ready tv's en monitoren, maar ook capabele computers en specifieke gaming consoles. Met de Qualcomm Snapdragon 855 zal HDR bij gaming aantoonbaar toegankelijker en handiger zijn (uiteraard zonder de touchscreenbediening).
Een nieuwe Hexagon 690 DSP voor AI-workloads
Hoewel het bedrijf het in zijn marketingmateriaal niet expliciet een ‘neurale verwerkingseenheid’ noemt, zullen AI-workloads ook profiteren van de nieuwe en verbeterde Hexagon 690 DSP. Qualcomm introduceerde deze co-processors vele generaties geleden stilletjes (met de juiste introductie van de QDSP6 v6 naast de 820), maar pas onlangs begonnen ze ze te pitchen als enkele van de betere SoC-blokken voor AI. Oorspronkelijk ontworpen voor het versnellen van beeldverwerkingswerklasten, werd de architectuur van de DSP – vooral met de toevoeging van Hexagon Vector eXtensions (HVX) – uitstekend geschikt voor ML-taken. De DSP is beter programmeerbaar dan hardware met vaste functionaliteit, terwijl toch een deel van de prestaties behouden blijft efficiëntievoordelen die toepassingsspecifieke processorblokken karakteriseren, waardoor scalair en vector aanzienlijk worden versneld activiteiten. Dit bleek uitstekend voor de steeds veranderende beeldverwerkingsalgoritmen die naar de DSP kunnen worden overgebracht, maar zich uiteraard ook lenen voor AI-werklasten. De Hexagon DSP is een zegen voor machinaal leren op edge-apparaten dankzij de uitstekende multi-threading op hardwareniveau en parallel computergebruik, die duizenden bits kunnen verwerken vectoreenheden per verwerkingscyclus, vergeleken met de honderden bits per cyclus van een gemiddelde CPU-kern, en meerdere offloads sessies.
De Hexagon DSP is bijzonder geschikt voor beeldverwerkingstaken, omdat deze gegevens rechtstreeks van de beeldsensor naar het lokale geheugen van de DSP (L2 Cache) kan streamen, waarbij de DDR-geheugencontroller van het apparaat wordt omzeild. Google gebruikte bijvoorbeeld de beeldverwerking van de Hexagon DSP om de HDR+-algoritmen van de Pixel en Pixel 2 aan te sturen, voordat ze hun eigen algoritmen introduceerden. Pixel visuele kern. Het zijn ook apparaten die geschikt zijn voor Hexagon en die de beste resultaten behalen met de populaire Google Camera-poorten, die u kunt verkennen hier. Het wordt gebruikt in virtuele en augmented reality-workloads, en staat bekend als de drijvende kracht achter de inmiddels ter ziele Project Tango op de Lenovo Phab 2 Pro En ASUS ZenFone AR. Dat gezegd hebbende, gebruiken de meeste OEM's die Snapdragon-vlaggenschipapparaten implementeren op de een of andere manier de Hexagon DSP voor beeldverwerking, wat je kunt verifiëren met tools zoals Leeuwebek Profiler.
Dus wat is er nieuw met de nieuwe DSP? De Hexagon 690 verdubbelde het aantal vectorversnellers (HVX) van twee naar vier om samen te werken met de vier scalaire threads, die ook verbeterde prestaties van 20% zien. Bovendien brengt de Hexagon 690 de eerste tensorversneller voor mobiel met de Zeshoekige tensorversneller (HTA). Dit is een belangrijke toevoeging: het dient als hardwareversnelling voor dure matrixvermenigvuldiging, en integreert ook niet-lineariteitsfuncties (zoals sigmoid en ReLU) op hardwareniveau, waardoor de snelheid verder wordt versneld gevolgtrekking. Deze wijzigingen in de DSP zouden zich moeten vertalen in betere prestaties van de stemassistent, van hot-word-detectie tot het parseren van opdrachten op het apparaat, met bijvoorbeeld verbeterde echo-onderdrukking en ruisonderdrukking. Qualcomm benadrukt dat ze een compleet heterogeen rekenplatform bieden waarmee AI-werklast kan worden benut ofwel de CPU, GPU of DSP, of een combinatie van de drie blokken - in de woorden van Gary Brotman van Qualcomm is dit zijn "meer dan één kern, het is meer dan hardware, het is een compleet systeem". Hun "Qualcomm AI Engine" van de 4e generatie gaat ook verder dan hardware, aangezien we ook ondersteuning vinden voor de Snapdragon Neural Processing SDK en Hexagon NN voor toegang de bovengenoemde blokken, evenals de Android NN API, en populaire ML-frameworks zoals Caffe/Caffe 2, TensorFlow/Lite en ONNX (Open Neural Network Aandelenbeurs). In totaal kan de Snapdragon 855 bieden drie keer de ruwe AI-prestaties van zijn voorganger (en tweemaal vergeleken met Huawei), een topper 7 biljoen operaties per seconde (TOP's). Houd er echter rekening mee dat Qualcomm zich blijft concentreren op een heterogene computeroplossing in plaats van zich te concentreren op een enkel speciaal blok.
Voor meer informatie over de Hexagon DSP, ga naar het stuk van vorig jaar waarin wordt beschreven hoe het helpt bij AI-workloads.
Samenvattend brengt het rekenpakket van de Snapdragon 855 enkele van de meest impactvolle verbeteringen op jaarbasis met zich mee die we de afgelopen jaren hebben gezien. De Spectra 380 ISP-CV, die we in een apart artikel hebben behandeld, zorgt ook voor een enorme verbetering van de prestaties en energie-efficiëntie, waardoor uitstekende nieuwe functies mogelijk zijn, zoals 4K 60FPS HDR-video-opname met portretmodus of achtergrondwissel (behoorlijk flexibel!).
Zoals uitgelegd in dit artikel, zouden deze verbeteringen en nieuwe functies tastbaar zichtbaar moeten zijn in de hele gebruikerservaring. We kijken uit naar de Qualcomm Snapdragon 855 en gaan hem binnenkort uitgebreid testen, dus houd XDA-Developers in de gaten voor het laatste Snapdragon 855-nieuws en analyses!