Come Qualcomm ha migliorato prestazioni, giochi e intelligenza artificiale sullo Snapdragon 855

click fraud protection

La nuova piattaforma mobile Qualcomm Snapdragon 855 apporta grandi miglioramenti in termini di prestazioni, giochi e intelligenza artificiale e analizziamo come hanno fatto.

Allo Snapdragon Summit 2018 di Qualcomm, l'azienda ha annunciato il suo nuovissimo chipset di punta di livello premium: la piattaforma Snapdragon 855. Questo nuovo prodotto sarà al centro della maggior parte dei prolifici flagship del 2019, portando con sé la promessa di incredibili velocità dati attraverso il modem Snapdragon X50. Oltre a ciò, però, lo Snapdragon 855 apporta una serie di miglioramenti a ogni blocco system-on-chip, con negli ultimi tempi alcune unità di calcolo hanno registrato i maggiori miglioramenti in termini di prestazioni ed efficienza energetica su base annua storia.

Abbiamo già descritto in dettaglio lo Spectra 380 ISP-CV, ad esempio, che migliora ulteriormente la fotografia dello smartphone offrendo allo stesso tempo agli utenti un notevole risparmio della batteria. Anche se prestiamo sempre più attenzione ai componenti periferici come l'Hexagon DSP, gli appassionati pagano di più i blocchi principali Anche l'attenzione a, in particolare CPU e GPU, ha registrato miglioramenti più che modesti con miglioramenti dell'architettura e il passaggio a un nuovo processo nodo. In questo articolo, ricapitoleremo rapidamente le novità e ciò che è noto su CPU, GPU e DSP dello Snapdragon 855 e in che modo i miglioramenti e le nuove funzionalità potrebbero influire

tuo esperienza utente nel 2019.


CPU Kryo 485 basata su A76 e il passaggio a 7 nm

Lo Snapdragon 855 passa all'ultimo processo di produzione FinFET a 7 nm di TSMC. Di solito assistiamo a una revisione dei nodi ogni anno o due, con ridimensionamenti o ottimizzazioni a metà ciclo (come il passaggio da "Low-Power Early" (LPE) a "Low-Power Plus” (LPP) nei nodi Samsung-LSI), quindi è probabile che tu abbia sentito parlare di questi parametri in alcune notizie articolo. Ma cosa significa? In questo contesto, descrive le dimensioni delle caratteristiche dei transistor del processore, che a loro volta ci danno informazioni sul tipo di miglioramenti nella densità dei transistor che possiamo aspettarci con ogni nuova generazione. Con più transistor per unità di area, le prestazioni risultanti del processore possono essere aumentate. Questa caratteristica è importante anche poiché i nodi di processo più piccoli consentono di implementare i progetti di processori su scala ridotta, in modo intuitivo riduce lo spazio tra gli elementi del processore, accorciando a sua volta la distanza che gli elettroni devono percorrere per compiere calcolo. Ciò comporta miglioramenti nelle prestazioni e anche i processi più piccoli hanno una capacità inferiore, il che significa che i transistor possono accendersi e spegnersi con una latenza inferiore e con un'energia inferiore. Per riferimento, TSMC afferma che il passaggio al processo a 7 nm è stato raggiunto prestazioni ed efficienza energetica rispettivamente dell'ordine del 20% e del 40%., anche se questo è paragonato al processo FinFET a 10 nm di TSMC.

Per gli ultimi chipset di punta Snapdragon, abbiamo visto Qualcomm collaborare con Samsung e implementare il processo LPP/LPE da 14 nm e 10 nm. Il passaggio ai 7 nm di TSMC per lo Snapdragon 855 non è tuttavia inaspettato, dato che il processo a 7 nm di Samsung aveva è appena entrato nella produzione di massa in ottobre, anche se all'epoca era stato riferito che su di esso sarebbe stato costruito un chipset Qualcomm 5G. Inoltre, il design 7LPP di Samsung è prodotto con una tecnica di litografia migliorata nota come litografia ultravioletta estrema (EUVL), ottenendo una riduzione dell'area del 40% a parità di complessità di progettazione, con velocità più elevate del 20% o consumo energetico inferiore del 50% rispetto al FinFET da 10 nm predecessori. Ogni nuovo salto verso nodi di processo più piccoli viene celebrato proprio perché sono così difficili da realizzare. Ad esempio, man mano che i transistor diventano più piccoli, potrebbero mostrare una maggiore "dispersione" o corrente che scorre attraverso i transistor "spenti", aumentando il consumo di energia statica negli stati inattivi. E mentre i chip più piccoli con un numero maggiore di transistor potrebbero consentire di ottenere il massimo da un dato wafer di silicio, la resa tende ad essere inferiore a causa della summenzionata perdita, oltre alla difficoltà di ottenere processori con un "binned superiore" che funzionino al loro (alto) riferimento frequenze. Questi sono giusti Alcuni dei molti ostacoli allo sviluppo che ovviamente vengono risolti nel momento in cui un nuovo nodo di processo raggiunge la produzione di massa, ma in In breve, ci sono molte sfide di ricerca e sviluppo e di produzione che si aggiungono al costo di implementazione di una nuova dimensione del processo mercato.

L'ultima architettura ARM A76 concessa in licenza per il Kryo 485 è un altro grande contributo ai sostanziali miglioramenti di anno in anno che vediamo con il Qualcomm Snapdragon 855. Il core A76 è un nuovissimo design vuoto degli uffici ARM di Austin, caratterizzato da una nuova microarchitettura costruita da zero per offrire ciò che ARM chiama "prestazioni di classe laptop con efficienza mobile." Si tratta ancora di un design semi-personalizzato e Qualcomm ha apportato miglioramenti come il prerecupero dei dati ottimizzato per una migliore efficienza e un'esecuzione fuori ordine più ampia finestra. Questo nuovo design offre alcuni enormi miglioramenti prestazionali rispetto all'A75, su cui erano basati i core Gold dello Snapdragon 845: promette un Miglioramento delle prestazioni del 35% e efficienza energetica migliore del 40%.. Confrontando l'A75 con un processo a 10 nm rispetto all'A76 con un processo a 7 nm allo stesso inviluppo di potenza di 750 mW/core, il vantaggio prestazionale cresce fino al 40% a favore del nuovo core e anche il risparmio energetico può aumentare al 50%. Inoltre, sono stati apportati altri miglioramenti alle pipeline ASIMD (Asymmetric Single Instruction Multiple Data) e istruzioni sul prodotto punto aggregare fino a circa 3,9 volte miglioramenti nelle prestazioni delle attività di apprendimento automatico, come l'inferenza nelle reti neurali convoluzionali. Tutto ciò equivale a prestazioni per area leader del settore e ad un ottimo complemento al nuovo processo a 7 nm, con il "Prime core" da 2,84 GHz di Qualcomm che si avvicina alla velocità di clock di riferimento di 3 GHz ARM. aveva usato quando si dettagliano i dettagli del nuovo nucleo. Nel complesso, Qualcomm promette un miglioramento assolutamente massiccio delle prestazioni della CPU del 45%. rispetto agli 845, il più grande aumento su base annua finora registrato.

Parlando del "core Prime" dello Snapdragon 855, non sorprende nemmeno vedere Qualcomm adottare questa nuova configurazione del cluster visti i miglioramenti rispetto ai grandi. LITTLE abilitato da ARM DynamIQ piattaforme tecnologiche. In sostanza, DynamIQ consente maggiore flessibilità e scalabilità nella progettazione di processori multi-core, consentendo progetti di più core in un dato cluster, nonché un controllo capillare della tensione per core. (MODIFICA: in una sessione di domande e risposte, Qualcomm ha confermato che il core Prime condivide il suo dominio di potenza con il cluster di prestazioni, limitando l'utilità qui descritta). L'A76 è particolarmente adatto per un core premium così solitario con un proprio clock, dato che spinge oltre i limiti quando si tratta di single-thread prestazioni con il 25% in più di istruzioni intere per clock rispetto all'A75 e prestazioni ASIMD e in virgola mobile superiori del 35%, offrendo al contempo prestazioni superiori del 90% Banda di memoria. In breve, l’A76 presenta un salto generazionale maggiore rispetto alle generazioni precedenti, che senza dubbio ha contribuito anche al successo di Qualcomm. aumento delle prestazioni anno su anno maggiore del solito per lo Snapdragon 855 (per riferimento, Qualcomm ha citato un aumento dal 25 al 30% per l'845 rispetto l'835). Questo potrebbe essere sufficiente per mettere le prestazioni del Qualcomm Snapdragon 855 davanti al core Mongoose 3 (M3) di Samsung LSI presente nell'Exynos 9810, anche se quel particolare design soffriva di efficienza energetica in un modo che i chip Qualcomm non hanno fatto, e che lo Snapdragon 855 molto probabilmente non lo farà O.

Cosa significa per l'utente finale? Naturalmente, dovremmo aspettarci un aumento dei core di riferimento: ARM prevede punteggi Geekbench più alti del 28% per i dispositivi mobili e prestazioni Javascript migliorate del 35%. Al di là dei benchmark, che potrebbero avere poca relazione con l'esperienza dell'utente finale, l'A76 continua l'attenzione dell'A75 su prestazione sostenuta, il che significa che gli utenti dovrebbero aspettarsi meno throttling durante le sessioni di gioco prolungate. Il passaggio a 7 nm combinato con il nuovo design principale si tradurrà sicuramente in una batteria notevole miglioramenti della vita per gli utenti finali, e questa è forse la caratteristica più interessante di questo set di aggiornamenti. Anche il nuovo core "Prime" è interessante, dato che un core solitario focalizzato sulle migliori prestazioni a thread singolo potrebbe rivelarsi utile in applicazioni e processi che non sono impostati per trarne il massimo vantaggio multithreading. Naturalmente, il processo di produzione a 7 nm influisce ulteriormente anche sugli altri blocchi dello Snapdragon 855, garantendo lo stesso risparmio energetico. ad altre unità di calcolo coinvolte anche nell'esperienza quotidiana dell'utente, come l'elaborazione delle immagini per la fotografia con smartphone.


"Snapdragon Elite Gaming Experience" e GPU Adreno 640

Questa volta il Qualcomm Snapdragon 855 si concentra fortemente sui giochi, una svolta degli eventi non sorprendente data la popolarità dei titoli come Fortnite e PlayerUnknown’s Battlegrounds, nonché la crescente popolarità degli eSport mobili (sì, è una realtà) in Asia. Secondo i dati mostrati da Qualcomm dal Rapporto sul mercato globale dei giochi Newzoo 2017, i giochi mobili sono in crescita con un fatturato totale previsto per il 2018 di 70,3 miliardi di dollari, che costituisce il 51% di tutti i ricavi dei giochi grazie a un aumento del 25,5% su base annua.

La GPU Adreno 640 porta un sano Aumento del 20% delle prestazioni grafiche, aumentando ulteriormente il vantaggio di Qualcomm rispetto alla concorrenza in questa particolare area. Per riferimento, tuttavia, lo Snapdragon 845 ha apportato un miglioramento del 30% rispetto allo Snapdragon 835, che a sua volta offriva un miglioramento del 30% rispetto allo Snapdragon 821. Tuttavia, ciò dovrebbe mantenere Qualcomm all'avanguardia nelle prestazioni grafiche e, soprattutto, nelle prestazioni per watt se riescono a migliorare anche su questo fronte. Al di là di questa cifra, Qualcomm è più riservata che mai quando si tratta dell'Adreno: abbiamo sentito parlare dell'integrato microcontrollore per la gestione dell'alimentazione e come il 640 abbia il minor sovraccarico del driver, sebbene l'azienda abbia menzionato il inclusione di 50% in più di unità logiche aritmetiche (ALU) che accelererebbero ulteriormente le prestazioni dell’IA.

Una cosa di cui Qualcomm ha parlato molto durante i briefing è il desiderio di portare il "rendering basato sulla fisica" (PBR) in più esperienze di gioco mobile. PBR è un modello di shading che consente una resa grafica realistica, modellando accuratamente il flusso luminoso in conformità con il materiale rappresentato nelle texture o nella tassellatura della superficie. Ciò consente agli oggetti di gioco di imitare correttamente le proprietà visive dei materiali del mondo reale, incluso il corretto rendering di microsuperfici come abrasioni e luci speculari. I miglioramenti più evidenti, tuttavia, riguardano il modo in cui consente una rappresentazione più accurata della riflettività e della brillantezza di tutte le superfici, anche quelle di materiali piatti e opachi (simulati).

Qualcomm e gli sviluppatori del popolare Unity Engine hanno lavorato per rendere PBR più accessibile, ma l'azienda collabora anche con altri sviluppatori di motori e giochi per ottimizzare i giochi mobili per Snapdragon dispositivi. I motori di gioco come Unity, Unreal, Messiah e NeoX sono già ottimizzati per i dispositivi Snapdragon, ad esempio, e lo Snapdragon 855 supporta le API grafiche più recenti come la nuova Vulcano 1.1. Anche studi come NetMarble, che è dietro Lineage II: Revolutions, hanno lavorato con Qualcomm in passato per mostrare al meglio i punti di forza della piattaforma Snapdragon. Inoltre, con il Snapdragon 675, abbiamo visto parlare di un algoritmo personalizzato che ha raggiunto fino a 90% di scatti in meno rispetto alla stessa piattaforma senza ottimizzazioni e le stesse modifiche sono arrivate allo Snapdragon 855. Non è ancora chiaro cosa comportino queste ottimizzazioni e non ci aspettiamo che siano applicabili ogni gioco, ma ciò significherà sicuramente prestazioni migliori, almeno nei titoli più grandi Androide.

Oltre a tutto ciò, mentre gli Snapdragon 835 e 845 consentivano la riproduzione e l'acquisizione (rispettivamente) di Video HDR a 10 bit, il Qualcomm Snapdragon 855 sarà il primo chipset mobile che consentirà vero gioco HDR. Ciò richiederà veri display compatibili con HDR, che fortunatamente sono sempre più comuni tra gli smartphone di punta. Per questo motivo, gli utenti possono aspettarsi colori più ricchi con maggiore profondità tonale, gamma dinamica più elevata (come suggerisce il nome) e contrasto migliorato. Questa non è necessariamente una funzionalità indispensabile, ma è sicuramente bello averla data agli attuali giochi HDR le configurazioni richiedono costosi televisori e monitor compatibili con HDR, nonché computer capaci e giochi specifici console. Con Qualcomm Snapdragon 855, l'HDR nei giochi sarà probabilmente più accessibile e conveniente (senza i controlli touchscreen, ovviamente).


Un nuovo DSP Hexagon 690 per carichi di lavoro AI

Sebbene la società non la chiami esplicitamente “unità di elaborazione neurale” nei suoi materiali di marketing, anche i carichi di lavoro AI beneficeranno del nuovo e migliorato DSP Hexagon 690. Qualcomm ha introdotto silenziosamente questi coprocessori molte generazioni fa (con la corretta introduzione del processore QDSP6 v6 insieme all'820), ma solo di recente hanno iniziato a presentarli come alcuni dei migliori blocchi SoC per AI. Originariamente progettata per accelerare i carichi di lavoro di imaging, l'architettura del DSP, in particolare con l'inclusione di Hexagon Vector eXtensions (HVX), è diventata perfetta per le attività di ML. Il DSP è più programmabile dell'hardware a funzione fissa, pur mantenendo alcune delle prestazioni e vantaggi in termini di efficienza che caratterizzano i blocchi processore specifici dell'applicazione, accelerando notevolmente scalare e vettoriale operazioni. Ciò si è rivelato eccellente per gli algoritmi di elaborazione delle immagini in continua evoluzione che possono essere scaricati sul DSP, ma si presta naturalmente anche ai carichi di lavoro AI. L'Hexagon DSP è stato un vantaggio per l’apprendimento automatico sui dispositivi edge grazie al suo eccellente multi-threading a livello hardware e al calcolo parallelo, in grado di gestire migliaia di bit unità vettoriali per ciclo di elaborazione, rispetto alle centinaia di bit per ciclo di un core CPU medio e che servono più offload sessioni.

Il DSP Hexagon è particolarmente adatto per attività di imaging in quanto può trasmettere i dati direttamente dal sensore di immagine alla memoria locale del DSP (L2 Cache), bypassando il controller di memoria DDR del dispositivo. Google, ad esempio, ha utilizzato l'elaborazione delle immagini dell'Hexagon DSP per alimentare gli algoritmi HDR+ di Pixel e Pixel 2, prima di introdurre i propri algoritmi Nucleo visivo pixel. Sono anche i dispositivi predisposti per Hexagon che ottengono i migliori risultati dalle popolari conversioni di Google Camera, che puoi esplorare Qui. È stato utilizzato nei carichi di lavoro di realtà virtuale e aumentata, alimentando notoriamente ormai defunto Progetto Tango sul Lenovo Phab2 Pro E ASUS ZenFone AR. Detto questo, la maggior parte degli OEM che implementano i dispositivi di punta Snapdragon utilizzano il DSP Hexagon per l'elaborazione delle immagini in un modo o nell'altro, cosa che puoi verificare utilizzando strumenti come Profilo Snapdragon.

Allora cosa c’è di nuovo con il nuovo DSP? L'Hexagon 690 ha raddoppiato il numero di acceleratori vettoriali (HVX) da due a quattro per lavorare in tandem con i quattro thread scalari, che vedono anche un miglioramento delle prestazioni del 20%. Inoltre, Hexagon 690 porta con sé il primo acceleratore tensore per dispositivi mobili Acceleratore tensore esagono (HTA). Questa è un'aggiunta significativa: serve come accelerazione hardware per costose moltiplicazioni di matrici e integra anche funzioni di non linearità (come sigmoid e ReLU) a livello hardware, velocizzando ulteriormente inferenza. Queste modifiche al DSP dovrebbero tradursi in migliori prestazioni dell'assistente vocale, dal rilevamento delle parole chiave all'analisi dei comandi sul dispositivo, offrendo, ad esempio, una migliore cancellazione dell'eco e soppressione del rumore. Qualcomm sottolinea di fornire una piattaforma di calcolo eterogenea completa che consente di attingere al carico di lavoro dell'intelligenza artificiale o la CPU, la GPU o il DSP, o qualsiasi combinazione dei tre blocchi: secondo le parole di Gary Brotman di Qualcomm, questo suo "più di un core, è più dell'hardware, è un sistema completo". Il loro "Qualcomm AI Engine" di quarta generazione va oltre l'hardware, poiché troviamo anche il supporto per Snapdragon Neural Processing SDK e Hexagon NN per accedere i blocchi sopra menzionati, nonché l'API Android NN e i framework ML più diffusi come Caffe/Caffe 2, TensorFlow/Lite e ONNX (Open Neural Network Scambio). Nel complesso, lo Snapdragon 855 può offrire tre volte le prestazioni grezze dell'IA del suo predecessore (e due volte rispetto a Huawei), superando 7 trilioni di operazioni al secondo (TOP). Tieni presente, tuttavia, che Qualcomm continua a concentrarsi su una soluzione informatica eterogenea anziché concentrarsi su un singolo blocco dedicato.

Per saperne di più sull'Hexagon DSP, dai un'occhiata il pezzo dell'anno scorso descrivendo in dettaglio come aiuta con i carichi di lavoro dell'intelligenza artificiale.


In sintesi, il pacchetto di elaborazione dello Snapdragon 855 apporta alcuni dei miglioramenti di maggior impatto anno dopo anno che abbiamo visto negli ultimi anni. Lo Spectra 380 ISP-CV, di cui abbiamo parlato in un articolo separato, apporta inoltre enormi miglioramenti alle prestazioni e all'efficienza energetica, consentendo nuove eccellenti funzionalità come la registrazione video HDR 4K 60FPS con modalità ritratto o scambio di sfondo (piuttosto flessibile!).

Come spiegato in questo articolo, questi progressi e nuove funzionalità dovrebbero farsi sentire in modo tangibile durante l'esperienza dell'utente. Non vediamo l'ora di provare Qualcomm Snapdragon 855 e di poterlo testare presto in modo approfondito, quindi rimanete sintonizzati su XDA-Developers per le ultime notizie e analisi sullo Snapdragon 855!