La nouvelle plate-forme mobile Qualcomm Snapdragon 855 apporte de grandes améliorations en termes de performances, de jeux et d'IA, et nous expliquons comment ils l'ont fait.
Lors du Snapdragon Summit 2018 de Qualcomm, la société a annoncé son tout nouveau chipset phare de niveau premium: la plate-forme Snapdragon 855. Ce nouveau produit sera au cœur de la plupart des produits phares prolifiques de 2019, apportant avec lui la promesse de vitesses de données incroyables via le modem Snapdragon X50. Au-delà de cela, le Snapdragon 855 apporte de nombreuses améliorations à chaque bloc système sur puce, avec certaines unités de calcul ont enregistré les plus grandes améliorations de performances et d'efficacité énergétique d'une année sur l'autre au cours des dernières années. histoire.
Nous avons déjà détaillé le Spectra 380 ISP-CV, par exemple, qui améliore encore la photographie sur smartphone tout en permettant aux utilisateurs de réaliser d'importantes économies de batterie. Alors que nous prêtons de plus en plus attention aux composants périphériques comme le Hexagon DSP, les blocs de base que les passionnés paient le plus l'attention portée, à savoir le CPU et le GPU, a également enregistré des gains plus que modestes grâce aux améliorations architecturales et au passage à un nouveau processus. nœud. Dans cet article, nous récapitulerons rapidement les nouveautés et ce que l’on sait du CPU, du GPU et du DSP du Snapdragon 855, ainsi que l’impact des améliorations et des nouvelles fonctionnalités.
ton expérience utilisateur en 2019.Processeur Kryo 485 basé sur A76 et passage à 7 nm
Le Snapdragon 855 passe au dernier processus de fabrication FinFET 7 nm de TSMC. Nous constatons généralement une révision des nœuds tous les ans ou tous les deux ans, avec des réductions de taille ou des optimisations à mi-cycle (comme le passage de "Low-Power Early" (LPE) à « Low-Power Plus » (LPP) dans les nœuds Samsung-LSI), vous avez donc probablement entendu parler de ces métriques dans l'une ou l'autre actualité article. Mais qu'est-ce que ça veut dire? Dans ce contexte, il décrit la taille des caractéristiques du transistor du processeur, ce qui nous indique à quel type d'amélioration de la densité des transistors nous pouvons nous attendre avec chaque nouvelle génération. Avec plus de transistors par unité de surface, les performances du processeur qui en résultent peuvent être augmentées. Cette fonctionnalité est également importante dans la mesure où des nœuds de processus plus petits permettent de mettre en œuvre des conceptions de processeurs à plus petite échelle, ce qui intuitivement. réduit l'espace entre les éléments du processeur, raccourcissant ainsi la distance que les électrons doivent parcourir pour accomplir calcul. Cela permet d'améliorer les performances, et les processus plus petits ont également une capacité plus faible, ce qui signifie que les transistors peuvent s'allumer et s'éteindre avec une latence plus faible et une énergie moindre. Pour référence, TSMC affirme que le passage à son processus 7 nm permet d'obtenir performances et efficacité énergétique de l’ordre de 20% et 40% respectivement, bien que cela soit comparé au processus FinFET 10 nm de TSMC.
Pour les derniers chipsets phares Snapdragon, nous avons vu Qualcomm travailler avec Samsung et mettre en œuvre leur processus LPP/LPE 14 nm et 10 nm. Le passage au 7 nm de TSMC pour le Snapdragon 855 n'est cependant pas inattendu, étant donné que le processus 7 nm de Samsung avait vient d'entrer en production de masse en octobre, bien qu'à l'époque, il ait été signalé qu'un chipset Qualcomm 5G serait construit dessus. De plus, la conception 7LPP de Samsung est fabriquée selon une technique de lithographie améliorée connue sous le nom de lithographie ultraviolette extrême (EUVL), permettant une réduction de surface de 40 % à complexité de conception égale, avec des vitesses 20 % plus rapides ou 50 % de consommation d'énergie en moins par rapport au FinFET 10 nm prédécesseurs. Chaque nouveau saut vers des nœuds de processus plus petits est célébré précisément parce qu'ils sont si difficiles à réaliser. Par exemple, à mesure que les transistors deviennent plus petits, ils peuvent présenter des « fuites » ou un courant plus important circulant à travers les transistors « éteints », augmentant ainsi la consommation d'énergie statique dans les états de repos. Et même si des puces plus petites avec un nombre de transistors plus dense peuvent permettre de tirer le meilleur parti d'une plaquette de silicium donnée, le rendement a tendance à être inférieur. en raison de la fuite susmentionnée, ainsi que de la difficulté d'obtenir des processeurs « à compartiment supérieur » qui fonctionnent à leur (haute) référence fréquences. Ce sont juste quelques des nombreux obstacles au développement qui sont bien sûr surmontés au moment où un nouveau nœud de processus atteint la production de masse, mais en En bref, il existe de nombreux défis en matière de R&D ainsi que de fabrication qui augmentent le coût de l'introduction d'une nouvelle taille de processus. marché.
La dernière architecture ARM A76 sous licence pour le Kryo 485 est un autre grand contributeur aux améliorations substantielles d'année en année que nous constatons avec le Qualcomm Snapdragon 855. Le cœur A76 est une toute nouvelle conception vierge des bureaux d'ARM à Austin, dotée d'une nouvelle micro-architecture construite à partir de zéro pour offrir ce qu'ARM appelle « des performances de classe ordinateur portable avec efficacité mobile." Il s'agit toujours d'une conception semi-personnalisée, et Qualcomm a apporté des améliorations telles que la prélecture optimisée des données pour une meilleure efficacité et une exécution dans le désordre plus importante. fenêtre. Ce nouveau design offre d'énormes améliorations de performances par rapport à l'A75, sur lequel étaient basés les cœurs Gold du Snapdragon 845: il promet un Amélioration des performances de 35 % et efficacité énergétique améliorée de 40 %. Lorsque l'on compare l'A75 sur un processus 10 nm par rapport à l'A76 sur un processus 7 nm avec la même enveloppe de puissance de 750 mW/cœur, l'avantage en termes de performances passe à 40 % en faveur du nouveau cœur, et les économies d'énergie peuvent également augmenter à 50%. De plus, d'autres améliorations apportées aux pipelines ASIMD (Asymétrique Single Instruction Multiple Data) et instructions sur les produits scalaires totalisent environ 3,9 fois les améliorations des performances des tâches d'apprentissage automatique, comme l'inférence dans les réseaux neuronaux convolutifs. Tout cela équivaut à des performances par zone de pointe et un excellent complément au nouveau processus 7 nm, avec le « cœur principal » de 2,84 GHz de Qualcomm se rapprochant des vitesses d'horloge de référence de 3 GHz ARM. avait utilisé lors du détail du nouveau noyau. En tout, Qualcomm promet une amélioration absolument massive des performances du processeur de 45 % sur 845, soit la plus forte augmentation d’une année sur l’autre à ce jour.
En parlant du « cœur principal » du Snapdragon 855, il n’est pas non plus surprenant de voir Qualcomm s’implanter dans cette nouvelle configuration de cluster étant donné les améliorations apportées par rapport aux grandes améliorations. PEU activé par ARM DynamIQ plateformes technologiques. Essentiellement, DynamIQ permet plus de flexibilité et d'évolutivité dans la conception de processeurs multicœurs, permettant des conceptions à plusieurs cœurs dans un cluster donné, ainsi qu'un contrôle précis de la tension par cœur. (EDIT: lors d'une séance de questions-réponses, Qualcomm a confirmé que le cœur Prime partage son domaine d'alimentation avec le cluster de performances, limitant ainsi l'utilitaire décrit ici). L'A76 convient particulièrement bien à un noyau premium aussi solitaire avec sa propre horloge, étant donné qu'il repousse les limites en matière de monothread. performances avec 25 % d'instructions entières par horloge en plus que l'A75 et des performances ASIMD et à virgule flottante 35 % supérieures, tout en offrant 90 % de plus bande passante mémoire. En bref, l’A76 présente une plus grande élévation générationnelle que les générations précédentes, ce qui a sans aucun doute contribué à l’essor de Qualcomm. augmentation des performances d'une année sur l'autre plus importante que d'habitude pour le Snapdragon 855 (pour référence, Qualcomm a cité une augmentation de 25 à 30 % pour le 845 par rapport à le 835). Cela pourrait suffire à faire passer les performances du Qualcomm Snapdragon 855 devant le cœur Mongoose 3 (M3) de Samsung LSI trouvé dans l'Exynos 9810, bien que cette conception particulière ait souffert de l'efficacité énergétique d'une manière que les puces Qualcomm n'ont pas, et que le Snapdragon 855 ne le fera probablement pas soit.
Qu'est-ce que cela signifie pour l'utilisateur final? Bien sûr, nous devrions nous attendre à une augmentation des cœurs de référence: ARM projette des scores Geekbench 28 % plus élevés pour les mobiles et des performances Javascript améliorées de 35 %. Au-delà des références, qui pourraient avoir peu de rapport avec l'expérience de l'utilisateur final, l'A76 poursuit l'accent mis par l'A75 sur performance soutenue, ce qui signifie que les utilisateurs doivent s'attendre à moins de limitation pendant les sessions de jeu prolongées. Le passage à 7 nm combiné à la nouvelle conception de base se traduira très certainement par une batterie visible améliorations de la vie des utilisateurs finaux, et c'est peut-être la caractéristique la plus attrayante de cet ensemble de mises à niveau. Le nouveau noyau « Prime » est également intéressant, étant donné qu'un noyau isolé axé sur les meilleures performances monothread pourrait s'avérer bénéfiques dans les applications et les processus qui ne sont pas configurés pour tirer pleinement parti de multi-thread. Bien entendu, le processus de fabrication en 7 nm a également un impact sur les autres blocs du Snapdragon 855, entraînant les mêmes économies d'énergie. à d'autres unités de calcul également impliquées dans l'expérience utilisateur quotidienne, comme le traitement d'images pour la photographie sur smartphone.
« Expérience de jeu Snapdragon Elite » et GPU Adreno 640
Le Qualcomm Snapdragon 855 se concentre cette fois-ci fortement sur les jeux, une tournure des événements sans surprise compte tenu de la popularité des titres. comme Fortnite et PlayerUnknown's Battlegrounds ainsi que la popularité croissante des eSports mobiles (oui, c'est une chose) en Asie. Selon les chiffres présentés par Qualcomm du Rapport Newzoo 2017 sur le marché mondial des jeux, les jeux mobiles sont en hausse avec un chiffre d'affaires total attendu de 70,3 milliards de dollars en 2018, soit 51 % de tous les revenus des jeux grâce à une augmentation de 25,5 % d'une année sur l'autre.
Le GPU Adreno 640 apporte une bonne santé 20 % d'augmentation des performances graphiques, renforçant encore l’avance de Qualcomm sur la concurrence dans ce domaine particulier. À titre de référence, cependant, le Snapdragon 845 a apporté une augmentation de 30 % par rapport au Snapdragon 835, qui lui-même offrait également une amélioration de 30 % par rapport au Snapdragon 821. Néanmoins, cela devrait permettre à Qualcomm de conserver une longueur d'avance en termes de performances graphiques et, plus important encore, de performances par watt s'ils parviennent également à s'améliorer sur ce front. Au-delà de ce chiffre, Qualcomm est toujours aussi secret en ce qui concerne l'Adreno: on a entendu parler du système intégré microcontrôleur pour la gestion de l'énergie, et comment le 640 a la charge de pilote la plus faible, bien que la société ait mentionné le inclusion de 50 % d'unités arithmétiques et logiques en plus (ALU) qui accéléreraient encore les performances de l’IA.
Une chose dont Qualcomm a passé beaucoup de temps à parler lors des briefings est son désir d’apporter le « rendu physique » (PBR) à davantage d’expériences de jeu mobiles. PBR est un modèle d'ombrage qui permet un rendu graphique réaliste, modélisant avec précision le flux lumineux en fonction du matériau représenté dans les textures ou le pavage de la surface. Cela permet aux objets du jeu d'imiter correctement les propriétés visuelles des matériaux du monde réel, y compris le rendu correct des micro-surfaces telles que les abrasions et les reflets spéculaires. Les améliorations les plus notables, cependant, résident dans la manière dont il permet une représentation plus précise de la réflectivité et de la brillance de toutes les surfaces, même celles constituées de matériaux plats et opaques (simulés).
Qualcomm et les développeurs derrière le populaire Unity Engine ont travaillé pour rendre le PBR plus accessible, mais la société travaille également avec d'autres développeurs de moteurs et de jeux pour optimiser les jeux mobiles pour Snapdragon. dispositifs. Les moteurs de jeu comme Unity, Unreal, Messiah et NeoX sont déjà optimisés pour les appareils Snapdragon, par exemple, et le Snapdragon 855 prend en charge les dernières API graphiques telles que la nouvelle Vulkan 1.1. Des studios comme NetMarble, à l'origine de Lineage II: Revolutions, ont également travaillé avec Qualcomm dans le passé pour mettre en valeur au mieux les atouts de la plateforme Snapdragon. De plus, avec le Muflier 675, nous avons vu parler d'un algorithme personnalisé qui permettait d'atteindre jusqu'à 90 % de conneries en moins par rapport à la même plate-forme sans les optimisations, et les mêmes changements ont été apportés au Snapdragon 855. On ne sait toujours pas exactement ce qu’impliquent ces optimisations, et nous ne pensons pas qu’elles soient applicables dans chaque jeu, mais cela signifiera très certainement de meilleures performances, au moins dans les plus gros titres sur Android.
De plus, alors que les Snapdragon 835 et 845 permettaient la lecture et la capture (respectivement) de Véritable vidéo HDR 10 bits, le Qualcomm Snapdragon 855 sera le premier chipset mobile permettant un vrai jeu HDR. Cela nécessitera de véritables écrans compatibles HDR, qui sont heureusement de plus en plus courants parmi les smartphones phares. Pour cette raison, les utilisateurs peuvent s’attendre à des couleurs plus riches avec une plus grande profondeur tonale, une plage dynamique plus élevée (comme son nom l’indique) et un contraste amélioré. Ce n’est pas nécessairement une fonctionnalité indispensable, mais c’est certainement agréable de l’avoir étant donné les jeux HDR actuels. les configurations nécessitent des téléviseurs et des moniteurs coûteux prêts pour le HDR, ainsi que des ordinateurs performants et des jeux spécifiques consoles. Avec le Qualcomm Snapdragon 855, le HDR dans les jeux sera sans doute plus accessible et plus pratique (sans les commandes de l'écran tactile, bien sûr).
Un nouveau DSP Hexagon 690 pour les charges de travail d'IA
Bien que l’entreprise ne l’appelle pas explicitement « unité de traitement neuronal » dans ses supports marketing, les charges de travail d’IA bénéficieront également du nouveau DSP Hexagon 690 amélioré. Qualcomm a discrètement introduit ces coprocesseurs il y a plusieurs générations (avec l'introduction appropriée du QDSP6 v6 aux côtés du 820), mais ce n'est que récemment qu'ils ont commencé à les présenter comme l'un des meilleurs blocs SoC pour IA. Conçue à l'origine pour accélérer les charges de travail d'imagerie, l'architecture du DSP, notamment avec l'inclusion d'Hexagon Vector eXtensions (HVX), est devenue parfaitement adaptée aux tâches de ML. Le DSP est plus programmable que le matériel à fonction fixe, tout en conservant une partie des performances et avantages d'efficacité qui caractérisent les blocs de processeur spécifiques à l'application, accélérant considérablement les performances scalaires et vectorielles opérations. Cela s’est avéré excellent pour les algorithmes de traitement d’image en constante évolution qui peuvent être transférés vers le DSP, mais qui se prêtent aussi naturellement aux charges de travail d’IA. L'Hexagon DSP est un une aubaine pour l'apprentissage automatique sur les appareils de pointe en raison de son excellent multithreading au niveau matériel et de son calcul parallèle, capable de gérer des milliers de bits de unités vectorielles par cycle de traitement, par rapport aux centaines de bits d'un cœur de processeur moyen par cycle, et assurant plusieurs déchargements séances.
Le DSP Hexagon est particulièrement bien adapté aux tâches d’imagerie car il peut diffuser les données directement du capteur d’imagerie vers la mémoire locale du DSP (cache L2), en contournant le contrôleur de mémoire DDR de l’appareil. Google, par exemple, a utilisé le traitement d'image d'Hexagon DSP pour alimenter les algorithmes HDR+ du Pixel et du Pixel 2, avant d'introduire les leurs. Noyau visuel Pixel. Ce sont également les appareils compatibles Hexagon qui obtiennent les meilleurs résultats grâce aux ports populaires de l'appareil photo Google, que vous pouvez explorer. ici. Il a été utilisé dans des charges de travail de réalité virtuelle et augmentée, alimentant notamment le aujourd'hui disparu Projet Tango sur le Lenovo Phab 2 Pro et ASUS ZenFone AR. Cela dit, la plupart des constructeurs OEM implémentant des appareils phares Snapdragon utilisent le DSP Hexagon pour le traitement des images d'une manière ou d'une autre, ce que vous pouvez vérifier à l'aide d'outils tels que Profileur Snapdragon.
Alors quoi de neuf avec le nouveau DSP? L'Hexagon 690 a doublé le nombre d'accélérateurs vectoriels (HVX), passant de deux à quatre, pour fonctionner en tandem avec les quatre threads scalaires, qui voient également leurs performances améliorées de 20 %. De plus, l'Hexagon 690 apporte le premier accélérateur tensoriel pour mobile avec le Accélérateur de tenseur hexagonal (HTA). Il s'agit d'un ajout important: il sert d'accélération matérielle pour une multiplication matricielle coûteuse, et intègre également des fonctions de non-linéarité (comme sigmoïde et ReLU) au niveau matériel, accélérant encore davantage inférence. Ces changements au DSP devraient se traduire par meilleures performances de l'assistant vocal, de la détection de mots chauds à l'analyse des commandes sur l'appareil, offrant par exemple une annulation d'écho et une suppression du bruit améliorées. Qualcomm souligne qu'il fournit une plate-forme de calcul hétérogène complète qui permet à la charge de travail de l'IA d'exploiter soit le CPU, le GPU ou le DSP, ou toute combinaison des trois blocs -- selon les mots de Gary Brotman de Qualcomm, cela c'est "plus d'un cœur, c'est plus que du matériel, c'est un système complet". Leur « Qualcomm AI Engine » de 4e génération va également au-delà du matériel, car nous trouvons également la prise en charge du SDK Snapdragon Neural Processing et d'Hexagon NN pour accéder les blocs susmentionnés, ainsi que l'API Android NN et les frameworks ML populaires tels que Caffe/Caffe 2, TensorFlow/Lite et ONNX (Open Neural Network Échange). Au total, le Snapdragon 855 peut offrir trois fois les performances brutes de l'IA de son prédécesseur (et deux fois par rapport à Huawei), dépassant 7 000 milliards d’opérations par seconde (TOP). Gardez toutefois à l’esprit que Qualcomm continue de se concentrer sur une solution informatique hétérogène plutôt que sur un seul bloc dédié.
Pour en savoir plus sur le Hexagon DSP, consultez la pièce de l'année dernière détaillant comment cela aide avec les charges de travail d’IA.
En résumé, le package de calcul du Snapdragon 855 apporte certaines des améliorations annuelles les plus percutantes que nous ayons vues ces dernières années. Le Spectra 380 FAI-CV, que nous avons couvert dans un article séparé, apporte également d'énormes améliorations aux performances et à l'efficacité énergétique, permettant d'excellentes nouvelles fonctionnalités telles que l'enregistrement vidéo HDR 4K 60FPS avec mode portrait ou échange d’arrière-plan (tout à fait flexible !).
Comme expliqué dans cet article, ces avancées et nouvelles fonctionnalités devraient se faire sentir concrètement tout au long de l’expérience utilisateur. Nous attendons avec impatience le Qualcomm Snapdragon 855 et allons bientôt le tester en profondeur, alors restez à l'écoute des développeurs XDA pour les dernières nouvelles et analyses du Snapdragon 855 !