Cómo Qualcomm mejoró el rendimiento, los juegos y la inteligencia artificial en el Snapdragon 855

click fraud protection

La nueva plataforma móvil Qualcomm Snapdragon 855 trae grandes mejoras en términos de rendimiento, juegos e inteligencia artificial, y desglosamos cómo lo han hecho.

En la Cumbre Snapdragon 2018 de Qualcomm, la empresa anunció su nuevo chipset insignia de nivel premium: la plataforma Snapdragon 855. Este nuevo producto estará en el corazón de la mayoría de los prolíficos buques insignia de 2019 y traerá consigo la promesa de velocidades de datos increíbles a través del módem Snapdragon X50. Más allá de eso, sin embargo, el Snapdragon 855 trae una serie de mejoras a cada bloque de sistema en chip, con Algunas unidades de cómputo experimentan las mayores mejoras interanuales en rendimiento y eficiencia energética en los últimos años. historia.

Ya hemos detallado el Spectra 380 ISP-CV, por ejemplo, que mejora aún más la fotografía con teléfonos inteligentes y al mismo tiempo ofrece a los usuarios un ahorro saludable de batería. Si bien hemos prestado cada vez más atención a los componentes periféricos como el Hexagon DSP, los bloques centrales que más pagan los entusiastas atención, es decir, la CPU y la GPU, también han visto ganancias más que modestas con mejoras arquitectónicas y el cambio a un nuevo proceso. nodo. En este artículo, recapitularemos rápidamente las novedades y lo que se sabe sobre la CPU, GPU y DSP del Snapdragon 855, y cómo las mejoras y nuevas funciones podrían afectar

su Experiencia de usuario en 2019.


CPU Kryo 485 basada en A76 y el paso a 7 nm

El Snapdragon 855 pasa al último proceso de fabricación FinFET de 7 nm de TSMC. Generalmente vemos una revisión de nodo cada uno o dos años, con reducciones u optimizaciones a mitad de ciclo (como el cambio de "Low-Power Early" (LPE) a “Low-Power Plus” (LPP) en nodos Samsung-LSI), por lo que es probable que hayas oído hablar de estas métricas en alguna que otra noticia. artículo. Pero, ¿qué significa? En este contexto, describe el tamaño de las características del transistor del procesador, que a su vez nos dan pistas sobre qué tipo de mejoras en la densidad del transistor podemos esperar con cada nueva generación. Con más transistores por unidad de área, se puede aumentar el rendimiento resultante del procesador. Esta característica también es importante ya que los nodos de proceso más pequeños permiten implementar diseños de procesador a una escala más pequeña, lo que intuitivamente Reduce el espacio entre los elementos del procesador, acortando a su vez la distancia que los electrones deben viajar para lograr cálculo. Esto genera mejoras en el rendimiento, y los procesos más pequeños también tienen una capacitancia más baja, lo que significa que los transistores pueden encenderse y apagarse con menor latencia y con menor energía. Como referencia, TSMC afirma que el cambio a su proceso de 7 nm logra Rendimiento y eficiencia energética del orden del 20% y 40% respectivamente., aunque eso se compara con el proceso FinFET de 10 nm de TSMC.

En los últimos conjuntos de chips insignia de Snapdragon, hemos visto a Qualcomm trabajar con Samsung e implementar su proceso LPP/LPE de 14 nm y 10 nm. Sin embargo, el cambio a los 7 nm de TSMC para el Snapdragon 855 no es inesperado, dado que el proceso de 7 nm de Samsung tenía acaba de entrar en producción en masa en octubre, aunque en ese momento se informó que se construiría un chipset Qualcomm 5G. Además, el diseño 7LPP de Samsung se fabrica bajo una técnica de litografía mejorada conocida como litografía ultravioleta extrema (EUVL). Lo que produce una reducción de área del 40 % con la misma complejidad de diseño, con velocidades un 20 % más rápidas o un 50 % menos de consumo de energía en comparación con FinFET de 10 nm. antecesores. Cada nuevo salto a nodos de proceso más pequeños se celebra precisamente porque son muy difíciles de lograr. Por ejemplo, a medida que los transistores se hacen más pequeños, pueden presentar mayores "fugas" o corriente que fluye a través de transistores que están "apagados", lo que aumenta el consumo de energía estática en estados inactivos. Y aunque los chips más pequeños con un mayor número de transistores podrían permitir aprovechar al máximo una oblea de silicio determinada, el rendimiento tiende a ser menor. debido a la fuga antes mencionada, además de la dificultad para obtener procesadores 'de mayor nivel' que se ejecuten en su (alta) referencia frecuencias. Estos son solo alguno de los muchos obstáculos de desarrollo que, por supuesto, se solucionan cuando un nuevo nodo de proceso llega a la producción en masa, pero en En resumen, hay muchos desafíos de I+D y de fabricación que aumentan el costo de llevar un nuevo tamaño de proceso a mercado.

La última arquitectura ARM A76 con licencia para Kryo 485 es otro gran contribuyente a las importantes mejoras año tras año que vemos con Qualcomm Snapdragon 855. El núcleo A76 es un nuevo diseño de pizarra en blanco de las oficinas de ARM en Austin, que presenta una nueva microarquitectura construida desde cero para ofrecer lo que ARM llama "rendimiento de clase portátil con eficiencia móvil". Sigue siendo un diseño semi-personalizado, y Qualcomm ha realizado mejoras como la recuperación previa de datos optimizada para una mayor eficiencia y una mayor ejecución fuera de orden. ventana. Este nuevo diseño ofrece enormes mejoras de rendimiento con respecto al A75, en el que se basaron los núcleos Gold del Snapdragon 845: promete una Mejora del rendimiento del 35 % y eficiencia energética del 40 %. Al comparar el A75 en un proceso de 10 nm con el A76 en un proceso de 7 nm con la misma envolvente de potencia de 750 mW/núcleo, la ventaja de rendimiento aumenta al 40 % a favor del nuevo núcleo y el ahorro de energía también puede aumentar al 50%. Además, otras mejoras en las canalizaciones de datos múltiples de instrucción única asimétrica (ASIMD) y instrucciones de producto escalar Suman mejoras de ~3,9 veces en el rendimiento de las tareas de aprendizaje automático, como la inferencia en redes neuronales convolucionales. Todo esto equivale a un rendimiento por área líder en la industria y un gran complemento para el nuevo proceso de 7 nm, con el 'núcleo principal' de 2,84 GHz de Qualcomm acercándose a las velocidades de reloj de referencia de 3 GHz de ARM. había usado al detallar el nuevo núcleo. Considerándolo todo, Qualcomm promete una mejora absolutamente masiva del 45% en el rendimiento de la CPU por encima de los 845, el mayor aumento interanual hasta el momento.

Hablando del 'núcleo principal' del Snapdragon 855, tampoco es sorprendente ver a Qualcomm moverse con esta nueva configuración de clúster dadas las grandes mejoras. POCO habilitado por ARM DinámicaIQ plataformas tecnológicas. En esencia, DynamIQ permite una mayor flexibilidad y escalabilidad en el diseño de procesadores multinúcleo, lo que permite diseños de múltiples núcleos en un clúster determinado, así como un control detallado del voltaje por núcleo. (EDITAR: en una sesión de preguntas y respuestas, Qualcomm confirmó que el núcleo Prime comparte su dominio de energía con el grupo de rendimiento, lo que limita la utilidad que se describe aquí). El A76 es una opción particularmente buena para un núcleo premium tan solitario con su propio reloj, dado que va más allá cuando se trata de un solo hilo. rendimiento con un 25 % más de instrucciones enteras por reloj que el A75 y un rendimiento ASIMD y de punto flotante un 35 % mayor, al tiempo que ofrece un 90 % más ancho de banda de memoria. En resumen, el A76 presenta un mayor relevo generacional que las generaciones anteriores, lo que sin duda contribuyó a que Qualcomm también aumento de rendimiento año tras año mayor de lo habitual para el Snapdragon 855 (como referencia, Qualcomm citó un aumento del 25 al 30% para el 845 en comparación con el 835). Esto podría ser suficiente para poner el rendimiento resultante del Qualcomm Snapdragon 855 por delante del núcleo Mongoose 3 (M3) de Samsung LSI que se encuentra en el Exynos 9810. aunque ese diseño en particular sufrió de eficiencia energética de una manera que los chips Qualcomm no han tenido, y que el Snapdragon 855 probablemente no lo hará cualquiera.

¿Qué significa para el usuario final? Por supuesto, deberíamos esperar mayores núcleos de referencia: ARM proyecta puntuaciones Geekbench un 28 % más altas para dispositivos móviles y un rendimiento de Javascript mejorado un 35 %. Más allá de los puntos de referencia, que podrían tener poca relación con la experiencia del usuario final, el A76 continúa el enfoque del A75 en desempeño sostenido, lo que significa que los usuarios deberían esperar menos ralentizaciones durante sesiones de juego prolongadas. El cambio a 7 nm combinado con el nuevo diseño del núcleo definitivamente dará como resultado una batería notable mejoras en la vida de los usuarios finales, y esa es quizás la característica más atractiva de este conjunto de actualizaciones. El nuevo núcleo 'Prime' también es interesante, dado que un núcleo único centrado en el máximo rendimiento de un solo subproceso podría resultan beneficiosos en aplicaciones y procesos que no están configurados para aprovechar adecuadamente subprocesos múltiples. Por supuesto, el proceso de fabricación de 7 nm también afecta a otros bloques del Snapdragon 855, lo que conlleva el mismo ahorro de energía. a otras unidades informáticas que también participan en la experiencia del usuario día a día, como el procesamiento de imágenes para la fotografía con teléfonos inteligentes.


'Experiencia de juego Snapdragon Elite' y GPU Adreno 640

Esta vez, el Qualcomm Snapdragon 855 se centra principalmente en los juegos, un giro de los acontecimientos que no sorprende dada la popularidad de los títulos. como Fortnite y PlayerUnknown's Battlegrounds, así como la creciente popularidad de los deportes electrónicos móviles (sí, esto existe) en Asia. Según cifras mostradas por Qualcomm del Informe del mercado global de juegos Newzoo 2017, los juegos móviles tienen una tendencia al alza con unos ingresos totales esperados para 2018 de 70.300 millones de dólares, lo que constituye el 51% de todos los ingresos por juegos gracias a un aumento interanual del 25,5%.

La GPU Adreno 640 aporta una salud Aumento del 20 % en el rendimiento de los gráficos, lo que aumenta aún más la ventaja de Qualcomm sobre la competencia en esta área en particular. Sin embargo, como referencia, el Snapdragon 845 supuso una mejora del 30% con respecto al Snapdragon 835, que a su vez también ofreció una mejora del 30% con respecto al Snapdragon 821. Aún así, esto debería mantener a Qualcomm a la cabeza en el rendimiento de los gráficos y, lo más importante, en el rendimiento por vatio si logran mejorar también en ese frente. Más allá de esa cifra, Qualcomm se mantiene más reservado que nunca cuando se trata de Adreno: hemos oído hablar del integrado microcontrolador para administración de energía, y cómo el 640 tiene la sobrecarga de controlador más baja, aunque la compañía mencionó el Inclusión de 50% más unidades aritméticas lógicas (ALU) que acelerarían aún más el rendimiento de la IA.

Una cosa de la que Qualcomm pasó mucho tiempo hablando en las sesiones informativas es su deseo de llevar el "renderizado basado físicamente" (PBR) a más experiencias de juegos móviles. PBR es un modelo de sombreado que permite la representación de gráficos realistas, modelando con precisión el flujo de luz de acuerdo con el material representado en las texturas o la teselación de la superficie. Esto permite que los objetos del juego imiten adecuadamente las propiedades visuales de los materiales del mundo real, incluida la representación adecuada de microsuperficies como abrasiones y reflejos especulares. Sin embargo, las mejoras más notables vienen en cómo permite una representación más precisa de la reflectividad y el brillo de todas las superficies, incluso aquellas de materiales planos y opacos (simulados).

Qualcomm y los desarrolladores detrás del popular Unity Engine han estado trabajando para hacer que PBR sea más accesible. pero la compañía también trabaja con otros desarrolladores de motores y juegos para optimizar los juegos móviles para Snapdragon. dispositivos. Los motores de juegos como Unity, Unreal, Messiah y NeoX ya están optimizados para dispositivos Snapdragon, por ejemplo, y el Snapdragon 855 admite las últimas API de gráficos, como la nueva Vulcano 1.1. Estudios como NetMarble, que está detrás de Lineage II: Revolutions, también han trabajado con Qualcomm en el pasado para mostrar mejor las fortalezas de la plataforma Snapdragon. Es más, con la Snapdragon 675, vimos conversaciones sobre un algoritmo personalizado que logró hasta 90% menos janks en comparación con la misma plataforma sin optimizaciones, y los mismos cambios llegaron al Snapdragon 855. Todavía no está claro qué implican estas optimizaciones y no esperamos que sean aplicables en todos los juegos, pero definitivamente significará un mejor rendimiento, al menos, en los títulos más importantes del mercado. Androide.

Además de todo eso, si bien el Snapdragon 835 y 845 permitían la reproducción y captura (respectivamente) de Vídeo HDR real de 10 bits, el Qualcomm Snapdragon 855 será el primer chipset móvil que permitirá verdaderos juegos HDR. Esto requerirá verdaderas pantallas con capacidad HDR, que afortunadamente son cada vez más comunes entre los teléfonos inteligentes emblemáticos. Debido a esto, los usuarios pueden esperar colores más ricos con más profundidad tonal, mayor rango dinámico (como lo implica el nombre) y contraste mejorado. Esta no es necesariamente una característica imprescindible, pero ciertamente es bueno tenerla teniendo en cuenta los juegos HDR actuales. Las configuraciones requieren costosos televisores y monitores preparados para HDR, así como computadoras capaces y juegos específicos. consolas. Con Qualcomm Snapdragon 855, se podría decir que el HDR en los juegos será más accesible y conveniente (sin los controles de la pantalla táctil, por supuesto).


Un nuevo Hexagon 690 DSP para cargas de trabajo de IA

Si bien la compañía no lo llama explícitamente "unidad de procesamiento neuronal" en sus materiales de marketing, las cargas de trabajo de IA también se beneficiarán del nuevo y mejorado Hexagon 690 DSP. Qualcomm introdujo silenciosamente estos coprocesadores hace muchas generaciones (con la introducción adecuada del QDSP6 v6 junto con el 820), pero no fue hasta hace poco que comenzaron a promocionarlos como algunos de los mejores bloques de SoC para AI. Originalmente diseñada para acelerar cargas de trabajo de imágenes, la arquitectura del DSP, en particular con la inclusión de Hexagon Vector eXtensions (HVX), se convirtió en una excelente opción para las tareas de aprendizaje automático. El DSP es más programable que el hardware de función fija, aunque conserva parte del rendimiento y Beneficios de eficiencia que caracterizan a los bloques de procesadores específicos de la aplicación, acelerando enormemente los procesos escalares y vectoriales. operaciones. Esto resultó excelente para los algoritmos de procesamiento de imágenes en constante cambio que se pueden descargar al DSP, pero que, naturalmente, también se prestan a cargas de trabajo de IA. El Hexagon DSP ha sido un bendición para el aprendizaje automático en dispositivos de vanguardia debido a su excelente computación paralela y de subprocesos múltiples a nivel de hardware, capaz de manejar miles de bits de unidades vectoriales por ciclo de procesamiento, en comparación con los cientos de bits por ciclo de un núcleo de CPU promedio, y brindando servicio a múltiples descargas sesiones.

El Hexagon DSP es particularmente adecuado para tareas de imágenes, ya que puede transmitir datos directamente desde el sensor de imágenes a la memoria local del DSP (caché L2), sin pasar por el controlador de memoria DDR del dispositivo. Google, por ejemplo, utilizó el procesamiento de imágenes del Hexagon DSP para potenciar los algoritmos HDR+ de Pixel y Pixel 2, antes de presentar sus propios Núcleo visual de píxeles. También son los dispositivos compatibles con Hexagon los que obtienen los mejores resultados de los populares puertos de la cámara de Google, que puedes explorar. aquí. Se ha utilizado en cargas de trabajo de realidad virtual y aumentada, impulsando el famoso ahora desaparecido Proyecto Tango en el Lenovo Phab 2 Pro y ASUS ZenFone AR. Dicho esto, la mayoría de los fabricantes de equipos originales que implementan dispositivos emblemáticos de Snapdragon utilizan Hexagon DSP para el procesamiento de imágenes de una forma u otra, lo que puede verificar utilizando herramientas como Perfilador de boca de dragón.

¿Qué hay de nuevo con el nuevo DSP? El Hexagon 690 duplicó el número de aceleradores vectoriales (HVX) de dos a cuatro para trabajar en conjunto con los cuatro subprocesos escalares, que también obtienen un rendimiento mejorado del 20 %. Además de eso, el Hexagon 690 trae el primer acelerador tensor para dispositivos móviles con el Acelerador tensor hexagonal (HTA). Esta es una adición importante: sirve como aceleración de hardware para la costosa multiplicación de matrices, y también integra funciones de no linealidad (como sigmoide y ReLU) a nivel de hardware, acelerando aún más inferencia. Estos cambios en el DSP deberían traducirse en mejor rendimiento del asistente de voz, desde la detección de palabras activas hasta el análisis de comandos en el dispositivo, ofreciendo cancelación de eco y supresión de ruido mejoradas, por ejemplo. Qualcomm enfatiza que proporcionan una plataforma informática heterogénea completa que permite que la carga de trabajo de IA aproveche ya sea la CPU, GPU o DSP, o cualquier combinación de los tres bloques; en palabras de Gary Brotman de Qualcomm, esto es "más de un núcleo, es más que hardware, es un sistema completo". Su "Qualcomm AI Engine" de cuarta generación también va más allá del hardware, ya que también encontramos soporte para el SDK de procesamiento neuronal Snapdragon y Hexagon NN para acceder los bloques antes mencionados, así como la API NN de Android y marcos de aprendizaje automático populares como Caffe/Caffe 2, TensorFlow/Lite y ONNX (Open Neural Network). Intercambio). En conjunto, el Snapdragon 855 puede ofrecer tres veces el rendimiento bruto de la IA de su predecesor (y dos veces comparado con Huawei), superando 7 billones de operaciones por segundo (TOP). Sin embargo, tenga en cuenta que Qualcomm continúa centrándose en una solución informática heterogénea en lugar de centrarse en un único bloque dedicado.

Para obtener más información sobre Hexagon DSP, consulte pieza del año pasado detallando cómo ayuda con las cargas de trabajo de IA.


En resumen, el paquete informático del Snapdragon 855 aporta algunas de las mejoras interanuales más impactantes que hemos visto en los últimos años. El Spectra 380 ISP-CV, que cubrimos en un artículo separado, también aporta enormes mejoras al rendimiento y la eficiencia energética, permitiendo nuevas funciones excelentes como la grabación de vídeo 4K 60FPS HDR con modo retrato o cambio de fondo (¡bastante flexible!).

Como se explica en este artículo, estos avances y nuevas características deberían hacerse sentir de manera tangible a lo largo de la experiencia del usuario. Esperamos con ansias el Qualcomm Snapdragon 855 y pronto podremos probarlo en profundidad, así que estad atentos a XDA-Developers para conocer las últimas noticias y análisis del Snapdragon 855.