Como a Qualcomm melhorou o desempenho, os jogos e a IA no Snapdragon 855

A nova plataforma móvel Qualcomm Snapdragon 855 traz grandes melhorias em termos de desempenho, jogos e IA, e detalhamos como eles fizeram isso.

No Snapdragon Summit 2018 da Qualcomm, a empresa anunciou seu mais novo chipset carro-chefe de nível premium: a plataforma Snapdragon 855. Este novo produto estará no centro da maioria dos carros-chefe prolíficos de 2019, trazendo consigo a promessa de velocidades de dados incríveis por meio do modem Snapdragon X50. Além disso, porém, o Snapdragon 855 traz uma série de melhorias para cada bloco de sistema no chip, com algumas unidades de computação obtendo as maiores melhorias de desempenho e eficiência de energia ano a ano nos últimos história.

Já detalhamos o Spectra 380 ISP-CV, por exemplo, o que melhora ainda mais a fotografia do smartphone, ao mesmo tempo que proporciona aos usuários uma economia saudável de bateria. Embora estejamos prestando cada vez mais atenção aos componentes periféricos como o Hexagon DSP, os blocos centrais que os entusiastas mais prestam atenção atenção - ou seja, CPU e GPU - também obtiveram ganhos mais do que modestos com melhorias arquitetônicas e a mudança para um novo processo nó. Neste artigo, recapitularemos rapidamente o que há de novo e o que se sabe sobre a CPU, GPU e DSP do Snapdragon 855, e como as melhorias e novos recursos podem impactar

seu experiência do usuário em 2019.


CPU Kryo 485 baseada em A76 e mudança para 7nm

O Snapdragon 855 muda para o mais recente processo de fabricação FinFET de 7 nm da TSMC. Geralmente vemos uma revisão de nó a cada um ou dois anos, com reduções ou otimizações no meio do ciclo (como a mudança de "Low-Power Early" (LPE) para "Low-Power Plus” (LPP) em nós Samsung-LSI), então é provável que você já tenha ouvido falar dessas métricas em algumas ou outras notícias artigo. Mas o que isso significa? Neste contexto, ele descreve o tamanho dos recursos do transistor do processador, que por sua vez nos dá uma pista sobre que tipo de melhorias na densidade do transistor podemos esperar com cada nova geração. Com mais transistores por unidade de área, o desempenho resultante do processador pode ser aumentado. Esse recurso também é importante porque nós de processo menores permitem que projetos de processadores sejam implementados em menor escala, o que intuitivamente diminui o espaço entre os elementos do processador, por sua vez encurtando a distância que os elétrons devem percorrer para realizar computação. Isso resulta em melhorias no desempenho, e processos menores também têm uma capacitância mais baixa, o que significa que os transistores podem ligar e desligar com menor latência e com menor energia. Para referência, a TSMC afirma que a mudança para o processo de 7 nm atinge desempenho e eficiência energética da ordem de 20% e 40%, respectivamente, embora isso seja comparado ao próprio processo FinFET de 10 nm da TSMC.

Nos últimos chipsets Snapdragon, vimos a Qualcomm trabalhar com a Samsung e implementar seu processo LPP/LPE de 14nm e 10nm. A mudança para 7nm da TSMC para o Snapdragon 855 não é inesperada, no entanto, dado que o processo de 7nm da Samsung tinha acaba de entrar em produção em massa em outubro, embora na época tenha sido relatado que um chipset 5G da Qualcomm seria construído nele. Além disso, o design 7LPP da Samsung é fabricado sob uma técnica de litografia aprimorada conhecida como litografia ultravioleta extrema (EUVL), produzindo 40% de redução de área com igual complexidade de projeto, com velocidades 20% mais rápidas ou 50% menos consumo de energia em comparação com FinFET de 10 nm antecessores. Cada novo salto para nós de processo menores é comemorado precisamente porque são muito difíceis de alcançar. Por exemplo, à medida que os transistores ficam menores, eles podem apresentar maior “vazamento” ou corrente fluindo através dos transistores que estão “desligados”, aumentando o consumo de energia estática em estados inativos. E embora chips menores com contagens de transistores mais densas possam permitir tirar o máximo proveito de um determinado wafer de silício, o rendimento tende a ser menor devido ao vazamento mencionado acima, além da dificuldade em obter processadores de 'compartimento superior' que rodem em sua (alta) referência frequências. Estes são apenas alguns dos muitos obstáculos de desenvolvimento que são, obviamente, resolvidos no momento em que um novo nó de processo atinge a produção em massa, mas em Em suma, existem muitos desafios de P&D e de fabricação que aumentam o custo de trazer um novo tamanho de processo para mercado.

A mais recente arquitetura ARM A76 licenciada para o Kryo 485 é outro grande contribuidor para as melhorias substanciais que vemos ano após ano com o Qualcomm Snapdragon 855. O núcleo A76 é um design totalmente novo dos escritórios da ARM em Austin, apresentando uma nova microarquitetura construída do zero para oferecer o que a ARM chama de "desempenho de classe de laptop com eficiência móvel." Ainda é um design semipersonalizado, e a Qualcomm fez melhorias, como pré-busca de dados otimizada para melhor eficiência e uma maior execução fora de ordem janela. Este novo design oferece algumas melhorias tremendas de desempenho em relação ao A75, no qual os núcleos Gold do Snapdragon 845 foram baseados: ele promete um Melhoria de desempenho de 35% e eficiência energética 40% melhor. Ao comparar o A75 em um processo de 10 nm com o A76 em um processo de 7 nm no mesmo envelope de potência de 750mW/núcleo, a vantagem de desempenho cresce para 40% a favor do novo núcleo, e a economia de energia também pode aumentar para 50%. Além do mais, outras melhorias nos pipelines de Dados Múltiplos de Instrução Única Assimétrica (ASIMD) e instruções de produto escalar agregam melhorias de aproximadamente 3,9x no desempenho de tarefas de aprendizado de máquina, como inferência em redes neurais convolucionais. Tudo isso equivale a um desempenho por área líder do setor e um ótimo complemento para o novo processo de 7 nm, com o 'Prime core' de 2,84 GHz da Qualcomm se aproximando das velocidades de clock de referência de 3 GHz ARM. Tinha usado ao detalhar o novo núcleo. Contudo, Qualcomm promete uma melhoria absolutamente massiva de 45% no desempenho da CPU acima dos 845, o maior aumento anual até agora.

Falando do ‘núcleo Prime’ do Snapdragon 855, também não é surpreendente ver a Qualcomm avançar com esta nova configuração de cluster, dadas as grandes melhorias. LITTLE habilitado por ARM DynamIQ plataformas tecnológicas. Em essência, o DynamIQ permite mais flexibilidade e escalabilidade no design de processadores multi-core, permitindo designs de múltiplos núcleos em um determinado cluster, bem como controle de tensão refinado por núcleo. (EDITAR: Em uma sessão de perguntas e respostas, a Qualcomm confirmou que o núcleo Prime compartilha seu domínio de energia com o cluster de desempenho, limitando a utilidade descrita aqui). O A76 é particularmente adequado para um núcleo premium tão solitário com seu próprio clock, já que ele vai além quando se trata de single-thread desempenho com 25% mais instruções inteiras por clock do que o A75 e desempenho ASIMD e de ponto flutuante 35% maior, ao mesmo tempo que oferece 90% maior Largura de banda de memória. Em suma, o A76 apresenta uma elevação geracional maior do que as gerações anteriores, o que sem dúvida contribuiu para que a Qualcomm também aumento de desempenho ano a ano maior do que o normal para o Snapdragon 855 (para referência, a Qualcomm citou um aumento de 25 a 30% para o 845 em relação ao o 835). Isso pode ser suficiente para colocar o desempenho resultante do Qualcomm Snapdragon 855 à frente do núcleo Mongoose 3 (M3) da Samsung LSI encontrado no Exynos 9810, embora esse design específico tenha sofrido com a eficiência energética de uma forma que os chips Qualcomm não sofreram, e que o Snapdragon 855 provavelmente não sofrerá qualquer.

O que isso significa para o usuário final? Claro, devemos esperar núcleos de benchmark aumentados – ARM projeta pontuações Geekbench 28% mais altas para dispositivos móveis e desempenho de Javascript 35% melhorado. Além dos benchmarks, que podem ter pouca relação com a experiência do usuário final, o A76 continua o foco do A75 em desempenho sustentado, o que significa que os usuários devem esperar menos afogamentos durante sessões de jogo prolongadas. A mudança para 7 nm combinada com o novo design de núcleo certamente resultará em uma bateria notável melhorias na vida dos usuários finais, e esse talvez seja o recurso mais atraente deste conjunto de Atualizações. O novo núcleo 'Prime' também é interessante, dado que um núcleo solitário focado no melhor desempenho de thread único poderia ser benéfico em aplicativos e processos que não estão configurados para aproveitar adequadamente multi-threading. Claro, o processo de fabricação de 7nm impacta ainda mais outros blocos do Snapdragon 855, trazendo a mesma economia de energia para outras unidades de computação que também estão envolvidas na experiência diária do usuário, como o processamento de imagens para fotografia em smartphones.


‘Experiência de jogo Snapdragon Elite’ e GPU Adreno 640

O Qualcomm Snapdragon 855 concentra-se fortemente em jogos desta vez, uma reviravolta não surpreendente dada a popularidade dos títulos como Fortnite e PlayerUnknown’s Battlegrounds, bem como a crescente popularidade dos eSports móveis (sim, isso é uma coisa) na Ásia. De acordo com números mostrados pela Qualcomm do Relatório do mercado global de jogos Newzoo 2017, os jogos para dispositivos móveis estão em alta, com uma receita total esperada de US$ 70,3 bilhões em 2018, constituindo 51% de todas as receitas de jogos, graças a um aumento de 25,5% ano a ano.

A GPU Adreno 640 traz uma aparência saudável Aumento de 20% no desempenho gráfico, aumentando ainda mais a liderança da Qualcomm sobre a concorrência nesta área específica. Para referência, porém, o Snapdragon 845 trouxe um aumento de 30% em relação ao Snapdragon 835, que também ofereceu uma melhoria de 30% em relação ao Snapdragon 821. Ainda assim, isso deve manter a Qualcomm à frente em desempenho gráfico e, o mais importante, em desempenho por watt, se eles conseguirem melhorar também nesse aspecto. Além desse número, a Qualcomm está mais reservada do que nunca quando se trata do Adreno: ouvimos falar do sistema integrado microcontrolador para gerenciamento de energia e como o 640 tem a menor sobrecarga do driver, embora a empresa tenha mencionado o inclusão de 50% mais unidades lógicas aritméticas (ALUs) que acelerariam ainda mais o desempenho da IA.

Uma coisa sobre a qual a Qualcomm passou muito tempo falando em briefings é seu desejo de trazer “renderização baseada em física” (PBR) para mais experiências de jogos móveis. PBR é um modelo de sombreamento que permite renderização gráfica realista, modelando com precisão o fluxo de luz de acordo com o material representado nas texturas ou no mosaico da superfície. Isso permite que os objetos do jogo imitem adequadamente as propriedades visuais dos materiais do mundo real, incluindo a renderização adequada de microsuperfícies, como abrasões e realces especulares. As melhorias mais notáveis, porém, estão na forma como permite uma representação mais precisa da refletividade e do brilho de todas as superfícies, mesmo aquelas feitas de materiais planos e opacos (simulados).

A Qualcomm e os desenvolvedores por trás do popular Unity Engine têm trabalhado para tornar o PBR mais acessível, mas a empresa também trabalha com outros desenvolvedores de motores e jogos na otimização de jogos móveis para Snapdragon dispositivos. Mecanismos de jogos como Unity, Unreal, Messiah e NeoX já estão otimizados para dispositivos Snapdragon, por exemplo, e o Snapdragon 855 suporta as APIs gráficas mais recentes, como o novo Vulcano 1.1. Estúdios como o NetMarble, responsável por Lineage II: Revolutions, também trabalharam com a Qualcomm no passado para melhor mostrar os pontos fortes da plataforma Snapdragon. Além disso, com o Snapdragon 675, vimos conversas sobre um algoritmo personalizado que alcançou até 90% menos idiotas em comparação com a mesma plataforma sem as otimizações, e as mesmas mudanças chegaram ao Snapdragon 855. Ainda não está claro o que essas otimizações implicam e não esperamos que sejam aplicáveis ​​em todos os jogos, mas definitivamente significará melhor desempenho, pelo menos, nos títulos maiores em Android.

Além de tudo isso, embora o Snapdragon 835 e 845 permitissem a reprodução e captura (respectivamente) de Vídeo HDR verdadeiro de 10 bits, o Qualcomm Snapdragon 855 será o primeiro chipset móvel que permite verdadeiros jogos HDR. Isso exigirá telas verdadeiramente compatíveis com HDR, que felizmente são cada vez mais comuns entre os principais smartphones. Por causa disso, os usuários podem esperar cores mais ricas com maior profundidade tonal, maior faixa dinâmica (como o nome indica) e melhor contraste. Este não é necessariamente um recurso obrigatório, mas certamente é bom ter dado aquele jogo HDR atual as configurações exigem TVs e monitores caros prontos para HDR, bem como computadores capazes e jogos específicos consoles. Com o Qualcomm Snapdragon 855, o HDR em jogos será sem dúvida mais acessível e conveniente (sem os controles da tela sensível ao toque, é claro).


Um novo DSP Hexagon 690 para cargas de trabalho de IA

Embora a empresa não a chame explicitamente de “unidade de processamento neural” em seus materiais de marketing, as cargas de trabalho de IA também se beneficiarão do novo e aprimorado Hexagon 690 DSP. A Qualcomm introduziu discretamente esses coprocessadores há muitas gerações (com a introdução adequada do QDSP6 v6 ao lado do 820), mas só recentemente eles começaram a apresentá-los como alguns dos melhores blocos SoC para IA. Originalmente projetada para acelerar cargas de trabalho de imagem, a arquitetura do DSP – em particular com a inclusão de Hexagon Vector eXtensions (HVX) – tornou-se uma ótima opção para tarefas de ML. O DSP é mais programável que o hardware de função fixa, embora ainda retenha parte do desempenho e benefícios de eficiência que caracterizam blocos de processador específicos de aplicativos, acelerando bastante escalar e vetor operações. Isso se mostrou excelente para os algoritmos de processamento de imagem em constante mudança que podem ser descarregados para o DSP, mas também se prestam naturalmente a cargas de trabalho de IA. O Hexagon DSP tem sido um benefício para aprendizado de máquina em dispositivos de ponta devido ao seu excelente multithreading e computação paralela em nível de hardware, capaz de lidar com milhares de bits de unidades vetoriais por ciclo de processamento, em comparação com centenas de bits por ciclo de um núcleo de CPU médio, e atendendo vários descarregamentos sessões.

O Hexagon DSP é particularmente adequado para tarefas de imagem, pois pode transmitir dados diretamente do sensor de imagem para a memória local do DSP (L2 Cache), ignorando o controlador de memória DDR do dispositivo. O Google, por exemplo, usou o processamento de imagem do Hexagon DSP para alimentar os algoritmos HDR+ do Pixel e do Pixel 2, antes de introduzir seus próprios Núcleo Visual de Pixel. Também são dispositivos prontos para Hexagon que obtêm os melhores resultados das populares portas da Câmera do Google, que você pode explorar aqui. Ele tem sido usado em cargas de trabalho de realidade virtual e aumentada, alimentando o famoso agora extinto Projeto Tango no Lenovo Phab 2 Pró e ASUS ZenFone AR. Dito isso, a maioria dos OEMs que implementam os principais dispositivos Snapdragon utilizam o Hexagon DSP para processamento de imagem de uma forma ou de outra, que você pode verificar usando ferramentas como Perfilador Snapdragon.

Então, o que há de novo no novo DSP? O Hexagon 690 dobrou o número de aceleradores vetoriais (HVX) de dois para quatro para trabalhar em conjunto com os quatro threads escalares, que também apresentam desempenho aprimorado de 20%. Além disso, o Hexagon 690 traz o primeiro acelerador tensor para dispositivos móveis com o Acelerador Tensor Hexágono (HTA). Esta é uma adição significativa: serve como aceleração de hardware para multiplicação de matrizes dispendiosas e também integra funções não lineares (como sigmoid e ReLU) no nível do hardware, acelerando ainda mais inferência. Estas alterações ao DSP deverão traduzir-se em melhor desempenho do assistente de voz, desde a detecção de palavras quentes até a análise de comandos no dispositivo, oferecendo cancelamento de eco e supressão de ruído aprimorados, por exemplo. A Qualcomm enfatiza que fornece uma plataforma de computação heterogênea completa que permite que a carga de trabalho de IA seja aproveitada seja a CPU, GPU ou DSP, ou qualquer combinação dos três blocos - nas palavras de Gary Brotman da Qualcomm, isso isso é “mais que um núcleo, é mais que hardware, é um sistema completo”. Seu "Qualcomm AI Engine" de 4ª geração também vai além do hardware, pois também encontramos suporte para o SDK de processamento neural Snapdragon e Hexagon NN para acessar os blocos mencionados acima, bem como a API Android NN e estruturas de ML populares, como Caffe/Caffe 2, TensorFlow/Lite e ONNX (Open Neural Network Intercâmbio). No total, o Snapdragon 855 pode oferecer três vezes o desempenho bruto da IA de seu antecessor (e duas vezes comparado à Huawei), superando 7 trilhões de operações por segundo (TOPs). Tenha em mente, no entanto, que a Qualcomm continua a focar em uma solução de computação heterogênea em vez de focar em um único bloco dedicado.

Para saber mais sobre o Hexagon DSP, confira peça do ano passado detalhando como isso ajuda nas cargas de trabalho de IA.


Em resumo, o pacote de computação do Snapdragon 855 traz algumas das melhorias anuais mais impactantes que vimos nos últimos anos. O Spectra 380 ISP-CV, que abordamos em um artigo separado, também traz enormes melhorias no desempenho e na eficiência energética, permitindo novos recursos excelentes, como gravação de vídeo 4K 60FPS HDR com modo retrato ou troca de fundo (bastante flexível!).

Conforme explicado neste artigo, esses avanços e novos recursos devem se fazer sentir de forma tangível em toda a experiência do usuário. Estamos ansiosos pelo Qualcomm Snapdragon 855 e por testá-lo em profundidade em breve, então fique ligado no XDA-Developers para as últimas notícias e análises do Snapdragon 855!