O programa de CPU personalizado Cortex-X da ARM pode finalmente tornar o desempenho principal do Android competitivo com a Apple

ARM anunciou o programa Cortex-X Custom (CXC). O primeiro núcleo de alto desempenho no programa personalizado é o ARM Cortex-X1. Continue lendo para saber mais!

Todos os anos, em maio, a ARM, com sede no Reino Unido, de propriedade do Softbank, com sede no Japão, anuncia seu novo Mobile IP (propriedade intelectual) para uso em dispositivos móveis. Este IP consiste em novos núcleos de CPU, bem como em novas GPUs. O conjunto de instruções da ARM é usado em todos os smartphones do mundo – é uma empresa de importância crucial. Em termos de arquiteturas de núcleo de CPU, a partir de 2021, todos os principais fornecedores de chips móveis usarão o IP de CPU padrão da ARM (como Samsung System LSI Desistiu em seus núcleos personalizados Exynos M). É por isso que é duplamente importante que a ARM acerte as coisas. Agora para este ano, a ARM anunciou a arquitetura de CPU ARM Cortex-A78 e a GPU Mali-G78, as sucessoras do Córtex-A77 CPU e o Mali-G77 GPU respectivamente. Embora esses anúncios fossem esperados, o que não era esperado era que a ARM anunciasse outro núcleo de CPU na forma do Cortex-X. Durante anos, revisores de tecnologia e usuários lamentaram o fato de que as arquiteturas de CPU da Apple estão vários anos à frente da série Cortex-A da ARM. Com o programa CPU Cortex-X e o Cortex-X1, isso pode finalmente mudar em 2021.

A ARM sabe que seus clientes exigem mais soluções e produtos baseados em diferentes necessidades em diferentes segmentos de produtos. O Córtex-A76, por exemplo, é usado em SoCs principais, bem como em alguns SoCs de gama média inferior. Seu desempenho máximo não era tão alto quanto os concorrentes da Apple porque a ARM precisava se concentrar no PPA (desempenho, potência e área) primeiro. A eficiência energética e a eficiência energética eram prioridades mais altas para a empresa, em vez do desempenho absoluto.

Com o Cortex-X1, isso muda.

ARM anunciou o programa Cortex-X Custom (CXC). Este programa envolve uma estreita colaboração com as equipes de engenharia da ARM e com os parceiros do programa ARM, que podem moldar um produto final de CPU para atender às demandas específicas do mercado. A ARM observa que isso permite que os parceiros do programa definam seus próprios pontos de desempenho fora do “envelope Cortex-A usual do PPA”. A CPU customizada final, projetada e construída pela ARM, será entregue sob a marca ARM Cortex-X. A primeira CPU como parte do programa CXC é a CPU ARM Cortex-X1.

A ARM está muito orgulhosa do Cortex-X1, dizendo que é o CPU Cortex mais poderoso até hoje. Ele traz uma melhoria de desempenho máximo de 30% em relação ao Cortex-A77 atual. Diz-se que traz “desempenho máximo” para soluções personalizadas de próxima geração. A CPU veio em resposta aos parceiros que queriam maximizar o desempenho de acordo com seus próprios casos de uso.

O Cortex-X1, como esperado, também é mais rápido que o recém-anunciado Cortex-A78, que fica abaixo dele. A redação é importante aqui. ARM diz que fornece melhorias de desempenho quando comparado ao Cortex-A78 com melhorias de desempenho inteiro de até 22% de thread único. Os “uplifts” referem-se ao fato de que as melhorias estão relacionadas a curtos períodos de alto desempenho, que são melhores para reatividade e capacidade de resposta, segundo a ARM. Isto supostamente permitirá o melhor desempenho de todos os tempos para smartphones e dispositivos de tela grande, mas em conta dos números, o Cortex-X1 ainda não será capaz de se igualar ao próximo Apple A14, com o qual irá competir. No entanto, pode ser capaz de pontuar no mesmo nível do Apple A13 de 2019.

O Cortex-X1 oferece melhorias de desempenho de aprendizado de máquina (ML) 2x em relação ao A77. Esta é uma melhoria notável e faz parte do esforço mais amplo da ARM para obter mais desempenho de computação local.

O cluster DynamIQ de 4 núcleos Cortex-A78 e 4x Cortex-A55 oferece melhorias sustentadas de desempenho de 20% em relação ao cluster 4x Cortex-A77 e 4x Cortex-A55. Para obter mais informações sobre a reivindicação de 20%, confira nosso artigo. (Sim, a ARM não anunciou um sucessor para o Cortex-A55, infelizmente. Pode chegar no próximo ano.) O Cortex-X1, por outro lado, permite maior escalabilidade e aumenta o desempenho máximo. Parceiros adicionando 1x Cortex-X1 como parte do cluster DynamIQ junto com 3x Cortex-A8 e 4x Cortex-A55 obterá uma melhoria de 30% no desempenho máximo em relação à geração anterior, o que é um feito que vale a pena observando. O A78 é feito especialmente para eficiência, portanto, quando combinado com o Cortex-X1, o combo proporcionará o melhor desempenho sustentado e de pico. Os principais telefones Android ficarão muito mais rápidos.

A ARM afirma que o principal mercado para soluções com o Cortex-X1 são smartphones e novos formatos (telefones dobráveis ​​e dispositivos grandes com várias telas). O X1 oferece uma experiência do usuário mais rápida, com tempos de carregamento de aplicativos mais rápidos e melhor capacidade de resposta de rolagem de páginas da web. As experiências baseadas em IA e ML ficarão melhores com a melhoria no desempenho de ML. O X1 irá, previsivelmente, também melhorar casos de uso como produtividade, comunicação, segurança, imersão digital múltipla, jogos avançados baseados em câmera e experiências XR.

ARM Cortex-X1 - arquitetura de CPU

A arquitetura do Cortex-X1 é onde as coisas ficam interessantes. Possui inúmeras atualizações de microarquitetura que fornecem aquele aumento máximo de desempenho. O Cortex-A76, que foi anunciado em 2018, atualizou a largura de decodificação de instruções para 4 larguras em relação aos 3 larguras do Cortex-A75, que, por sua vez, aumentou em relação à largura de 2 larguras do Cortex-A73. No entanto, o Cortex-A77 optou por manter a largura de decodificação constante em 4 larguras. Os chips da série A da Apple são grandes e largos, já que a largura de decodificação de todos os chips da série A desde o A11 tem 7 larguras, o que é mais largo até mesmo do que as arquiteturas de CPU de desktop. A ARM deu um passo mais perto da Apple com o Cortex-X1, já que a largura de banda de decodificação foi aumentada em 25% para 5 instruções decodificadas por ciclo.

Além disso, a ARM afirma que o rendimento do cache MOP aumentou em 33%, para 8 MOPs por ciclo. O mecanismo Neon do Cortex-X1 recebe dois tubos adicionais que dobram sua capacidade de computação em relação ao A78. Em termos de tamanhos de cache, o X1 suporta 64kB L1 e até 1MB de cache L2, enquanto o cluster DynamIQ foi atualizado para agora suportar 8MB de L3 para desempenho máximo. O L3 maior também pode ser usado pelo A78 quando usado em combinação com o Cortex-X1.

O Cortex-X1 é o primeiro exemplo de CPU Cortex produzido no âmbito do programa CXC. A própria necessidade do programa CXC é levar o desempenho a um nível fora do PPA Cortex-A. Isso ocorre porque todo esse aumento de desempenho tem um custo. O Cortex-X1 tem 1,5x o tamanho do Cortex-A78. Isso significa que tem pior PPA e também pior eficiência energética. Portanto, é improvável que seja encontrado em qualquer telefone de gama média ou econômica, pois provavelmente estará restrito aos principais telefones de última geração. Permitir que os parceiros tenham uma CPU específica para suas necessidades de mercado diferenciará entre o roteiro do CPUs Cortex-A. Deve-se notar aqui que os parceiros do programa não poderão personalizar diretamente qualquer CPU sob o CXC programa. Em vez disso, o programa CXC é essencialmente o sucessor da licença “Built for Cortex”, onde a ARM faz modificações a pedido dos parceiros e projeta o IP da CPU para ser vendido ao parceiro. Desta forma, a ARM afirma que irá satisfazer as necessidades do ecossistema em constante expansão.

A velocidade de clock alvo do Cortex-X1 é de 3 GHz. A ARM tem como meta 3 GHz desde o A76, e a velocidade do clock falhou notavelmente. Com o próximo advento dos SoCs de 5 nm, porém, a ARM está esperançosa de que os fornecedores finalmente lançarão o grande design central da ARM em 3GHz. A ARM observa que todas as estimativas de desempenho foram baseadas no SPECint2006, que é um padrão da indústria referência.

Panorama

O anúncio do Cortex-X1 é emocionante para os aspirantes a compradores dos principais telefones Android em 2021. Pela primeira vez desde 2013 e do Apple A7, o ARM será capaz de se aproximar dos chips da série A da Apple em termos de desempenho máximo. Mesmo que o Cortex-X1 não corresponda ao A14, estará mais próximo do que esteve nos últimos sete anos.

O próximo Qualcomm Snapdragon 875 provavelmente incorporará tanto o Cortex-X1 quanto o Cortex-A78 como parte de seu “Prime Core” e “Performance Cores”. HiSilicon não está em posição para adotar o mais novo IP da ARM, já que a TSMC foi impedida de fornecer chips, então os telefones Huawei não apresentarão os novos núcleos de CPU este ano, e provavelmente nem mesmo no início do próximo ano. Notavelmente, a Samsung está em uma posição forte para adotar o Cortex-X1 + Cortex-A78 como parte do próximo carro-chefe Exynos SoC, que sucederá o Exinos 990. A Samsung divulgou um comunicado no qual disse estar “muito animada” em ver a nova direção que a ARM está tomando com o programa Cortex-X Custom. O Cortex-X1 essencialmente nega o empreendimento fracassado de núcleos personalizados da Samsung. Espera-se que no próximo ano, os telefones Galaxy S21/S30 com Exynos estejam finalmente livres de grandes ou pequenos déficits de desempenho de CPU em relação à concorrência com Snapdragon. Finalmente, é incerto se a MediaTek adotará o Cortex-X1. O Dimensão 1000O sucessor da Qualcomm pode adotar apenas o A78, ou pode optar pelo combo X1 mais A78 para competir de frente com a Qualcomm. Teremos que esperar para ver como as coisas vão se desenrolar no próximo ano.

O futuro do desempenho da CPU no Android parece brilhante, mesmo sendo um grande produtor de chips de CPU está à beira do fechamento.


Fontes: ARM (1, 2), AnandTech