CPUs, gargalos e jogos: o problema com benchmarking de CPU

Comparar uma CPU em jogos não é tão simples quanto você pensa.

A tão esperada série Ryzen 7000X3D está aqui, e todos concordam que o Ryzen 9 7950X3D é o CPU mais rápido para jogos... mas por quanto? Essa é uma pergunta difícil de responder porque as críticas estão por toda parte. Algumas publicações descobriram que o 7950X3D era pouco mais rápido que o Core i9-13900K da Intel, enquanto outras encontraram margens maiores de mais de 10%. Não é como se os revisores estivessem testando jogos completamente diferentes e, em benchmarks não relacionados a jogos, como o Cinebench R23, as pontuações são quase as mesmas em todos os aspectos, com mais ou menos um ponto percentual.

Esta não é a primeira vez que os revisores não concordam sobre a velocidade das CPUs para jogos. Na verdade, isso acontece com praticamente todas as CPUs, sejam elas sofisticadas Cache V 3D ou não. Na verdade, não vemos essas margens amplas e variadas para análises de GPUs, SSDs ou mesmo CPUs em benchmarks não relacionados a jogos. Então qual é o problema? Em última análise, tudo se resume ao comportamento único das CPUs nos jogos e às diferentes metodologias de teste usadas de revisão em revisão.

O curioso caso do gargalo da CPU

As GPUs modernas têm de centenas a dezenas de milhares de núcleos. Esses núcleos são altamente flexíveis e ideais para lidar com cargas de trabalho com dificuldade de escala. Isto significa o melhores GPUs para jogos pode lidar com configurações gráficas que resultam em qualidade visual e quadros por segundo variados. Reduzir as configurações gráficas, como a resolução, facilita a matemática para renderizar quadros, o que significa que mais quadros podem ser renderizados por segundo. Por outro lado, se os quadros forem mais difíceis de renderizar, menos quadros serão produzidos por segundo.

O papel da CPU nos jogos é muito diferente daquele da GPU. Desde o início dos anos 2000, muitos processos originalmente executados na CPU agora são executados pela GPU, deixando a CPU com relativamente pouco para fazer. A tarefa mais importante da CPU é realizar essas tarefas mínimas o mais rápido possível.

Mas existem dois problemas principais. Em primeiro lugar, estas tarefas não podem ser distribuídas uniformemente por todos os núcleos e threads, portanto, mais núcleos nem sempre significam melhor desempenho. Em segundo lugar, núcleos maiores com mais poder computacional não serão úteis, uma vez que estas cargas de trabalho são muito básicas. Esses fatores tornam a velocidade do clock e o tamanho do cache desproporcionalmente importantes para jogos. O cache reduz o tempo gasto na espera pelos dados, o que é um fator significativo na perda de desempenho. A velocidade do clock, por outro lado, é a única maneira realista de acelerar cargas de trabalho que não conseguem aproveitar a potência bruta dos chips modernos.

O desempenho de jogos de um PC é determinado principalmente pela GPU e pela CPU (o armazenamento e a RAM geralmente são secundários). fatores), mas não ao mesmo tempo porque, a qualquer momento, seu desempenho é limitado pela GPU ou a CPU. Isso naturalmente leva a uma grande questão: quando um PC é limitado pela CPU ou pela GPU? Na verdade, essa questão atinge o cerne de uma das coisas mais confusas sobre benchmarks de jogos, porque a diferença entre gargalos de GPU e CPU não é muito intuitiva.

Quando o seu PC é limitado pela GPU, a placa gráfica estará funcionando com 100% de uso ou próximo disso, o que significa usar tantos recursos quanto possível e geralmente atingir o consumo máximo de energia. Isso significa que você pode trocar frames por qualidade visual e vice-versa. Mas para a maioria dos jogos, essas configurações gráficas não afetam diretamente a CPU e, mesmo em jogos com configurações relacionadas à CPU, geralmente existem apenas algumas.

Aumentar as configurações gráficas não é necessário para criar um gargalo de CPU nos jogos. Na verdade, aumentar as configurações gráficas praticamente garante que você nunca verá um gargalo na CPU. Lembre-se, a CPU é bastante limitada na quantidade de trabalho que pode realizar e, embora haja poucos, se houver, configurações que você pode ajustar para aumentar a carga de trabalho nos jogos, você pode aumentar a taxa de quadros diminuindo os gráficos configurações.

Desde o início dos anos 2000, muitos processos originalmente executados na CPU agora são executados pela GPU, deixando a CPU com relativamente pouco para fazer.

Encontrar um gargalo de CPU é simples se você aumentar a taxa de quadros até que a GPU possa renderizar mais quadros do que a CPU pode suportar. Isso basicamente significa que uma CPU tem um limite de quantos frames ela pode mostrar em qualquer jogo. Existem apenas duas maneiras realistas de remover gargalos de CPU em jogos. Você pode obter RAM mais rápida com frequência e tempos mais altos para um pequeno aumento de desempenho ou diminuir a taxa de quadros – e é essa segunda opção que cria problemas para benchmarking.

Imagine que um revisor esteja testando duas CPUs hipotéticas, Gamma e Zeta. Em um jogo de grande orçamento e graficamente intenso como Coração Atômico, Gamma pode atingir 200 FPS enquanto Zeta pode atingir 300. Dependendo de como os revisores testam as CPUs e com que intensidade aumentam a taxa de quadros, eles podem descobrir que ambas as CPUs são aproximadamente iguais, que o Zeta tem uma ligeira vantagem ou que o Zeta tem um comando liderar. É por isso que os revisores de CPU costumam chegar a conclusões diferentes sobre o desempenho da CPU em jogos.

Aí gosta do dilema básico de revisar CPUs em jogos. Você precisa aumentar a taxa de quadros o mais alto possível para expor gargalos de CPU e, assim, mostrar os verdadeiros limites de cada CPU, muitas vezes resultando em um benchmark irreal. Como você pode imaginar, esse fenômeno vem causando polêmica há anos.

O dilema de benchmarking de CPUs em jogos

A maioria dos entusiastas assume uma de duas posições quando se trata de benchmarking de CPU. A primeira posição defende uma abordagem mais científica que expõe o estrangulamento sem ter em conta cenários realistas, enquanto o segundo argumenta que os revisores devem testar em ambientes que signifiquem mais para os leitores que desejam tomar decisões de compra.

Cada escola de pensamento tem seus pontos fortes e fracos. Os proponentes da posição científica (geralmente análises e fãs da empresa com o CPU mais rápido) estão sem dúvida corretos no sentido de que esta abordagem revela os verdadeiros limites do CPU em jogos. No entanto, eles também argumentam frequentemente que estes testes prevêem com precisão o desempenho futuro. Quando você atualiza sua GPU e de repente tem capacidade para taxas de quadros mais altas, obviamente você deseja uma CPU melhor.

Este argumento sobre o desempenho futuro foi desmascarado várias vezes. Embora as CPUs FX da AMD inicialmente tenham apresentado resultados ruins em jogos em comparação com as ofertas da Intel, com o tempo, chips como o O FX-8350 realmente ganhou terreno e até ultrapassou seus equivalentes Core i5 à medida que os jogos começaram a usar mais núcleos e tópicos. Além disso, eu diria que os jogadores raramente atualizam as placas gráficas apenas para taxas de quadros mais altas. Os jogadores querem melhores taxas de quadros e configurações de melhor qualidade, incluindo resoluções mais altas. Isso reduz as chances de expor um gargalo de CPU após uma atualização de GPU.

O argumento para configurações "realistas" é mais intuitivo e fácil de seguir, mas a maior parte da retórica é sobre o quão ruim é 1080p para testando CPUs de última geração. A questão é: você pode testar adequadamente uma CPU de última geração em comparação com uma de gama média ou inferior e superior? resolução? Se você tem um Núcleo i9-13900K, é mais provável que você busque taxas de quadros mais altas simplesmente porque seu PC também possui uma GPU de última geração como a RTX4090, enquanto é improvável que um usuário com um Core i3-13100 mire muito além de 60 FPS porque provavelmente também tem uma GPU de baixo custo como um RX 6500 XT. Você testa com configurações realistas para o 13900K ou para o 13100?

Dito isto, penso que este segundo campo está a apresentar alguns pontos válidos. Não posso dizer com certeza o que o usuário médio deseja, mas como membro de longa data desta comunidade, imagino que a maioria tem como alvo algo entre 60 e 144 FPS desde 60 Hz e 144 Hz são taxas de atualização muito populares, geralmente vêm com G-SYNC ou FreeSync, e ultrapassar a taxa de atualização quebra essas taxas. tecnologias. 144 FPS não é muito mais alto para CPUs modernas, então o gargalo da CPU é menos provável e, conseqüentemente, benchmarks que mostram CPUs obtendo 300 FPS provavelmente não são muito úteis para a maioria dos usuários.

Esse debate remonta a pelo menos seis anos e o encontrei pela primeira vez quando a série Ryzen de primeira geração foi lançada em 2017. A maioria dos revisores permaneceu comprometida com o ponto de vista científico ou geralmente indiferente a qualquer um dos lados em seus testes. Por outro lado, os leitores ficam principalmente chateados quando sua marca preferida perde nas avaliações, mas trazem alguns pontos positivos. No entanto, acredito que existe um caminho intermediário que pode satisfazer os requisitos de ambas as filosofias, um forma de benchmarking que utiliza configurações realistas e alcança resultados que são relevantes para leitores.

Por que a taxa de quadros em si é uma parte fundamental de um benchmark de CPU

Sempre fui fascinado pela metodologia de testes e pelas formas de mostrar às pessoas resultados que realmente significam alguma coisa. Isso é mais um experimento mental do que uma proposta séria, e é algo que uso para me divertir, mas criei minha própria metodologia de teste de CPU.

Não podemos ignorar as potenciais taxas de quadros máximas possibilitadas pela GPU porque ela determina o desempenho das CPUs e quão realista é para os usuários. O que proponho é virar esse conceito de cabeça para baixo e selecionar configurações para atingir uma determinada taxa de quadros, em vez de definir predefinições específicas ou definir tudo no mínimo.

Aqui está a metodologia básica. Selecione uma CPU de controle com a qual todas as outras CPUs serão comparadas. Como as CPUs têm um limite de desempenho, o chip de controle deve ser o CPU mais rápido que você está testando, como um Core i9-13900K ou um Ryzen9 7950X3D. Em seguida, comece com configurações gráficas mais altas, execute seus benchmarks e continue ajustando as configurações até que sua CPU de controle atinja a taxa de quadros desejada. Por exemplo, em títulos de esportes eletrônicos como Counter-Strike: Ofensiva Global, sua taxa de quadros desejada provavelmente deve ser de pelo menos 240 FPS em média – se não maior.

Supõe-se que uma análise de CPU mostre o que vale a pena comprar e o que não vale e, embora as análises sejam o produto de muitas horas de trabalho árduo, nem toda análise analisa criticamente os dados.

Depois de encontrar as configurações que atingem sua taxa de quadros preferida na CPU de controle, use essas configurações ao testar outros chips. A ideia é mostrar o quão mais rápida a CPU de controle pode ser comparada a CPUs teoricamente mais lentas em um teste científico e realista. O que as pessoas querem saber é se vale a pena investir em uma CPU de última geração, e esse tipo de metodologia é muito boa para mostrar isso.

Porém, há um problema óbvio com esse tipo de benchmarking: leva tempo. Ajustar as configurações gráficas e executar benchmarks até que a CPU de controle tenha a taxa de quadros correta é demorado e não usar predefinições pode significar alterar configurações individuais em cada nova CPU para cada jogo. Além disso, novas CPUs e jogos exigem calibração adicional, talvez a ponto de você precisar transformar uma CPU diferente no controle. Basta escolher uma predefinição ou definir tudo no mínimo é muito mais fácil.

Existem alternativas a esta metodologia que são muito mais fáceis de implementar. Muitos revisores testam em múltiplas resoluções para mostrar a mudança no gargalo da CPU, com 1080p tendo o maior gargalo de CPU e 1440p ou 4K o menor. Ponto Técnico e Anandtech às vezes, teste várias GPUs para obter o mesmo efeito, pois GPUs mais rápidas terão uma taxa de quadros potencial mais alta, o que pode revelar gargalos de CPU.

A análise é ainda mais importante que a metodologia

Uma boa metodologia de teste e dados de alta qualidade são apenas metade do que torna uma revisão abrangente. A outra metade é a análise, que é quando o revisor informa aos leitores o que significam os resultados. Muitos usuários podem decidir por si mesmos sobre o que os dados significam, mas nem todos que gostam de jogos para PC são entusiastas.

Se uma análise mostrar um benchmark onde uma CPU atinge 500 FPS e outra 300, deve haver algum contexto sobre o que isso significa. Se for um título de esports, essa diferença pode ser importante para quem quer jogar competitivamente e precisa das taxas de quadros mais altas. Para a maioria dos outros jogos, a vantagem de desempenho oferecida pela CPU mais rápida provavelmente não será totalmente percebida ou apreciada. Já vi algumas análises mostrarem benchmarks com esses tipos de resultados em jogos muito antigos e elogiarem a CPU mais rápida, enquanto outras análises encontraram margens muito mais modestas em testes mais realistas.

Em última análise, uma análise de CPU deve mostrar o que vale a pena comprar e o que não vale, e embora as análises sejam o produto de muitas horas de trabalho árduo, nem todas as análises analisam criticamente os dados. Agradeço os revisores que dedicam um momento para discutir os gargalos da CPU e como eles aumentam ou diminuem com diferentes GPUs e configurações gráficas. Certamente é verdade que algumas CPUs são mais rápidas que outras e são melhor para jogos, mas nunca é claro se isso significa que é melhor para cada usuário.