A maioria dos usuários de computador não se preocupa muito com o desempenho quando está comprando um computador. Desde que seja rápido e barato o suficiente, isso é bom o suficiente. Eles comprarão um computador com uma CPU de geração atual ou anterior e procurarão a quantidade certa de armazenamento para o meio terabyte mais próximo.
Alguns podem procurar velocidade da CPU, contagem de núcleos ou capacidade de RAM, mas tende a ser isso. Se você é um entusiasta de tecnologia, pode prestar mais atenção a essas coisas, para saber o que está recebendo e se é realmente um bom negócio.
Uma das maneiras de extrair o máximo de desempenho do seu computador é obter RAM de alto desempenho. O número de vendas chamativo significativo é a velocidade do clock da RAM, como DDR4-3200 ou DDR5-6400. Tecnicamente, esse segundo número não é a velocidade do clock. É a taxa de transferência. Isso é o dobro da velocidade do clock porque a RAM DDR é Double Data Rate. Ainda assim, o número mais alto soa melhor no material de marketing.
Essa taxa de transferência é uma medida da largura de banda da RAM, portanto, números mais altos são melhores. A largura de banda, no entanto, não é o único fator no desempenho da RAM. A latência é tão importante, se não mais.
O que é latência?
A latência é uma medida do atraso entre o início de um processo e sua ocorrência real. Um exemplo simples é o “ping” da sua conexão com a internet. Se você já executou um teste de velocidade, verá sua velocidade de download e ping. A velocidade de download é a largura de banda da sua internet e o ping é a latência entre você fazer uma solicitação e o servidor que a recebe. Como muitos jogadores sabem, não importa a velocidade da sua internet. Você não terá uma boa experiência se tiver alta latência.
A RAM de alto desempenho sempre anunciará sua velocidade. Muitas vezes, anunciará pelo menos uma medida específica de latência. A medida de latência mais comum e importante é a CAS Latency, às vezes abreviada para CL. Ao analisar um pouco mais as especificações do produto, geralmente é possível encontrar os quatro principais tempos principais. Estes são tCL/tCAS (a latência do CAS), tRCD, tRP e tRAS. Esses tempos podem ocasionalmente ser seguidos por um quinto número, uma taxa de comando, mas isso é um pouco diferente e geralmente sem importância.
Noções básicas de operação de RAM
Antes de definirmos esses tempos primários, será essencial entender o básico de como a RAM realmente funciona. Os dados na RAM são armazenados em colunas e apenas uma pode interagir a qualquer momento. Para poder ler ou gravar em uma coluna, primeiro você precisa abrir a linha na qual essa coluna está localizada. Apenas uma linha pode ser aberta por vez. A RAM pode vir com vários bancos. Nesse caso, apenas uma linha pode estar disponível por banco. Embora seja possível interagir com apenas uma coluna de cada vez, ter uma segunda linha aberta em um segundo banco permite que a próxima operação de leitura ou gravação seja enfileirada com eficiência.
É importante entender que os tempos não são valores absolutos. Na verdade, eles são múltiplos do clock de E/S da RAM, pois são unidades de ciclos de clock. Novamente, a RAM é o dobro da taxa de dados, que é metade da velocidade anunciada. Você precisa fazer algumas contas para determinar a latência real do tempo específico. Você pode fazer 1/(taxa de transferência anunciada em Ts/2) para obter a duração de um único ciclo de clock em segundos e depois multiplicar isso pela taxa de tempo que você deseja saber o valor. Alternativamente, suponha que você queira um tempo mais fácil. Nesse caso, você pode fazer uma taxa de transferência de 2000/anunciado em MTs para obter a duração de um único ciclo de clock em nanossegundos e multiplicar isso pela taxa de tempo.
Por exemplo, se tivermos dois conjuntos de RAM, DDR4-3000 CL15 e DDR4-3200 CL16, podemos fazer (2000/3000)*15 e (2000/3200)*16 para descobrir que a latência CAS absoluta de ambos os tipos de RAM é de 10 nanossegundos.
Tempos Primários
Os tempos primários de RAM são normalmente apresentados como um conjunto de quatro números separados por traços. Ocasionalmente, estes serão acompanhados por um “1T” ou “2T” no final. Para os exemplos a seguir, usaremos os tempos primários de duas entradas em nosso artigo recente sobre o melhor RAM para jogos em 2022: a G.Skill Trident Z Royal DDR4 3200 CL16-18-18-38 e a G.Skill Trident Z5 RGB DDR5 6400 CL32-39-39-102. Para esses exemplos, os tempos primários são 16-18-18-38 e 32-39-39-102, respectivamente. O tempo para um único ciclo de clock é de 0,625 nanossegundos e 0,3125 nanossegundos, respectivamente.
Observação: Todos esses tempos afetam qualquer operação, leitura ou gravação, embora, nos exemplos abaixo, nos referiremos apenas às operações de leitura para simplificar as coisas.
Latência CAS
O primeiro número nos tempos primários é a latência do CAS. Normalmente, esse é o momento principal para melhorar se você estiver tentando fazer overclock na RAM. A latência do CAS também pode ser indicada em CL, tCAS ou tCL, com os dois últimos mais prováveis de serem encontrados no BIOS e em outros utilitários de configuração. CAS é a abreviação de Column Address Strobe. Não é mais tecnicamente um estroboscópio. Mas o comando lê dados de uma coluna de uma linha aberta no que é conhecido como “acesso de página”.
tCL é uma medida de quantos ciclos após o envio de uma instrução CAS, a resposta começará a ser retornada pelo barramento de E/S. Portanto, para nosso exemplo DDR4, a latência do CAS é de 10 nanossegundos; para o nosso exemplo DDR5, a latência do CAS também é de 10 nanossegundos.
Atraso de RAS para CAS
A segunda entrada nas temporizações primárias é o atraso RAS para CAS. Isso geralmente será indicado como tRCD e é um valor mínimo, não um valor exato. Se não houver linhas abertas quando uma instrução de leitura chegar, isso é conhecido como “falta de página”. Uma linha deve primeiro ser aberta para acessar uma coluna para ler seus dados. RAS significa Row Access Strobe. Como o CAS, não é mais um estroboscópio com o nome de ressaca, mas é o nome do comando emitido para abrir uma linha.
O atraso de RAS para CAS é a quantidade mínima de ciclos de clock necessários para abrir a linha, supondo que nenhuma esteja aberta. O tempo para poder ler os dados nesse cenário é tRCD + tCL. Nosso exemplo DDR4 tem um tRCD de 18, que é 11,25 nanossegundos, enquanto nosso exemplo DDR5 tem um tRCD de 39, que dá 12,1875 nanossegundos.
Tempo de pré-carga da linha
O terceiro tempo principal é o tempo de pré-carga da linha, geralmente encurtado para tRP. Esse valor é essencial quando há outro tipo de falta de página. Nesse caso, a linha da direita não está aberta, mas a outra linha está. Para abrir a linha direita, a outra linha deve primeiro ser fechada. O processo de completar uma linha é chamado de pré-carregamento. Isso envolve gravar os valores na linha lida quando ela foi aberta.
O tempo de pré-carga da linha é o número mínimo de ciclos de clock necessários para concluir o processo de pré-carga em uma linha aberta. O tempo total para poder ler dados de uma célula, neste cenário, seria tRP + tRCD + tCL. Como os valores de tRP são os mesmos de tRCD em ambos os nossos exemplos, é fácil ver que eles terminariam up com os mesmos valores: 11,25 nanossegundos para o DDR4 tRP e 12,1875 nanossegundos para o DDR5 tRP.
Tempo de ativação da linha
O quarto tempo principal é o tempo de ativação da linha, geralmente abreviado para tRAS. Este é o número mínimo de ciclos de clock entre o comando para abrir uma linha e o comando de pré-carga para fechá-la novamente. É o tempo necessário para atualizar internamente a linha. Este é o único tempo primário que se sobrepõe a outro, especificamente tRCD. Os valores variam, mas geralmente são aproximadamente tRCD + tCL, embora possam variar até cerca de tRCD + (2* tCL).
Nosso exemplo DDR4 tem um tRAS de 38 ciclos dando um tempo total de 23,75 nanossegundos. Nosso exemplo DDR5 tem um valor de rRAS de 102 ciclos dando um tempo total de 31,875 nanossegundos.
Historicamente, para DRAM sincronizada, os valores foram muito próximos de tRCD + tCL, como visto em nosso exemplo de temporizações DDR4. O cenário tRCD + (2* tCL) tradicionalmente era usado para DRAM assíncrona, pois o controlador de memória precisava permitir tempo mais do que suficiente para a conclusão da operação. Curiosamente, DDR5 atualmente também usa a soma tRCD + (2* tCL). Não está claro se isso é causado por uma mudança no padrão ou se é um problema inicial dos primeiros produtos DDR5 que serão aprimorados à medida que a plataforma amadurecer.
Curiosamente, há algumas evidências de que é possível inicializar com um tRAS menor que tRCD + tCL. Teoricamente, isso não deveria realmente funcionar. Não está claro se isso ocorre porque esse valor, como a maioria dos outros tempos, é mínimo e o controlador de memória opta por usar tempos mais flexíveis na prática. Ou se as configurações estivessem apenas parcialmente estáveis. Dos tempos primários, isso provavelmente tem o menor efeito no desempenho real, mas pode valer a pena ajustar se você estiver atrás do desempenho máximo, especialmente com os altos valores vistos no DDR5 atual.
Taxa de Comando
A taxa de comando é o número de ciclos entre um chip DRAM selecionado e um comando executado nesse chip. Existem muitos acrônimos para esse valor, como CR, CMD, CPC e tCPD. A maneira mais fácil de saber é que o valor numérico é normalmente seguido por um “T”. Apesar da notação T, esta ainda é uma medida em ciclos de clock.
A maior parte da RAM que você encontra funcionará em 2T, embora algumas possam funcionar em 1T. Haverá uma diferença mínima, pois esta é a diferença de um único ciclo de clock, menos de um nanossegundo.
Tempos Secundários e Terciários
Existem muitos outros tempos secundários e terciários que podem ser alterados. No entanto, fazer isso é altamente complexo. Mesmo overclockers de memória experientes podem levar um dia ou mais para discar em configurações estáveis. Alguns são mais fáceis de ajustar do que outros e têm impactos mais significativos. Por exemplo, tREFI e tRFC. Eles controlam a frequência com que as células de memória são atualizadas e quanto tempo leva o processo de atualização. Durante o processo de atualização, o banco deve ficar ocioso. Portanto, ter um intervalo tão grande entre as atualizações e um período de atualização tão curto quanto possível significa que sua RAM pode funcionar por mais tempo.
Ajustar esses valores mostra um valor específico quando sua configuração de RAM tem um número insuficiente de bancos. É fundamental entender que obter esses valores errados causará erros de corrupção de memória em grande escala, pois as células não serão atualizadas com frequência suficiente. Essas configurações também são suscetíveis à temperatura da RAM, pois isso afeta diretamente a rapidez com que a carga em uma célula decai e, portanto, com que frequência ela precisa ser atualizada.
Proporção do Controlador de Memória
Gerações recentes de CPUs podem permitir que você configure a proporção do controlador de memória. Isso é normalmente conhecido como Gear 1, 2 e 4. O Gear 1 faz com que o controlador de memória funcione em uma proporção de 1:1 com a memória. No entanto, isso resulta em consumo excessivo de energia acima de 3600MTs, afetando a estabilidade do sistema. Para algum aumento na latência, mudar para o Gear 2 executa o controlador de memória na proporção de 1:2, na metade da velocidade da memória. Em última análise, isso só oferece qualquer benefício de cerca de 4400MTs ou mais. A engrenagem 1 é melhor, mas a engrenagem 2 pode fornecer estabilidade em velocidades mais altas.
Embora isso seja importante para a RAM DDR4, a RAM DDR5 atualmente sempre é executada no Gear 2, pois começa mais rápido. Embora seja atualmente desnecessário, como a tecnologia não está madura o suficiente para usar, o Gear 4 operaria o controlador de memória em uma proporção de 1: com a memória a um quarto da velocidade. Novamente, isso só é necessário em altas velocidades. No entanto, não está claro exatamente onde essa transição seria, pois o hardware ainda não está lá.
Conclusões
Os tempos de RAM oferecem uma incrível capacidade de configuração para a RAM do seu sistema. No entanto, eles também são um buraco de coelho profundo se você entrar em overclocking completo de RAM. Para ajudar a tornar mais fácil obter a maioria dos benefícios, o padrão XMP permite que os fabricantes de memória especifiquem seus tempos recomendados fora dos padrões JEDEC. Isso pode oferecer desempenho extra em uma implementação quase plug-and-play.
Em alguns casos, o perfil XMP será ativado por padrão. Ainda assim, muitas vezes será necessário selecioná-lo manualmente no BIOS. Isso aplica automaticamente as velocidades mais altas recomendadas pelo fornecedor e reduz os tempos às configurações testadas pelo fornecedor. Se você decidir configurar seus tempos de RAM, saber o que são e o que fazem é essencial.