Hvordan SRAMs død vil påvirke pc'ernes fremtid

Moores lov er officielt død, og det kan vi se førstehånds med en nylig TSMC-meddelelse,

I december, Wikichip rapporterede at TSMC's 3nm-proces praktisk talt ikke viste nogen forbedring i tæthed i forhold til virksomhedens tidligere 5nm-node med hensyn til SRAM-densitet. Publikationen stillede et enkelt spørgsmål: Var vi lige vidne til SRAMs død? I det mindste efter Wikichips mening er "historisk skalering officielt død."

Denne idé har massive konsekvenser for hele teknologiindustrien, og dens virkninger vil kunne mærkes på pc'er og andre enheder i de kommende år. Men du spørger måske dig selv, hvad alt dette betyder, og om du skal være ligeglad. For at forstå, hvordan "SRAMs død" vil påvirke pc'er, og hvordan chipdesignere vil håndtere det, er vi nødt til at tale om noder, Moores lov og cache.

Moores lov var ved at dø gradvist, og nu pludselig

Moores lov er halvlederindustriens benchmark for succes og hævder, at nyere chips bør have dobbelt så mange transistorer end chips fra to år siden. Intel, AMD og andre chipdesignere vil sikre sig, at de holder trit med Moores lov, og hvis de ikke følger med, mister de den teknologiske fordel for konkurrenterne.

Da processorer kun kan være så store, er den eneste pålidelige måde at øge transistortallet på at krympe dem og pakke dem tættere sammen. En node eller proces er, hvordan en halvlederproducent (også kaldet fabs og støberier) laver en chip; en node er normalt defineret ved størrelsen af en transistor, så jo mindre jo bedre. Opgradering til den nyeste fremstillingsproces var altid en pålidelig måde at øge transistorantal og ydeevne på, og i årtier har industrien været i stand til at leve op til alle forventningerne.

Desværre har Moores lov været døende i årevis nu, siden omkring 2010, hvor industrien ramte 32nm-mærket. Da den forsøgte at gå videre, ramte den en murstensvæg. Næsten alle fabrikater fra TSMC til Samsung til GlobalFoundries kæmpede for at udvikle noget mindre end 32nm. Til sidst blev der udviklet nye teknologier, der gjorde fremskridt mulig igen, men transistorer bliver ikke længere mindre på samme måde, som de plejede. Navnet på en node afspejler ikke længere, hvor lille transistoren faktisk er, og nye processer giver ikke længere den tæthedsforøgelse, de plejede.

Industrien ramte en mur, da den forsøgte at gå længere end 32nm-mærket i 2010.

Så hvad sker der med TSMC's 3nm node? Nå, der er to hovedtyper af transistorer, der er i en typisk processor: dem til logik og dem til SRAM eller cache. Logik har været lettere at krympe end cache i et stykke tid (cachen er allerede virkelig tæt), men det er første gang, vi har set et støberi som TSMC slet ikke krympe den i en ny node. En variant af 3nm med væsentlig højere cache-tæthed forventes på et tidspunkt, men TSMC helt sikkert ramt et bøjningspunkt, hvor skalering er meget lille, og andre fabs kan støde på det samme problem.

Men problemet handler ikke kun om ikke at kunne øge mængden af cache uden at bruge mere areal. Processorer kan kun være så store, og enhver plads, der optages af cache, er plads, der ikke kan bruges til logik, eller de transistorer, der fører til direkte ydelsesforbedringer. Samtidig har processorer med flere kerner og andre funktioner brug for mere cache for at undgå hukommelsesrelaterede flaskehalse. Selvom tætheden af logik fortsætter med at stige med hver ny node, er det måske ikke nok til at kompensere for manglen på SRAM-skalering. Dette kan være drabsslaget for Moores lov.

Hvordan industrien kan løse SRAM-problemet

Der er tre mål, højtydende processorer skal opfylde: størrelsen er begrænset, cachen er påkrævet, og nye noder vil ikke længere reducere størrelsen af cachen meget, hvis overhovedet. Selvom det er muligt at øge ydeevnen via arkitektoniske forbedringer og højere clockhastigheder, tilføjer flere transistorer har altid været den nemmeste og mest konsekvente måde at opnå et generationshastighedsboost på. For at overkomme denne udfordring skal en af disse fundamentale elementer ændres.

Som det viser sig, er der allerede en perfekt fungerende løsning på SRAM-problemet: chiplets. Det er den teknologi, som AMD har brugt siden 2019 til sine desktop- og server-CPU'er. Et chiplet-design bruger flere stykker silicium (eller matricer), og hver matrice har en eller kun nogle få funktioner; nogle har måske bare kerner for eksempel. Dette er i modsætning til et monolitisk design, hvor alt er i en enkelt matrice.

Chiplets kommer uden om størrelsesproblemet, og de er en vigtig del af, hvorfor AMD har været i stand til at følge med Moores lov. Husk, Moores lov handler ikke om massefylde, men antal transistorer. Med chiplet-teknologi har AMD været i stand til at skabe processorer med et samlet matriceareal på over 1.000 mm2; at fremstille denne CPU i bare en enkelt matrice er sandsynligvis umuligt.

Det vigtigste, AMD har gjort, der afbøder cache-problemet, er at sætte cache på sin egen die. V-cachen inde i Ryzen 7 5800X3D og hukommelseschipletterne i RX 7000-serien er et eksempel på cache-chiplets i aktion. Det er sandsynligt, at AMD så skriften på væggen, da cachen har været svær at krympe i årevis nu, og nu hvor cachen kan opdeles fra alt andet, efterlader det mere plads til større chiplets med flere kerner. RX 7900 XTX's hovedmatrice er kun omkring 300 mm2, hvilket betyder, at der er masser af plads til, at AMD kan lave en større die, hvis den vil.

Chiplets er dog ikke den eneste måde. Nvidias administrerende direktør for nylig proklamerede Moores lovs død. Virksomheden selv er afhængig af sin kunstige intelligens-teknologi for at opnå større ydeevne uden at skulle bevæge sig væk fra et monolitisk design. Dens nyeste Ada-arkitektur er teoretisk mange gange hurtigere end sidste generations Ampere takket være funktioner som DLSS 3. Vi vil dog se i de kommende år, om Moores lov skal holdes i live, eller om nye teknologier kan afspejle ydelsesfordelene ved at tilføje flere transistorer uden faktisk at skulle tilføje nogen.