CPU: er, flaskhalsar och spel: problemet med CPU benchmarking

Att benchmarka en CPU i spel är inte så enkelt som du tror.

Den efterlängtade Ryzen 7000X3D-serien är här, och alla är överens om att Ryzen 9 7950X3D är den snabbaste processorn för spel... men med hur mycket? Det är en svår fråga att svara på eftersom recensionerna finns överallt. Vissa publikationer fann att 7950X3D knappt var snabbare än Intels Core i9-13900K, medan andra fann större marginaler på över 10%. Det är inte så att recensenter testar helt olika spel, och i riktmärken för icke-spel som Cinebench R23 är poängen ungefär desamma över hela linjen, ger eller tar en procentenhet.

Det här är inte första gången som recensenter inte kan komma överens om hur snabba CPU: er är för spel. Faktum är att det händer i stort sett alla processorer, oavsett om det är något tjusigt 3D V-cache eller inte. Vi ser inte riktigt dessa breda, varierande marginaler för recensioner på GPU: er, SSD: er eller ens processorer i riktmärken för icke-spel. Så vad är affären? Det handlar i slutändan om det unika beteendet hos processorer i spel och de olika testmetoderna som används från recension till recension.

Det märkliga fallet med CPU-flaskhalsen

Moderna GPU: er har allt från hundratals till tiotusentals kärnor. Dessa kärnor är mycket flexibla och är idealiska för att hantera arbetsbelastningar som skalar i svårighetsgrad. Detta betyder bästa spel-GPU: er kan hantera grafikinställningar som resulterar i varierande visuell kvalitet och bildrutor per sekund. Att sänka grafikinställningar som upplösning gör matematiken för rendering av ramar enklare, vilket innebär att fler bildrutor kan renderas per sekund. Å andra sidan, om bildrutor är svårare att rendera, kommer färre att göras per sekund.

Processorns roll i spel skiljer sig mycket från den för GPU: n. Sedan början av 2000-talet har många processer som ursprungligen utförts på CPU: n nu gjorts av GPU: n, vilket lämnar CPU: n med relativt lite att göra. CPU: ns viktigaste uppgift är bara att få dessa minimala uppgifter gjorda så snart som möjligt.

Men det finns två stora problem. För det första kan dessa uppgifter inte fördelas jämnt till alla kärnor och trådar, så fler kärnor betyder inte alltid bättre prestanda. För det andra kommer större kärnor med mer beräkningskraft inte att vara användbara eftersom dessa arbetsbelastningar är så grundläggande. Dessa faktorer gör klockhastighet och cachestorlek oproportionerligt viktiga för spel. Cache minskar tiden för att vänta på data, vilket är en betydande faktor i prestandaförlust. Klockhastighet, å andra sidan, är det enda realistiska sättet att snabba upp arbetsbelastningar som inte kan dra nytta av moderna chipss råa hästkrafter.

En PC: s spelprestanda bestäms huvudsakligen av GPU: n och CPU: n (lagring och RAM är vanligtvis sekundära faktorer), men inte samtidigt eftersom din prestanda vid varje givet tillfälle antingen begränsas av GPU eller CPU: n. Det leder naturligtvis till en stor fråga: När begränsas en PC av CPU eller GPU? Den här frågan kommer faktiskt till kärnan i en av de mest förvirrande sakerna med spelriktmärken eftersom skillnaden mellan GPU- och CPU-flaskhalsar inte är särskilt intuitiv.

När din PC är GPU-begränsad kommer grafikkortet att köras med eller nära 100 % användning, vilket innebär att du använder så många resurser som möjligt och vanligtvis når den maximala strömförbrukningen. Det betyder att du kan byta ramar mot visuell kvalitet och vice versa. Men för de flesta spel påverkar dessa grafikinställningar inte processorn direkt, och även i spel med CPU-relaterade inställningar finns det vanligtvis bara ett fåtal.

Att öka grafikinställningarna är inte nödvändigt för att skapa en CPU-flaskhals i spel. Faktum är att ökade grafikinställningar praktiskt taget säkerställer att du aldrig kommer att se en CPU-flaskhals. Kom ihåg att CPU: n är ganska begränsad i mängden arbete den kan göra, och även om det finns få, om några, inställningar du kan justera för att öka arbetsbelastningen i spel, du kan öka bildhastigheten genom att sänka grafiken inställningar.

Sedan början av 2000-talet har många processer som ursprungligen utförts på CPU: n nu gjorts av GPU: n, vilket lämnar CPU: n med relativt lite att göra.

Att stöta på en CPU-flaskhals är enkelt om du ökar bildhastigheten till där GPU: n kan rendera fler ramar än CPU: n kan hantera. Detta betyder i princip att en CPU har en gräns för hur många bildrutor den kan visa i ett givet spel. Det finns bara två realistiska sätt att ta bort en CPU-flaskhals i spel. Du kan få snabbare RAM med högre frekvens och timings för en liten prestandaökning eller sänka bildhastigheten – och det är det andra alternativet som skapar problem för benchmarking.

Föreställ dig att en recensent testar två hypotetiska processorer, Gamma och Zeta. I en stor budget, grafiskt intensivt spel som Atomic Heart, Gamma kan få upp till 200 FPS medan Zeta kan uppnå 300. Beroende på hur granskarna testar CPU: erna och hur hårt de pressar upp bildhastigheten, kunde de hitta att båda processorerna är ungefär lika, att Zeta har en liten fördel, eller att Zeta har en kommando leda. Det är därför CPU-granskare ofta kommer till olika slutsatser om CPU-prestanda i spel.

Däri gillar det grundläggande dilemmat att granska processorer i spel. Du måste pressa framerate så högt som möjligt för att exponera CPU-flaskhalsar och därmed visa de verkliga gränserna för varje CPU, vilket ofta resulterar i ett orealistiskt riktmärke. Som du kan föreställa dig har detta fenomen orsakat kontroverser i flera år.

Dilemmat med benchmarking av processorer i spel

De flesta entusiaster tar en av två positioner när det gäller CPU-benchmarking. Den första positionen förespråkar ett mer vetenskapligt tillvägagångssätt som avslöjar flaskhalsen utan hänsyn till realistiska miljöer, medan den andra argumenterar för att granskare bör testa vid inställningar som betyder mer för läsare som vill fatta köpbeslut.

Varje tankeskola har sina styrkor och svagheter. Förespråkarna för den vetenskapliga positionen (vanligtvis recensioner och fans av företaget med den snabbaste CPU) har utan tvekan rätt i att detta tillvägagångssätt avslöjar CPU: ns verkliga gränser för spel. Men de hävdar också ofta att dessa tester exakt förutsäger framtida prestanda. När du uppgraderar din GPU och plötsligt har kapacitet för högre bildhastigheter vill du uppenbarligen ha en bättre CPU.

Detta argument om framtida resultat har avfärdats flera gånger. Medan AMD: s FX-processorer initialt lanserades till dåliga resultat i spel jämfört med Intels erbjudanden, har chips som FX-8350 tog faktiskt mark och gick om sina Core i5-motsvarigheter när spel började använda fler kärnor och trådar. Dessutom skulle jag hävda att spelare sällan uppgraderar grafikkort enbart för högre bildhastigheter. Spelare vill ha bättre framerates och bättre kvalitetsinställningar, inklusive högre upplösningar. Detta minskar chanserna att avslöja en CPU-flaskhals efter en GPU-uppgradering.

Argumentet för "realistiska" inställningar är mer intuitivt och lättare att följa, men det mesta av retoriken handlar bara om hur dåligt 1080p är för testa avancerade processorer. Saken är den, kan du till och med testa en avancerad CPU på rätt sätt mot en som är mellanregister eller lägre vid en högre upplösning? Om du har en Core i9-13900K, är det helt enkelt mer sannolikt att du siktar på högre bildhastigheter enbart eftersom din dator också har en avancerad GPU som RTX 4090, medan en användare med en Core i3-13100 sannolikt inte kommer att sikta mycket längre än 60 FPS eftersom de förmodligen också har en lägre GPU som en RX 6500 XT. Testar du med realistiska inställningar för 13900K eller för 13100?

Som sagt, jag tycker att det här andra lägret gör några giltiga poänger. Jag kan inte med säkerhet säga vad den genomsnittliga användaren vill ha, men som långvarig medlem i denna grupp skulle jag föreställa mig att de flesta riktar sig var som helst 60 till 144 FPS eftersom 60Hz och 144Hz är mycket populära uppdateringsfrekvenser, kommer ofta med G-SYNC eller FreeSync, och överträffar uppdateringsfrekvensen. tekniker. 144 FPS är inte så mycket högre för moderna processorer, så CPU-flaskhalsar är mindre troligt, och följaktligen är riktmärken som visar att processorer får 300 FPS förmodligen inte särskilt användbara för de flesta användare.

Den här debatten går minst sex år tillbaka i tiden, och jag stötte på den för första gången när första generationens Ryzen-serie lanserades 2017. Granskare har för det mesta varit engagerade i antingen den vetenskapliga synvinkeln eller generellt sett likgiltiga för någondera sidan i sina tester. Å andra sidan blir läsarna mest upprörda när deras favoritmärke förlorar i recensionerna, men de tar upp några bra poäng. Men jag tror att det finns en medelväg som kan tillfredsställa kraven i båda filosofierna, en sätt att benchmarka som använder både realistiska inställningar och uppnår resultat som är relevanta för läsare.

Varför själva framerate är en viktig del av ett CPU-riktmärke

Jag har alltid varit fascinerad av att testa metodik och sätt att visa människor resultat som faktiskt betyder något. Det här är mer ett tankeexperiment snarare än ett seriöst förslag, och det är något jag använder för skojs skull, men jag har kommit på min egen CPU-testmetod.

Vi kan inte ignorera de potentiella maximala framerates som möjliggörs av GPU: n eftersom det avgör hur CPU: er presterar och hur realistiskt det är för användarna. Vad jag föreslår är att vända på det här konceptet och välja inställningar för att uppnå en viss bildhastighet snarare än att ställa in specifika förinställningar eller ställa in allt till ett minimum.

Här är den grundläggande metoden. Välj en kontroll-CPU som alla andra processorer ska jämföras med. Eftersom CPU: er har en prestandagräns bör kontrollchippet vara den snabbaste CPU du testar, till exempel en Core i9-13900K eller en Ryzen 9 7950X3D. Börja sedan med högre grafikinställningar, kör dina riktmärken och fortsätt att justera inställningarna tills din kontroll-CPU uppnår önskad bildhastighet. Till exempel i esporttitlar som Counter-Strike: Global Offensive, din önskade bildhastighet bör förmodligen vara minst 240 FPS i genomsnitt - om inte högre.

En CPU-recension är tänkt att visa vad som är värt att köpa och vad som inte är det, och även om recensioner är resultatet av många timmars hårt arbete, analyserar inte varje recension kritiskt data.

När du har hittat inställningarna som uppnår din föredragna framerate på kontrollprocessorn, använd dessa inställningar när du testar andra chips. Tanken är att visa hur mycket snabbare styrprocessorn kan jämföras med teoretiskt långsammare CPU: er i ett test som är både vetenskapligt och realistiskt. Vad folk vill veta är om en avancerad CPU är värd pengarna, och den här typen av metodik är väldigt bra på att visa det.

Det finns dock ett uppenbart problem med den här typen av benchmarking: det tar tid. Att justera grafikinställningar och köra benchmarks tills kontroll-CPU har rätt bildhastighet är tidskrävande och att inte använda förinställningar kan innebära att man ändrar individuella inställningar på varje ny CPU för varje spel. Dessutom kräver nya CPU: er och spel ytterligare kalibrering, kanske till den punkt där du behöver göra en annan CPU till kontrollen. Bara att välja en förinställning eller ställa in allt på minimum är mycket lättare.

Det finns alternativ till denna metod som är mycket lättare att implementera. Många granskare testar med flera upplösningar för att visa den skiftande CPU-flaskhalsen, med 1080p som har mest CPU-flaskhals och 1440p eller 4K minst. Techspot och Anandtech testar ibland flera GPU: er för att uppnå samma effekt eftersom snabbare GPU: er har en högre potentiell framerate som kan avslöja CPU-flaskhalsar.

Analys är ännu viktigare än metodik

En bra testmetod och högkvalitativ data är bara hälften av vad som gör en recension heltäckande. Den andra hälften är analys, vilket är när granskaren informerar läsarna om vad resultaten betyder. Många användare kan bestämma sig för vad data betyder, men inte alla som gillar PC-spel är entusiast.

Om en recension visar ett riktmärke där en CPU når 500 FPS och en annan 300, borde det finnas ett sammanhang om vad det betyder. Om det är en esporttitel kan den skillnaden vara viktig för alla som vill spela konkurrenskraftigt och behöver de högsta ramhastigheterna. För de flesta andra spel kommer prestandafördelen som erbjuds av den snabbare CPU: n knappast att realiseras eller uppskattas fullt ut. Jag har sett några recensioner visa riktmärken med den här typen av resultat i mycket gamla spel och hypa upp den snabbare CPU: n, medan andra recensioner fann mycket mer blygsamma marginaler i mer realistiska tester.

I slutändan är en CPU-recension tänkt att visa vad som är värt att köpa och vad som inte är det, och även om recensioner är resultatet av många timmars hårt arbete, analyserar inte varje recension kritiskt data. Jag uppskattar recensenterna som tar en stund att diskutera CPU-flaskhalsar och hur de växer eller krymper med olika GPU: er och grafikinställningar. Det är verkligen sant att vissa processorer är snabbare än andra, och är det bättre för spel, men det är aldrig entydigt om det betyder att det är bättre för varje enskild användare.