CPU'er, flaskehalse og spil: problemet med CPU-benchmarking

Benchmarking af en CPU i spil er ikke så simpelt, som du tror.

Den længe ventede Ryzen 7000X3D-serie er her, og alle er enige om, at Ryzen 9 7950X3D er den hurtigste CPU til gaming... men hvor meget? Det er et svært spørgsmål at besvare, fordi anmeldelserne er overalt. Nogle publikationer fandt ud af, at 7950X3D knap var hurtigere end Intels Core i9-13900K, mens andre fandt større marginer på over 10 %. Det er ikke sådan, at anmeldere tester helt forskellige spil, og i benchmarks uden for spil som Cinebench R23 er scoren omtrent den samme over hele linjen, give eller tage et procentpoint.

Det er ikke første gang, anmelderne ikke kan blive enige om, hvor hurtige CPU'er er til spil. Faktisk sker det for stort set enhver CPU, uanset om den har en fancy 3D V-Cache eller ikke. Vi ser ikke rigtig disse brede, varierende margener for anmeldelser på GPU'er, SSD'er eller endda CPU'er i benchmarks uden for spil. Så hvad er aftalen? Det kommer i sidste ende ned til CPU'ernes unikke adfærd i spil og de forskellige testmetoder, der bruges fra anmeldelse til anmeldelse.

Det mærkelige tilfælde af CPU-flaskehalsen

Moderne GPU'er har alt fra hundreder til titusindvis af kerner. Disse kerner er meget fleksible og er ideelle til at tackle arbejdsbyrder, der skaleres i vanskeligheder. Dette betyder bedste gaming GPU'er kan håndtere grafikindstillinger, der resulterer i varierende visuel kvalitet og billeder i sekundet. Sænkning af grafikindstillinger som opløsning gør matematikken til gengivelse af rammer nemmere, hvilket betyder, at flere billeder kan gengives pr. sekund. På den anden side, hvis frames er sværere at gengive, vil der blive lavet færre per sekund.

CPU'ens rolle i spil er vidt forskellig fra GPU'ens. Siden begyndelsen af ​​2000'erne er mange processer, der oprindeligt blev udført på CPU'en, nu udført af GPU'en, hvilket efterlader CPU'en med relativt lidt at gøre. Den vigtigste opgave for CPU'en er bare at få disse minimale opgaver udført så hurtigt som muligt.

Men der er to store problemer. For det første kan disse opgaver ikke fordeles jævnt til alle kerner og tråde, så flere kerner betyder ikke altid bedre ydeevne. For det andet vil større kerner med mere beregningskraft ikke være nyttige, da disse arbejdsbelastninger er så grundlæggende. Disse faktorer gør clockhastighed og cachestørrelse uforholdsmæssigt vigtige for spil. Cache reducerer den tid, der bruges på at vente på data, hvilket er en væsentlig faktor for tab af ydeevne. Urhastighed er på den anden side den eneste realistiske måde at fremskynde arbejdsbelastninger, der ikke kan udnytte moderne chipss rå hestekræfter.

En pc's spilydelse bestemmes hovedsageligt af GPU'en og CPU'en (lager og RAM er normalt sekundære faktorer), men ikke på samme tid, fordi din ydeevne på et givet tidspunkt enten er begrænset af GPU'en eller CPU'en. Det fører naturligvis til et stort spørgsmål: Hvornår er en pc begrænset af CPU'en eller GPU'en? Dette spørgsmål kommer faktisk til kernen af ​​en af ​​de mest forvirrende ting ved gaming benchmarks, fordi forskellen mellem GPU og CPU flaskehalse ikke er særlig intuitiv.

Når din pc er GPU begrænset, vil grafikkortet køre ved eller tæt på 100% brug, hvilket betyder, at du bruger så mange ressourcer som muligt og normalt rammer det maksimale strømforbrug. Det betyder, at du kan bytte rammer til visuel kvalitet og omvendt. Men for de fleste spil påvirker disse grafikindstillinger ikke CPU'en direkte, og selv i spil med CPU-relaterede indstillinger er der normalt kun nogle få.

Det er ikke nødvendigt at øge grafikindstillingerne for at skabe en CPU-flaskehals i spil. Faktisk sikrer øgede grafikindstillinger praktisk talt, at du aldrig vil se en CPU-flaskehals. Husk, at CPU'en er ret begrænset i mængden af ​​arbejde, den kan udføre, og selvom der er få, hvis nogen, indstillinger, du kan justere for at øge arbejdsbyrden i spil, kan du øge billedhastigheden ved at sænke grafikken indstillinger.

Siden begyndelsen af ​​2000'erne er mange processer, der oprindeligt blev udført på CPU'en, nu udført af GPU'en, hvilket efterlader CPU'en med relativt lidt at gøre.

Det er nemt at løbe ind i en CPU-flaskehals, hvis du øger frameraten til, hvor GPU'en kan gengive flere frames, end CPU'en kan håndtere. Dette betyder grundlæggende, at en CPU har en grænse for, hvor mange frames den kan vise i et givet spil. Der er kun to realistiske måder at fjerne en CPU-flaskehals i spil. Du kan få hurtigere RAM med højere frekvens og timings for et lille ydelsesboost eller sænke framerate - og det er den anden mulighed, der skaber problemer for benchmarking.

Forestil dig, at en anmelder tester to hypotetiske CPU'er, Gamma og Zeta. I et stort budget, grafisk intenst spil som Atomisk hjerte, Gamma kan få op til 200 FPS, mens Zeta kan opnå 300. Afhængigt af hvordan anmelderne tester CPU'erne og hvor hårdt de presser frameraten op, kunne de finde at begge CPU'er er nogenlunde lige store, at Zeta har en lille fordel, eller at Zeta har en kommando at føre. Det er derfor, CPU-anmeldere ofte kommer til forskellige konklusioner om CPU-ydelse i spil.

Deri kan lide det grundlæggende dilemma med at gennemgå CPU'er i spil. Du skal skubbe framerate så højt som muligt for at afsløre CPU-flaskehalse og dermed vise de sande grænser for hver CPU, hvilket ofte resulterer i et urealistisk benchmark. Som du kan forestille dig, har dette fænomen skabt kontrovers i årevis.

Dilemmaet med benchmarking af CPU'er i spil

De fleste entusiaster indtager en af ​​to positioner, når det kommer til CPU-benchmarking. Den første holdning går ind for en mere videnskabelig tilgang, der afslører flaskehalsen uden hensyn til realistiske omgivelser, mens den anden argumenterer for, at anmeldere bør teste ved indstillinger, der betyder mere for læsere, der ønsker at træffe købsbeslutninger.

Hver tankegang har sine styrker og svagheder. Tilhængerne af den videnskabelige position (normalt anmeldelser og fans af virksomheden med den hurtigste CPU) har utvivlsomt ret i, at denne tilgang afslører CPU'ens sande grænser i spil. Men de argumenterer også ofte for, at disse test nøjagtigt forudsiger fremtidig ydeevne. Når du opgraderer din GPU og pludselig har kapacitet til højere framerates, vil du naturligvis have en bedre CPU.

Dette argument om fremtidige resultater er blevet afvist flere gange. Mens AMD's FX CPU'er oprindeligt lancerede dårlige resultater i spil sammenlignet med Intels tilbud, blev chips som f.eks. FX-8350 vandt faktisk terræn og overhalede endda deres Core i5-modstykker, da spil begyndte at bruge flere kerner og tråde. Derudover vil jeg hævde, at spillere sjældent opgraderer grafikkort udelukkende til højere framerates. Spillere ønsker bedre framerates og bedre kvalitetsindstillinger, herunder højere opløsninger. Dette reducerer chancerne for at afsløre en CPU-flaskehals efter en GPU-opgradering.

Argumentet for "realistiske" indstillinger er mere intuitivt og lettere at følge, men det meste af retorikken handler kun om, hvor dårligt 1080p er for test af avancerede CPU'er. Sagen er, kan du endda ordentligt teste en avanceret CPU mod en, der er mellemtone eller lavere ved en højere løsning? Hvis du har en Core i9-13900K, er du simpelthen mere tilbøjelig til at sigte efter højere framerates, udelukkende fordi din pc også har en avanceret GPU som RTX 4090, mens en bruger med en Core i3-13100 sandsynligvis ikke vil sigte meget længere forbi 60 FPS, fordi de sandsynligvis også har en lavere-end GPU som en RX 6500 XT. Tester du med realistiske indstillinger for 13900K eller for 13100?

Når det er sagt, synes jeg, at denne anden lejr fremsætter nogle gyldige pointer. Jeg kan ikke med sikkerhed sige, hvad den gennemsnitlige bruger ønsker, men som langvarig medlem af dette fællesskab, vil jeg forestille mig, at de fleste målretter mod 60 til 144 steder. FPS, da 60Hz og 144Hz er meget populære opdateringshastigheder, kommer ofte med G-SYNC eller FreeSync, og at overgå opdateringshastigheden bryder disse teknologier. 144 FPS er ikke så meget højere for moderne CPU'er, så CPU-flaskehals er mindre sandsynligt, og følgelig er benchmarks, der viser CPU'er, der får 300 FPS, sandsynligvis ikke særlig nyttige for de fleste brugere.

Denne debat går mindst seks år tilbage, og jeg stødte på den første gang, da den første generation af Ryzen-serien blev lanceret i 2017. Anmeldere er for det meste forblevet forpligtet til enten det videnskabelige synspunkt eller generelt ligeglade med begge sider i deres test. På den anden side bliver læserne for det meste kede af det, når deres foretrukne mærke taber i anmeldelserne, men de bringer nogle gode pointer frem. Jeg tror dog, at der er en mellemvej, der kan tilfredsstille kravene i begge filosofier, en måde at benchmarke på, der både bruger realistiske indstillinger og opnår resultater, der er relevante ift læsere.

Hvorfor selve frameraten er en vigtig del af et CPU-benchmark

Jeg har altid været fascineret af at teste metoder og måder at vise folk resultater, der rent faktisk betyder noget. Dette er mere et tankeeksperiment snarere end et seriøst forslag, og det er noget, jeg bruger for sjov, men jeg har fundet frem til min egen CPU-testmetode.

Vi kan ikke ignorere de potentielle maksimale framerates, der er muliggjort af GPU'en, fordi det bestemmer, hvordan CPU'er yder, og hvor realistisk det er for brugerne. Det, jeg foreslår, er at vende dette koncept på hovedet og vælge indstillinger for at opnå en bestemt billedhastighed i stedet for at indstille specifikke forudindstillinger eller sætte alt til et minimum.

Her er den grundlæggende metode. Vælg en kontrol-CPU, som hver anden CPU vil blive sammenlignet med. Da CPU'er har en ydeevnegrænse, bør kontrolchippen være den hurtigste CPU, du tester, såsom en Core i9-13900K eller en Ryzen 9 7950X3D. Start derefter med højere grafikindstillinger, kør dine benchmarks og fortsæt med at justere indstillingerne, indtil din kontrol-CPU opnår den ønskede billedhastighed. For eksempel i esports titler som Counter-Strike: Global Offensiv, din ønskede billedhastighed skal sandsynligvis være mindst 240 FPS i gennemsnit - hvis ikke højere.

En CPU-gennemgang skal vise, hvad der er værd at købe, og hvad der ikke er, og selvom anmeldelser er resultatet af mange timers hårdt arbejde, er det ikke hver anmeldelse, der kritisk analyserer dataene.

Når du har fundet de indstillinger, der opnår din foretrukne framerate på kontrol-CPU'en, skal du bruge disse indstillinger, når du tester andre chips. Ideen er at vise, hvor meget hurtigere kontrol-CPU'en kan sammenlignes med teoretisk langsommere CPU'er i en test, der er både videnskabelig og realistisk. Det, folk gerne vil vide, er, om en high-end CPU er pengene værd, og denne form for metode er meget god til at vise det.

Der er dog et åbenlyst problem med denne form for benchmarking: Det tager tid. Justering af grafikindstillinger og kørsel af benchmarks, indtil kontrol-CPU'en har den rigtige billedhastighed tidskrævende og ikke at bruge forudindstillinger kan betyde ændring af individuelle indstillinger på hver ny CPU for hver spil. Derudover kræver nye CPU'er og spil yderligere kalibrering, måske til det punkt, hvor du skal gøre en anden CPU til kontrol. Bare at vælge en forudindstilling eller sætte alt til minimum er meget nemmere.

Der er alternativer til denne metode, som er meget nemmere at implementere. Mange anmeldere tester ved flere opløsninger for at vise den skiftende CPU-flaskehals, hvor 1080p har mest CPU-flaskehals og 1440p eller 4K mindst. Techspot og Anandtech teste nogle gange flere GPU'er for at opnå den samme effekt, da hurtigere GPU'er vil have en højere potentiel framerate, der kan afsløre CPU-flaskehals.

Analyse er endnu vigtigere end metode

En god testmetode og data af høj kvalitet er kun halvdelen af, hvad der gør en anmeldelse omfattende. Den anden halvdel er analyse, som er, når anmelderen informerer læserne om, hvad resultaterne betyder. Mange brugere kan gøre op med deres egne meninger om, hvad data betyder, men ikke alle til pc-spil er entusiast.

Hvis en anmeldelse viser et benchmark, hvor en CPU rammer 500 FPS og en anden 300, burde der være en vis sammenhæng om, hvad det betyder. Hvis det er en esports-titel, kan denne forskel være vigtig for alle, der ønsker at spille konkurrencedygtigt og har brug for de højeste framerates. For de fleste andre spil vil den ydelsesfordel, som den hurtigere CPU tilbyder, næppe blive fuldt ud realiseret eller værdsat. Jeg har set nogle anmeldelser vise benchmarks med denne slags resultater i meget gamle spil og hype den hurtigere CPU, mens andre anmeldelser fandt meget mere beskedne marginer i mere realistiske tests.

I sidste ende skal en CPU-gennemgang vise, hvad der er værd at købe, og hvad der ikke er, og selvom anmeldelser er et produkt af mange timers hårdt arbejde, er det ikke hver anmeldelse, der kritisk analyserer dataene. Jeg sætter pris på anmelderne, der bruger et øjeblik på at diskutere CPU-flaskehalse, og hvordan de vokser eller krymper med forskellige GPU'er og grafikindstillinger. Det er helt sikkert rigtigt, at nogle CPU'er er hurtigere end andre og er det bedre til spil, men det er aldrig entydigt, hvis det betyder, at det er bedre for hver enkelt bruger.