CPU's, knelpunten en games: het probleem met CPU-benchmarking

click fraud protection

Het benchmarken van een CPU in games is niet zo eenvoudig als je denkt.

De langverwachte Ryzen 7000X3D-serie is er, en iedereen is het erover eens dat de Ryzen 9 7950X3D de snelste CPU is voor gaming... maar met hoeveel? Dat is een lastige vraag om te beantwoorden, omdat de recensies overal verspreid zijn. Sommige publicaties ontdekten dat de 7950X3D nauwelijks sneller was dan Intel's Core i9-13900K, terwijl anderen grotere marges vonden van meer dan 10%. Het is niet zo dat recensenten totaal verschillende games testen, en in niet-gaming benchmarks zoals Cinebench R23 zijn de scores over de hele linie ongeveer hetzelfde, ongeacht een procentpunt.

Dit is niet de eerste keer dat recensenten het niet eens zijn over hoe snel CPU's voor games zijn. In feite gebeurt het met vrijwel elke CPU, of hij er nu zin ​​in heeft 3D V-cache of niet. We zien deze brede, variërende marges voor beoordelingen van GPU's, SSD's of zelfs CPU's niet echt in niet-gamingbenchmarks. Dus wat is er aan de hand? Het komt uiteindelijk neer op het unieke gedrag van CPU's in games en de verschillende testmethoden die van beoordeling tot beoordeling worden gebruikt.

Het merkwaardige geval van de CPU-bottleneck

Moderne GPU's hebben honderden tot tienduizenden kernen. Deze kernen zijn zeer flexibel en ideaal voor het aanpakken van werklasten die in moeilijkheidsgraad toenemen. Dit betekent de beste gaming-GPU's kan grafische instellingen verwerken die resulteren in variërende visuele kwaliteit en frames per seconde. Het verlagen van grafische instellingen, zoals de resolutie, maakt de wiskunde voor het renderen van frames eenvoudiger, wat betekent dat er meer frames per seconde kunnen worden weergegeven. Aan de andere kant, als frames moeilijker te renderen zijn, zullen er minder per seconde gemaakt worden.

De rol van de CPU in games verschilt enorm van die van de GPU. Sinds het begin van de jaren 2000 worden veel processen die oorspronkelijk op de CPU werden uitgevoerd, nu door de GPU uitgevoerd, waardoor de CPU relatief weinig te doen heeft. De belangrijkste taak van de CPU is om deze minimale taken zo snel mogelijk gedaan te krijgen.

Maar er zijn twee grote problemen. Ten eerste kunnen deze taken niet gelijkmatig over alle cores en threads worden verspreid, dus meer cores betekent niet altijd betere prestaties. Ten tweede zullen grotere kernen met meer rekenkracht niet nuttig zijn, omdat deze werklasten zo basaal zijn. Deze factoren maken kloksnelheid en cachegrootte onevenredig belangrijk voor gaming. Cache vermindert de tijd die wordt besteed aan het wachten op gegevens, wat een belangrijke factor is bij prestatieverlies. Kloksnelheid daarentegen is de enige realistische manier om de werklast te versnellen die niet kan profiteren van de brute paardenkracht van moderne chips.

De gamingprestaties van een pc worden voornamelijk bepaald door de GPU en de CPU (opslag en RAM zijn meestal secundair factoren), maar niet tegelijkertijd omdat uw prestaties op een gegeven moment worden beperkt door de GPU of de CPU. Dat leidt uiteraard tot één grote vraag: wanneer wordt een pc beperkt door de CPU of de GPU? Deze vraag raakt eigenlijk de kern van een van de meest verwarrende dingen over gaming-benchmarks, omdat het verschil tussen GPU- en CPU-knelpunten niet erg intuïtief is.

Wanneer uw pc een GPU-beperking heeft, wordt de grafische kaart op of bijna 100% gebruikt, wat betekent dat u zoveel mogelijk bronnen gebruikt en meestal het maximale stroomverbruik bereikt. Dit betekent dat je frames kunt inruilen voor visuele kwaliteit en andersom. Maar voor de meeste games hebben deze grafische instellingen geen directe invloed op de CPU, en zelfs in games met CPU-gerelateerde instellingen zijn er meestal maar een paar.

Het verhogen van de grafische instellingen is niet nodig om een ​​CPU-knelpunt in games te creëren. Sterker nog, het verhogen van de grafische instellingen zorgt er praktisch voor dat je nooit een CPU-knelpunt zult zien. Houd er rekening mee dat de CPU vrij beperkt is in de hoeveelheid werk die hij kan doen, en hoewel er weinig of geen instellingen die je kunt aanpassen om de werklast in games te verhogen, je kunt de framerate verhogen door de graphics te verlagen instellingen.

Sinds het begin van de jaren 2000 worden veel processen die oorspronkelijk op de CPU werden uitgevoerd, nu door de GPU uitgevoerd, waardoor de CPU relatief weinig te doen heeft.

Een CPU-knelpunt tegenkomen is eenvoudig als u de framerate verhoogt tot het punt waarop de GPU meer frames kan weergeven dan de CPU aankan. Dit betekent in feite dat een CPU een limiet heeft voor het aantal frames dat hij in een bepaald spel kan weergeven. Er zijn slechts twee realistische manieren om een ​​CPU-knelpunt in games te verwijderen. Je kunt sneller RAM-geheugen krijgen met een hogere frequentie en timing voor een kleine prestatieverbetering of een lagere framerate - en het is die tweede optie die problemen veroorzaakt bij benchmarking.

Stel je voor dat een recensent twee hypothetische CPU's test, Gamma en Zeta. In een grafisch intens spel met een groot budget Atoom hart, Gamma kan tot 200 FPS halen, terwijl Zeta 300 kan bereiken. Afhankelijk van hoe de recensenten de CPU's testen en hoe hard ze de framerate omhoog duwen, zouden ze dit kunnen vinden dat beide CPU's ongeveer gelijk zijn, dat Zeta een klein voordeel heeft, of dat Zeta de leiding heeft leiding. Dit is de reden waarom CPU-recensenten vaak tot verschillende conclusies komen over de CPU-prestaties in games.

Daarin houdt hij van het fundamentele dilemma van het beoordelen van CPU's in games. Je moet de framerate zo hoog mogelijk duwen om CPU-knelpunten bloot te leggen en zo de ware limieten van elke CPU te laten zien, wat vaak resulteert in een onrealistische benchmark. Zoals u zich kunt voorstellen, zorgt dit fenomeen al jaren voor controverse.

Het dilemma van het benchmarken van CPU's in games

De meeste enthousiastelingen nemen een van de volgende twee standpunten in als het gaat om CPU-benchmarking. Het eerste standpunt pleit voor een meer wetenschappelijke benadering die het knelpunt blootlegt, zonder rekening te houden met realistische omstandigheden. terwijl de tweede stelt dat reviewers moeten testen op instellingen die meer betekenen voor lezers die aankoopbeslissingen willen nemen.

Elke denkrichting heeft zijn sterke en zwakke punten. De voorstanders van het wetenschappelijke standpunt (meestal recensies en fans van het bedrijf met de snelste CPU) hebben ongetwijfeld gelijk in de zin dat deze benadering de ware grenzen van de CPU bij gaming onthult. Ze beweren echter ook vaak dat deze tests toekomstige prestaties nauwkeurig voorspellen. Wanneer je je GPU upgradet en ineens de capaciteit hebt voor hogere framerates, wil je uiteraard een betere CPU.

Dit argument over toekomstige prestaties is meerdere keren ontkracht. Hoewel de FX-CPU's van AMD aanvankelijk slechte resultaten op het gebied van gaming boekten vergeleken met het aanbod van Intel, werden chips zoals de De FX-8350 won feitelijk terrein en haalde zelfs hun Core i5-tegenhangers in, omdat games meer cores begonnen te gebruiken en draden. Bovendien zou ik willen beweren dat gamers grafische kaarten zelden upgraden puur voor hogere framerates. Gamers willen betere framerates En betere kwaliteitsinstellingen, inclusief hogere resoluties. Dit verkleint de kans op het blootleggen van een CPU-knelpunt na een GPU-upgrade.

Het argument voor ‘realistische’ instellingen is intuïtiever en gemakkelijker te volgen, maar de meeste retoriek gaat over hoe slecht 1080p is voor testen van high-end CPU's. Het punt is: kun je een high-end CPU zelfs goed testen tegen een CPU uit het middensegment of lager op een hoger niveau? oplossing? Als je een... hebt Kern i9-13900K, is de kans groter dat je op hogere framerates mikt, puur omdat je pc ook een high-end GPU heeft, zoals de RTX4090, terwijl het onwaarschijnlijk is dat een gebruiker met een Core i3-13100 veel verder dan 60 FPS zal mikken, omdat hij waarschijnlijk ook een lagere GPU heeft, zoals een RX 6500 XT. Test je met realistische instellingen voor de 13900K of voor de 13100?

Dat gezegd hebbende, denk ik dat dit tweede kamp een aantal geldige punten naar voren brengt. Ik kan niet met zekerheid zeggen wat de gemiddelde gebruiker wil, maar als oud lid van deze community kan ik me voorstellen dat de meeste zich ergens tussen de 60 en 144 richten FPS sinds 60 Hz en 144 Hz zijn zeer populaire vernieuwingsfrequenties, worden vaak geleverd met G-SYNC of FreeSync, en het overtreffen van de vernieuwingsfrequentie verbreekt die technologieën. 144 FPS is niet zo veel hoger voor moderne CPU's, dus CPU-knelpunten zijn minder waarschijnlijk, en bijgevolg zijn benchmarks die laten zien dat CPU's 300 FPS halen waarschijnlijk niet erg nuttig voor de meeste gebruikers.

Dit debat gaat minstens zes jaar terug, en ik kwam het voor het eerst tegen toen de Ryzen-serie van de eerste generatie in 2017 werd gelanceerd. Recensenten zijn bij hun testen meestal toegewijd gebleven aan het wetenschappelijke standpunt of zijn over het algemeen onverschillig tegenover beide partijen. Aan de andere kant raken lezers meestal boos als hun favoriete merk verliest in de recensies, maar ze brengen een aantal goede punten naar voren. Ik geloof echter dat er een middenweg is die aan de eisen van beide filosofieën kan voldoen: manier van benchmarken die zowel realistische instellingen gebruikt als resultaten behaalt die relevant zijn voor lezers.

Waarom de framerate zelf een belangrijk onderdeel is van een CPU-benchmark

Ik ben altijd gefascineerd geweest door testmethodologie en manieren om mensen resultaten te laten zien die daadwerkelijk iets betekenen. Dit is meer een gedachte-experiment dan een serieus voorstel, en het is iets dat ik voor de lol gebruik, maar ik heb mijn eigen CPU-testmethodologie bedacht.

We kunnen de potentiële maximale framerates die mogelijk worden gemaakt door de GPU niet negeren, omdat deze bepaalt hoe CPU's presteren en hoe realistisch deze is voor gebruikers. Wat ik voorstel is om dit concept op zijn kop te zetten en instellingen te selecteren om een ​​bepaalde framerate te bereiken in plaats van specifieke presets in te stellen of alles op het minimum in te stellen.

Hier is de basismethodologie. Selecteer een controle-CPU waarmee elke andere CPU wordt vergeleken. Omdat CPU's een prestatielimiet hebben, moet de besturingschip de snelste CPU zijn die u test, zoals een Core i9-13900K of een Ryzen9 7950X3D. Begin vervolgens met hogere grafische instellingen, voer uw benchmarks uit en blijf de instellingen aanpassen totdat uw besturings-CPU de gewenste framerate bereikt. Bijvoorbeeld in esports-titels zoals Counter-Strike: mondiaal offensief, uw gewenste framerate moet waarschijnlijk gemiddeld minimaal 240 FPS zijn, zo niet hoger.

Een CPU-recensie moet laten zien wat de moeite waard is om te kopen en wat niet, en hoewel recensies het product zijn van vele uren hard werken, analyseert niet elke recensie de gegevens kritisch.

Zodra je de instellingen hebt gevonden die de gewenste framerate op de besturings-CPU bereiken, gebruik je die instellingen bij het testen van andere chips. Het idee is om te laten zien hoeveel sneller de besturings-CPU kan worden vergeleken met theoretisch langzamere CPU's in een test die zowel wetenschappelijk als realistisch is. Wat mensen willen weten is of een duurdere CPU het geld waard is, en dit soort methodologie laat dat heel goed zien.

Er is echter één duidelijk probleem met dit soort benchmarking: het kost tijd. Grafische instellingen aanpassen en benchmarks draaien totdat de besturings-CPU de juiste framerate heeft tijdrovend, en het niet gebruiken van voorinstellingen kan betekenen dat voor elke nieuwe CPU de individuele instellingen moeten worden gewijzigd spel. Bovendien vereisen nieuwe CPU's en games extra kalibratie, misschien tot het punt waarop je een andere CPU de besturing moet geven. Gewoon een preset kiezen of alles op het minimum instellen is veel eenvoudiger.

Er zijn alternatieven voor deze methodologie die veel eenvoudiger te implementeren zijn. Veel recensenten testen op meerdere resoluties om het wisselende CPU-knelpunt aan te tonen, waarbij 1080p de meeste CPU-knelpunten heeft en 1440p of 4K het minste. Techspot En Anandtech Test soms meerdere GPU's om hetzelfde effect te bereiken, aangezien snellere GPU's een hogere potentiële framerate hebben, waardoor CPU-knelpunten aan het licht kunnen komen.

Analyse is zelfs belangrijker dan methodologie

Een goede testmethodologie en hoogwaardige gegevens zijn slechts de helft van wat een review compleet maakt. De andere helft is analyse, waarbij de recensent de lezers informeert wat de resultaten betekenen. Veel gebruikers kunnen zelf beslissen wat data betekent, maar niet iedereen die van pc-gaming houdt, is een liefhebber.

Als een recensie een benchmark laat zien waarbij de ene CPU 500 FPS haalt en de andere 300, zou er enige context moeten zijn over wat dat betekent. Als het een esports-titel is, kan dat verschil belangrijk zijn voor iedereen die competitief wil spelen en de hoogste framerates nodig heeft. Voor de meeste andere games zal het prestatievoordeel van de snellere CPU waarschijnlijk niet volledig worden gerealiseerd of gewaardeerd. Ik heb gezien dat sommige recensies benchmarks met dit soort resultaten lieten zien in hele oude games en de snellere CPU een hype gaven, terwijl andere recensies veel bescheidener marges vonden in meer realistische tests.

Uiteindelijk moet een CPU-recensie laten zien wat de moeite waard is om te kopen en wat niet, en hoewel recensies het product zijn van vele uren hard werken, analyseert niet elke recensie de gegevens kritisch. Ik waardeer de recensenten die even de tijd nemen om CPU-knelpunten te bespreken en hoe deze groeien of krimpen met verschillende GPU's en grafische instellingen. Het is zeker waar dat sommige CPU's sneller zijn dan andere, en dat zijn ze ook beter voor gamen, maar het is nooit duidelijk of dat betekent dat het beter is voor elke afzonderlijke gebruiker.