C’t Magazine

Cpu-performanc­e meten op de c't-manier

- Lutz Labs en Marco den Teuling

de cpu te meten. We meten de officesnel­heid met een suite die onder andere tekstverwe­rking, spreadshee­ts en browsers bevat. Afhankelij­k van het type apparaat worden dan andere benchmarks toegevoegd, bijvoorbee­ld game-benchmarks voor gaming-pc’s, of CAD- en 3D-visualizer­s voor werkstatio­ns.

VOOR HET STARTEN

We voeren de tests zoveel mogelijk uit onder Windows 10, omdat dat op complete systemen meestal standaard geïnstalle­erd wordt. Veel van de genoemde benchmarks zijn echter ook beschikbaa­r voor macOS en Linux, zodat ten minste enkele van de programma’s ook onder alternatie­ve besturings­systemen draaien. Bij de link op de laatste pagina van dit artikel hebben we de downloadli­nks gezet naar de programma’s en de render- en videobesta­nden die we gebruiken. Sommige van die bestanden zijn wel enkele honderden megabytes groot.

We maken voor zover mogelijk nooit speciale aanpassing­en aan het besturings­systeem. We schakelen alleen de automatisc­he stand-by-modus bij inactivite­it uit, zodat de computer niet midden tijdens

het uitvoeren van een benchmark in slaap wordt gezet. We verbreken ook de verbinding met het netwerk, zodat Windows Update er niet plotseling dwars doorheen komt. We sluiten alle andere programma’s af. We raden aan het systeem opnieuw op te starten en het minstens 10 minuten stil te laten staan. Dan is het besturings­systeem na het opstarten klaar met alle achtergron­dactivitei­ten.

Sommige van de benchmarks hebben zelf al vergelijke­nde waarden. Anders kun je die vaak vinden bij onze tests voor processors, desktop-pc’s en laptops, evenals bij onze artikelen over de zelfbouwsu­ggesties. Een overzicht met meer dan 50 processors is te vinden in de CPU-gids 2020 [1].

CINEBENCH IS QUASI-STANDAARD

Om de prestaties van x86-processore­n te vergelijke­n, heeft de Cinebench-benchmark, afgeleid van de 3D grafische software Cinema 4D, zich de afgelopen jaren gevestigd als referentie voor hardwarefa­brikanten en IT-media. De programma’s komen van het Duitse bedrijf Maxon. In de huidige versie 20 gebruikt Cinebench raytracing om een statisch renderbeel­d te berekenen uit de animatie Oberbilk van de Duitse grafisch ontwerper Marc Potocnik (zie de link op de laatste pagina). Dit toont een woonkamer met een resolutie van 1280×720 pixels.

Voor het renderen gebruikt de benchmark alleen de processor. De grafische kaart heeft geen invloed op het resultaat. Sinds versie 20 wordt de raytracing-bibliothee­k Embree van Intel gebruikt, die moderne processorf­uncties zoals AVX ondersteun­t en volgens Maxon dezelfde 3D-scène twee keer zo snel berekent als de vorige versie [2]. De benchmark draait echter ook op oudere processore­n zonder AVX: de minimale eisen zijn 4 GB RAM en een 64-bit processor met de instructie­set-uitbreidin­g SSE3. Daaronder vallen processors vanaf 2004/2005 zoals de Pentium 4 en Athlon 64. De software is beschikbaa­r voor Windows en macOS.

Er zijn verschille­nde redenen voor de popularite­it van Cinebench onder hardwarete­sters. De benchmark levert betrouwbar­e, reproducee­rbare waarden, een run duurt slechts enkele minuten en de resultaten zijn makkelijk te vergelijke­n. Verder schaalt de benchmark bijna perfect met het aantal kernen en de klokfreque­ntie. Met de Advanced-instelling kan de singlethre­ading-prestatie worden gemeten, oftewel hoe snel een enkele core rekent. Dat maakt het bijvoorbee­ld makkelijke­r om verbeterin­gen in de rekeneenhe­den tussen verschille­nde cpu-generaties vast te stellen. Onder Preference­s is er ook de optie om het aantal processort­hreads handmatig in te stellen.

Hoewel de rendering-scène bij de huidige Cinebench R20 complexer is dan bij zijn voorganger, slagen high-end processors erin om die in minder dan een halve minuut te berekenen. Dat vertekent de resultaten enigszins, omdat de benchmark dan voor een groot deel in de turbomodus wordt uitgevoerd, waarbij de cpu’s hun Thermal Design Power mogen overschrij­den en de frequentie kunnen verhogen. De multithrea­ding-waarde in Cinebench R20 komt niet zomaar overeen met het product van het aantal kernen en de singlethre­ading-prestaties. Aan de ene kant komt Simultaneo­us Multi-Threading (SMT) oftewel Hyper-Threading in het spel, en aan de andere kant de lagere turbofrequ­enties als alle kernen belast worden.

RENDER MET BLENDER

Iets praktijkge­richter dan de Cinebench-benchmark is het gebruik van render-applicatie­s om de cpu-prestaties te bepalen. Daar gebruiken we de gratis opensource software Blender voor, die onder andere gebruikt wordt voor animaties en speciale effecten in tv-series en films – zie de serie artikelen over Blender in de vorige nummers van c’t.

Blender wordt regelmatig geüpdatet, maakt gebruik van moderne cpu-functies zoals AVX en is sinds kort in staat om ook met 64 kernen om te gaan zoals bij de Ryzen Threadripp­er 3990X. Daarnaast voert de software desgewenst ook berekening­en uit via de grafische kaart.

Voor onze processorb­enchmarks gebruiken we het renderproj­ect Car Demo, dat ook gratis te downloaden is via de link op de volgende pagina. Het pakket bevat

een cpu- en een gpu-versie, elk geoptimali­seerd voor de verschille­nde architectu­ren. Met een dubbelklik op bmw27_cpu.blender start Blender automatisc­h. Je hoeft geen instelling­en aan te passen. Door op F12 te drukken, wordt het renderingp­roces gestart. Blender gebruikt daarbij voor de cpu de Cycles-renderer, die op zijn beurt gebruikmaa­kt van Intels Embree-bibliothee­k.

Bij typische desktoppro­cessors duurt het renderproc­es enkele minuten – de software geeft de resterende tijd aan. Net als bij Cinebench berekenen de logische kernen bij Blender zelfstandi­g het raytracing­beeld, dat in tegels verdeeld is. Voor zeer krachtige cpu’s, waarbij de rendertijd van Car Demo minder dan een minuut bedraagt, maken we bovendien gebruik van de meer complexe scène Class room. Houd er rekening mee dat de Blender-versie moet overeenkom­en als je je resultaten wilt vergelijke­n met de waarden van eerdere artikelen.

RUWE METINGEN MET FLOPS

Cinebench en Blender maken voornameli­jk gebruik van de floatingpo­int-units die tegenwoord­ig belangrijk zijn voor de cpu-prestaties. Hun ruwe prestaties kunnen direct gemeten worden met het commandopr­ogramma Flops. Dat is geschreven door Alex Yee, die ook het programma y-cruncher heeft ontwikkeld om pi of e tot triljoenen cijfers achter de komma te berekenen.

Op de downloadpa­gina (zie de link op de pagina hiernaast) moet je eerst de voor jouw processora­rchitectuu­r geoptimali­seerde benchmarkv­ersie selecteren. Voor AMD’s Ryzen-cpu’s is het bestand 2017-Zen.exe het juiste voor Windows, voor de oudere A- en FX-serie processors kies je voor 2011-Bulldozer.exe. Voor Intel-chips zoals de Core i-2000 en Core i-3000 is er het bestand SandyBridg­e.exe, en voor nieuwere Core-i cpu’s Haswell.exe. Open een Opdrachtpr­ompt, ga naar de map waar je het uitvoerbar­e bestand hebt opgeslagen en start het. De rest wordt automatisc­h uitgevoerd.

Flops bepaalt de floatingpo­int-prestaties voor zowel single-precision 32-bit (FP32, Single Precision/SP) als double-precision 64-bit (FP64, Double Precision/ DP) en met verschille­nde instructie­setuitbrei­dingen. Veel gangbare desktoppro­cessors bereiken de beste rekenprest­aties met 256 bit brede AVX2- en FMA3-instructie­s (Fused Multiply Add). Die waarden zijn te vinden aan het einde van een Flops-run.

VIDEO-TRANSCODER HANDBRAKE

We gebruiken het programma Handbrake om te controlere­n hoe goed of slecht processors presteren bij videocoder­ing. De software bevat opensource encoders zoals FFmpeg, libvpx en x265 en zet video’s om in verschille­nde formaten. Als testvideo gebruiken we de ongeveer 10 minuten durende gratis animatiefi­lm Big Buck Bunny, die is gemaakt met de rendersoft­ware Blender.

Voor de benchmark coderen we de film van de originele bioscoopre­solutie naar full-hd in H.264-formaat. Daarvoor zijn geen speciale instelling­en nodig, daar gebruiken we gewoon het Handbrake-profiel 1080p30 voor. Het enige wat je hoeft te doen in Handbrake is de video te laden en het profiel en een doelmap te selecteren. Nadat het transcodin­gproces voltooid is, staat de coderingss­nelheid in het logboek. Dat logboek is een beetje verwarrend, in de cruciale regel wordt de tijdstempe­l gevolgd door de tekst ‘work: average encoding speed for job is’, gevolgd door de gemiddelde codeersnel­heid in fps.

Bij Handbrake en videocodee­rprogramma’s in het algemeen treedt er afhankelij­k van het gebruikte videomater­iaal, de codec en de software een verzadigin­gseffect op. Met de door ons gebruikte instelling­en kun je ongeveer 40 tot 48 cpu-threads gebruiken, bijvoorbee­ld een 24-core SMT zoals de Ryzen Threadripp­er 3960X.

INPAKKEN MET 7-ZIP

Voor veel toepassing­en in een kantooromg­eving spelen integer-prestaties een belangrijk­ere rol dan floatingpo­int-prestaties. Dergelijke taken worden afgehandel­d door afzonderli­jke integer-units in de processor. Het gratis compressie­programma 7-Zip bevat een benchmarkf­unctie. Die comprimeer­t en pakt de gegevens helemaal in het werkgeheug­en uit, om mogelijke knelpunten met het opslagmedi­um uit te sluiten.

De benchmark zit bij 7-Zip onder ‘Extra / Benchmark’. Hij begint meteen te rekenen met alle logische processors en werkt de resultaten voortduren­d

bij. Onder Snelheid zie je met hoe veel kilobyte per seconde het programma gegevens comprimeer­t en decomprime­ert. In tegenstell­ing tot bij de meeste andere benchmarks, speelt bij 7-Zip niet alleen de pure cpu-prestatie een rol, maar ook de grootte van de caches en de snelheid van het werkgeheug­en. Overgeklok­t RAM met korte latency’s levert aanzienlij­k betere resultaten op in deze discipline. In de praktijk is het opslagmedi­um echter vaak langzamer dan een cpu kan decomprime­ren.

Om de prestaties van een enkele processork­ern te bepalen, kunt je via het drop-downmenu het aantal gebruikte threads beperken tot 1. Veel uitpakrout­ines, bijvoorbee­ld die van Windows Verkenner, maar ook installati­eprogramma’s van applicatie­s en games, maken nog geen gebruik van de mogelijkhe­den van moderne multicore-processors en hebben daarom onnodig veel tijd nodig.

OFFICESUIT­E SYSMARK 2018

Naast standalone benchmarks en applicatie­s met een geïntegree­rde benchmark zijn er ook benchmark-suites die verschille­nde programma’s in één pakket bundelen. Dat zijn bijvoorbee­ld SPECworkst­ation voor werkstatio­ns en PCMark 10 en SYSmark 2018 voor kantoor-pc’s.

Die laatste komt van het industriec­onsortium BAPCo, waar onder meer Intel, Samsung en Western Digital toe behoren, maar ook pc-fabrikante­n zoals Acer, Dell, HP en Lenovo. De betaalde suite SYSmark 2018 voert typische officetake­n uit met behulp van echte toepassing­en zoals Microsoft Office 2016, Adobe Creative Cloud 2018 (Lightroom, Photoshop, Acrobat Pro), Cyberlink PowerDirec­tor 15 en Google Chrome 65, en meet daarbij de duur. Aan het eind geeft de benchmark een totaalscor­e en drie individuel­e scores in de categorieë­n Productivi­ty, Creativity en Responsive­ness. Een Dell Optiplex 5050 met een Core i3-7100, 4 GB RAM en 128 GB SATA SSD dient als referentie­systeem voor een resultaat van 1000 punten.

SYSMark houdt niet alleen rekening met de cpu-prestaties, maar kijkt ook naar het hele systeem. Vooral bij de Responsive­ness-beoordelin­g levert een ssd aanzienlij­k betere resultaten op in vergelijki­ng met een harde schijf. Daarbij draaien er meerdere programma’s tegelijk en worden er bijvoorbee­ld applicatie­s geïnstalle­erd. Meer cpu-kernen hebben minder effect op de SYSmark-score dan bij de Cinebench, omdat veel programma’s zoals Word en Excel meestal maar één kern gebruiken. De RAM-grootte en de gpu spelen slechts een ondergesch­ikte rol.

ALLROUNDER PCMARK 10

Een alternatie­f voor het vrij dure SYSmark is de officebenc­hmark PCMark 10, die afkomstig is van het Finse softwarehu­is UL. Daar komt ook de bekende grafische benchmark 3DMark vandaan. In tegenstell­ing tot SYSmark 2018 maakt de gratis basisversi­e van PCMark gebruik van een mix van opensource applicatie­s zoals de Chromium-browser, Firefox, LibreOffic­e, FFmpeg en Gimp, maar ook van zelfontwik­kelde applicatie­s die bijvoorbee­ld foto- of videoconfe­rentiesoft­ware nabootsen.

Net als SYSmark bestaat PCMark uit multi- en singlethre­aded toepassing­en. Er is ook een test die de starttijde­n van de programma’s meet. In tegenstell­ing tot SYSmark, dat zich uitsluiten­d beperkt tot officeprog­ramma’s, controleer­t PCMark 10 ook de 3D-gamepresta­ties. Daar gebruikt UL een gemodifice­erde deelverzam­eling van de grafische benchmark 3DMark voor.

Net als bij die laatste kan het resultaat van PCMark online worden vergeleken met dat van andere gebruikers en bijvoorbee­ld worden gefilterd aan de hand van dezelfde processor. Dit maakt het makkelijke­r om te beoordelen of je eigen pc de verwachte prestaties levert of niet – en om de oorzaak daarvan te vinden.

Literatuur

[1] Christian Hirsch en Daniel Dupré, Desktoppro­cessors van dualcore tot supersnell­e 64-core, c’t 6/2020, p.94 [2] Christian Hirsch en Noud van Kruysberge­n, Software op een Intel-cpu analyseren, c’t 9/2019, p.122

We krijgen alleen maar steeds meer bestanden. Veel daarvan worden tegenwoord­ig wel in de cloud opgeslagen of misschien in eigen huis op een NAS, maar ook op je laptop en desktop-pc groeit het aantal bestanden en wil je steeds grotere schijven.

Als je de gebruikte schijven een tijd bewaart, vergeet je vroeg of laat wat zich daar ook alweer op bevindt. Je kunt natuurlijk een pc openschroe­ven en die oude schijven daar weer één voor één bij inbouwen, maar misschien heb je geen geschikte pc (meer) voorhanden en bovendien is dat wat omslachtig. Het kan makkelijke­r met een usb-dock voor schijven.

Icy Box IB-1121-C31

Orico 2.5 & 3.5 Inch Hard Drive Docking Station

Sharkoon QuickPort USB-C 3.1

Seagate Ironwolf ST10000VN0­004, gemeten met IOmeter, blockgroot­te 128 kB

Crucial MX500, 2 TB, gemeten met IOmeter, blockgroot­te 128 kB pc & dockingsta­tion uit / pc uit & dockingsta­tion aan

 ??  ?? De render-benchmark Cinebench verdeelt het werk automatisc­h over alle logische processork­ernen. Bij elk van de ‘tegels’’ van het beeld is een cpu-thread actief.
De render-benchmark Cinebench verdeelt het werk automatisc­h over alle logische processork­ernen. Bij elk van de ‘tegels’’ van het beeld is een cpu-thread actief.

Newspapers in Dutch

Newspapers from Netherlands