C’t Magazine

Grafische kaarten met GeForce RTX 2080 en RTX 2080 Ti

Zes grafische kaarten met Nvidia's topmodelle­n GeForce RTX 2080 en RTX 2080 Ti

- Benjamin Kraft

De nieuwe Turing-gpu's laten je vloeiend gamen in 4K en verbruiken minder energie dan hun voorganger­s. Fabrikante­n als Asus, MSI en Zotac leggen elk de nadruk op een ander aspect. Maar niet alle nieuwe toeters en bellen zijn nu al bruikbaar.

Sinds eind september zijn de GeForce RTX 2080 en RTX 2080 Ti verkrijgba­ar. Beide gpu's zijn gericht op het high-end segment en moeten games zelfs in 4K (oftewel 3840 × 2160 pixels) soepel weergeven. De Ti kan dat zelfs op het hoogste detailnive­au en met ingeschake­lde antialiasi­ng. We hebben zes grafische kaarten met een Turing-chip eens nader aan de tand gevoeld. Vier daarvan zijn voorzien van het 2080 Ti-topmodel.

Ze zijn allemaal behoorlijk aan de prijs: de goedkoopst­e kaart in de test, de MSI, kost op het moment van schrijven nog altijd zo'n 860 euro. Dan komt de Gainward GeForce RTX 2080 Phoenix GS met een prijs van 950 euro, en die wordt op 5 euro na gevolgd door de Zotac Gaming GeForce RTX 2080 Amp Edition. Daarna kom je dan al boven de 1000 euro uit: de Asus ROG Strix RTX 2080 OC zit op ongeveer 1050 euro, de Gigabyte GeForce RTX 2080 Ti Gaming OC 11G kost 1300 euro en de duurste uit de test is de Asus ROG Strix GeForce RTX 2080 Ti OC van 1400 euro. De kaarten zijn inmiddels redelijk goed verkrijgba­ar.

Turing

Het kloppend hart van de GeForce RTX 2080 is de Turing TU104 met zijn 2944 shader-cores. Zoals alle Turing-kaarten bevat die twee nieuwe typen executionu­nits: 46 zogenaamde RT-cores voor zeer realistisc­he raytracing-effecten in games, en 368 Tensor-cores die je nog kent van de Volta-generatie. Ze zijn geschikt voor machine-learning en andere toepassing­en op het gebied van kunstmatig­e intelligen­tie. 8 GB aan GDDR6-geheugen is verbonden met een 256-bit geheugenin­terface. Dat zorgt voor een datasnelhe­id van 448 GB/s.

In het GeForce RTX 2080 Ti-topmodel zit een TU102 met een chipopperv­lakte van 754 mm2. De TU102 heeft 4352 shader-units, 68 RT-cores en 544 Tensorcore­s. De 11 GB aan GDDR6-geheugen is

verbonden via 352 datalijnen, waarmee de data dan met 616 GB/s worden doorgestuu­rd.

Beide gpu's ondersteun­en behalve Direct3D feature-level 12_1 ook de interfaces Vulkan 1.1.78, OpenGL 4.6 en OpenCL 1.2. Nvidia vindt OpenCL 2.0 nog te experiment­eel.

Aansluitin­gen en mogelijkhe­den

Alle Turing-kaarten beschikken over vijf displayaan­sluitingen. Gainward, Gigabyte, MSI en Zotac stoppen een HDMI 2.0b-poort in het afdekplaat­je, waarmee je een 4K-monitor op 60 Hz kunt aansturen. Die kan daarnaast met HDRcontent overweg. Dat kun je met de drie DisplayPor­t-aansluitin­gen (1.4a) ook voor elkaar krijgen. Die kunnen via een enkele kabel een 8K-scherm met 7680 × 4320 pixels op 60 Hz aansturen, bij een tweede (sowieso zeer zeldzaam) scherm houdt het dan echter op. Asus varieert wat met de aansluitin­gen en wisselt de derde DisplayPor­t-aansluitin­g om voor een tweede HDMI-poort.

De kaarten beschikken allemaal over een USB-C-poort, die Nvidia tovoegt om daar via VirtualLin­k een VR-headset op aan te sluiten. Hij geeft niet alleen een DisplayPor­t 1.4-signaal door, maar ook tot aan 27 watt aan energie. De aansluitin­g is ook geschikt als pure datapoort. Bij de test haalde een PCIe-ssd in een externe behuizing 1 GB/s aan lees- en schrijfsne­lheid.

Push it to the limit

Nvidia heeft de GeForce RTX 2080 een standaard kloksnelhe­id van 1515 MHz gegeven en een boost tot 1710 MHz, de RTX 2080 Ti draait daarentege­n standaard op 1350 MHz, waarbij de boost tot maximaal 1545 MHz komt. Om het nog wat verwarrend te maken, draait de Founders Edition van de kaart, die Nvidia zelf aanbiedt, met de boost 90 MHz sneller omdat deze standaard al overgeklok­t is. Dat is wel vreemd voor een zogenaamde 'referentie­kaart'. Dit maakt het voor andere fabrikante­n erg lastig om met hun topmodelle­n boven de Founders Edition van Nvidia uit te komen.

De boostsnelh­eid van de meeste kaarten (standaard turbo) ligt net een paar MHz boven die van de Founders Edition. Gainward heeft er bij zijn RTX 2080 15 MHz bovenop weten te krijgen, Zotac 30 MHz. Als je meer wilt, moet je dat blijkbaar via software regelen. Asus en Gigabyte bouwen daarom OC-profielen in hun GPU Tweak II en Gigabyte Aorus Engine in.

Dat kun je zelf echter ook voor elkaar krijgen. In de nieuwste driver zit namelijk een interface met de naam OC Scanner, waarmee je – mits je de juiste software gebruikt – automatisc­h de maximale stabiele snelheid kunt bepalen. Tools als MSI's Afterburne­r en EVGA's Precision X1 hebben de benodigde opties standaard. Dat is wel handig, maar een meetbare of merkbare verbeterin­g merk je daarbij niet echt. De standaard kloksnelhe­id is immers al behoorlijk hoog.

Performanc­e

Net als bij de eerdere exemplaren bieden de nieuwe kaarten evenveel performanc­e als hun voorganger uit de serie daarvoor met een stapje hoger qua modelnumme­r. De 3D-performanc­e van de GeForce RTX 2080 (maakt niet uit welke uitvoering) ligt afhankelij­k van het spel op het niveau van een GeForce GTX 1080 Ti of net daarboven.

Als vergelijke­nde kaart hebben we de Asus ROG Strix 1080 Ti Gaming OC gebruikt, met de standaard turbo. Met de DirectX 11-games GTA V en Far Cry 5 waren de nieuwe kaarten 3 tot 10 procent sneller. Bij de DirectX 12-titel Shadow of the Tomb Raider lag de winst op maximaal 3 procent. Reken je dat om naar frames per seconde (fps), dan komt dat in het beste geval neer op 9 fps, maar meestal slechts 2 of 3.

De synthetisc­he benchmarks geven een wat betere kijk op de verschille­n tussen de opeenvolge­nde generaties. De GeForce GTX 1080 Ti ligt bij de DirectX11-test Firestrike Extreme (uit de 3DMark-suite) zo'n 9 procent voor, terwijl bij de DirectX12-test Time Spy de RTX 2080 net geen 6 procent voorsprong heeft. Dat laatste laat zien dat Nvidia de context-switching (oftewel het wisselen tussen grafische berekening­en en ander rekenwerk) inmiddels beter voor elkaar heeft.

De scene LuxBall HDR uit de pathtracer Luxmark 3.1 rendert een RTX 2080 circa 72 procent sneller dan de GTX 1080 Ti. Daarbij komen niet eens RT-cores om de hoek kijken, want daar kan Luxmark nog niet mee overweg.

De GeForce RTX 2080 Ti haalt op zijn beurt nieuwe benchmarkr­ecords en stuurt bij games tussen de 16 en 30 fps meer richting het scherm dan de RTX 2080. Dat zorgt ervoor dat hij een ideale kandidaat is om te combineren met een scherm met GSync-techniek, dat refreshrat­es tot 144 Hz aankan. Zelfs met 4K haalt hij op het hoogste detailnive­au en met SMAA-antialiasi­ng gemiddeld de 60 fps die nodig zijn om games soepel te laten draaien. Bij Luxmark heeft het nieuwe topmodel een ruime 42 procent voorsprong op de RTX 2080.

Bij het minen van de digitale munt Ethereum met de miner Claymore-Dual 11.9 haalde de GeForce GTX 1080 Ti van Asus 24,4 Mhash/s bij een energiever­bruik van 195 watt. De RTX 2080 van Gainward haalde 36,6 Mhash/s bij 166 watt, en de RTX 2080 Ti harkte de munten met 58,8 Mhash/s binnen – maar had daar wel 278 watt voor nodig. Bij de Turing-kaarten was het geheugen overgeklok­t tot 8000 MHz, bij de GTX 1080 Ti tot 5700 MHz.

De conclusie is dan ook dat minen met een Turing-kaart niet lonend is. Zelfs met de gestegen performanc­e bij de RTX-kaarten is de dalende prijs van Ethereum niet op te vangen.

NVLink en SLI

Ben je in het gelukkige bezit van twee stuks GeForce RTX 2080- of RTX 2080 Ti -kaarten, dan zijn die via SLI (Scalable Link Interface) aan elkaar te koppelen. Voor de verbinding wordt NVLInk van de tweede generatie gebruikt. Daar heb je dan wel een NVLink-bridge à 85 euro voor nodig.

Afhankelij­k van de game of het programma merk je goed dat je een extra gpu hebt. Een setje 2080-kaarten haalde in Luxball HDR in Luxmark 3.1 meer dan 60.500 Rays/s, twee keer zoveel als met een enkele kaart. Bij 3DMark Time Spy liep de score op van 10.300 naar 17.200 punten. GTA V haalde met 4K 92 fps in plaats van 56, Far Cry 5 ging van 60 naar 82 en Shadow of the Tomb Raider ging van 47 naar 84 fps.

Bij lagere resoluties maakt het eigenlijk weinig tot niets uit dat je meer

renderpowe­r tot je beschikkin­g hebt, de cpu is dan immers de beperkende factor. Assassin's Creed: Origins had in dat geval zelfs last van een mindere performanc­e. Bij full-hd zakte de framerate in van 92 naar 72 fps. Of de groei in performanc­e in verhouding is met de meerprijs, waarbij je behalve naar de aanschafko­sten natuurlijk ook naar het energiever­bruik moet kijken, moet je zelf bepalen. Maar feit is wel dat bij veel games een dualgpu set-up ook voor veel problemen (geen tot slechte ondersteun­ing) kan zorgen. Het is dan vaak slimmer en betaalbaar­der om een enkele snellere kaart te kopen.

Raytracing en DLSS

Nvidia presenteer­de bij de introducti­e van de nieuwe Turing-gpu's een lijst met games die gebruik kunnen maken van raytracing. Die games zijn nog niet uit of hebben patches nodig om ondersteun­ing te bieden. Een ander vereiste is door Microsoft al ingewillig­d: de DirectX Raytracing-interface is beschikbaa­r gemaakt. Die maakt deel uit van de Windows 10-versie Redstone 5, waarvan de uitrol op het moment dat je dit leest alsnog – zij het vertraagd – op gang moet zijn gekomen.

Een ander nieuwighei­dje is de nieuwe antialiasi­ng-optie DLSS oftewel Deep Learning SuperSampl­ing. Die moet ook in het spel zitten. Het idee erachter klinkt heel spannend: een rekenclust­er analyseert de game en ontwikkelt doorlopend een algoritme dat scènes en losse stills analyseert en ze er zo smooth mogelijk uit laat zien. Dat wordt geregeld via de driver, vermoedeli­jk via de GeForce Experience, en via de Tensor-cores losgelaten op de scènes. Nvidia belooft dat daar mee een beeldkwali­teit is te halen die gelijk is aan 64-voudige TXAA (Temporal Anti Aliasing) met een duidelijk veel betere performanc­e. Later moet er nog een generieke versie komen die ook games zonder ingebouwde DLSS mooier kan maken.

Tot nu toe zijn er slechts twee speciaal door Nvidia aangepaste demo's waarbij je DLSS kunt inschakele­n. Dat zijn de Infiltrato­r-demo van Epic, die is gebaseerd op Unreal Engine 4, en de demo van Final Fantasy XV voor het Windowspla­tform. We kregen voor beide een geheimhoud­ingsoveree­nkomst onder onze neus geschoven, maar die hebben we niet onderteken­d, dus we hebben geen eigen indruk van de performanc­e kunnen krijgen. Dat proberen we alsnog te regelen zodra er titels met een DLSS-optie te koop zijn.

Leren met Turing

Machine-learning is met de juiste toolkit nu al bruikbaar. Nvidia belooft dat de Tensor-cores vergeleken met de voorganger­s van de Volta-generatie efficiente­r zijn. Dat testten we al bij de Titan V met de DeepBench van de Chinese zoekmachin­e Baidu. Die compileerd­en we voor de Turing-kaarten opnieuw met ARCH=sm_75. De metingen van de Turingen Pascal-kaarten werden uitgevoerd met Ubuntu Linux 18.04.1 met een Intel Core i7-6900K met acht kernen en 32 GB RAM. Daarbij werden zowel CUDA 10 als CuDNN 7.3 gebruikt. De resultaten van de Titan V hadden we nog liggen uit een eerdere test.

De GeForce RTX 2080 is de GTX 1080 Ti te snel af als het gaat om berekening­en met minifloats. Voor de trainingsb­enchmark 'gemm_bench train half' had de Pascal-kaart 60 keer zo lang nodig, en voor de inference-benchmark circa 32 keer zoveel tijd. Bij de convolutie­s (conv) zagen we net zulke grote verschille­n. Daar duurde de trainingen met Pascal ongeveer 30 keer zo lang als die met Turing, het toepassen zelfs 51 keer zo lang. Dat ligt vooral aan het feit dat Nvidia de FP16-performanc­e van de Pascal-kaarten beperkt heeft. Bij single precision (float) lag dan weer de ene en dan weer de andere kaart zo'n 8 à 10 procent voor.

Vergeleken met de Titan V zien we daar ook een gemengd beeld. De Voltakaart haalde tussen de 25 en 27 procent meer GEMM-floats, maar de GeForce RTX 2080 was 38 procent sneller bij convolutie­tests met FP32 en 32 procent sneller met int8.

De GeForce RTX 2080 Ti overklast de Volta nogal en haalt tussen de 6 en 55 procent meer dan de Titan V. De interTurin­g-vergelijki­ng is weer in het voordeel van de Ti met een vergelijkb­aar verschil, alleen bij conv_bench train float, conv_bench train half en conv_bench interferen­ce float doet de kleinere kaart het tussen de 5 en 25 procent beter.

 ??  ??
 ??  ??

Newspapers in Dutch

Newspapers from Netherlands