De juiste grafische kaart voor office-pc's en workstations
De juiste grafische processor voor kantoorcomputers en werkstations
De eenvoudige geïntegreerde grafische processor in cpu's is beter dan zijn reputatie: je kunt er een beeld met hoge resolutie op een of meerdere monitoren mee krijgen en moderne videoformaten mee decoderen. Voor werkstations gelden andere eisen, die alleen met dedicated grafische kaarten vervuld kunnen worden.
De tijden dat een grafische kaart voor een werkplek alleen het beeld op het scherm hoefde te verzorgen zijn allang voorbij. De erg uiteenlopende functies maken het kiezen van het juiste model een stuk lastiger. In dit artikel laten we zien wat er bij een kantoor-pc, werkstation en server op dit moment belangrijk is.
Op kantoor: geïntegreerde gpu of insteekkaart?
Bij kantoorcomputers domineren grafische processors die rechtstreeks in de cpu geïntegreerd zijn, zogeheten IGP's (Integrated Graphics Processor). Bij Intel zitten ze in alle mainstream desktop-cpu's, alleen in de multicore modellen van de HEDT-serie (High End DeskTop), die eigenlijk afstammen van de Xeon-familie voor servers, zit geen grafische processor. AMD stopt alleen in bepaalde, en dan met name de goedkopere productreeksen een grafische processor: de oudere A-modellen en de huidige Ryzen-G- en Athlon-GEprocessors. Dat in een kantoor-pc vaak de ingebouwde grafische processor gebruikt wordt, heeft goede redenen: die is goedkoop, stil en uitermate geschikt voor het dagelijks werk.
Die IGP's kunnen sowieso al veel: ze nemen bijvoorbeeld het klaarzetten van de grafische interface over van het besturingssysteem. Veel moderne browsers lijken ook een stuk sneller te zijn doordat ze de versnellingsfuncties van de gpu gebruiken.
Sinds de HD Graphics 4000-serie, die in de processors van de Core i-4000generatie (Haswell) zit, kunnen Intels geintegreerde gpu's 4K (3840 × 2160 pixels) weergeven op een oogvriendelijke 60 Hz. Bij AMD kan dat sinds de APU's van de Ax 7000-familie (Kaveri). Voorwaarde bij beide: het moederbord moet een DisplayPort-aansluiting hebben van de generatie 1.2 of een HDMI 2.0-uitgang. Die laatste zit op moederborden voor AMD's Ryzen-gpu's, bij Intel zijn ze nog zeld-
zaam omdat ook de huidige Intel-iGPU's HDMI 2.0 nog niet ondersteunen. Daarom moeten de fabrikanten een extra chip op het moederbord solderen. Meer dan een 4K-resolutie halen de geïntegreerde grafische units momenteel niet.
Een gpu kan bovendien de cpu ontlasten bij het afspelen van video's door de datastroom te decoderen. Oudere compressiemethoden als DivX, H.264 en Microsofts VC-1 behoren al lang tot de basisuitrusting. Veeleisender formaten als H.265 en VP9 vergen nieuwere hardware. Bij AMD kunnen APU's die formaten ontsleutelen sinds Carrizo en Bristol Ridge voor socket FM2+ en AM4. Intel heeft die mogelijkheden ingebouwd sinds de Skylake-generatie (Core i-6000). Zelfs de goedkope Gemini-Lake-modellen van de Atom-familie (Celeron N4100), die je bij de extreem goedkope complete pc's tegenkomt, hebben mogelijkheden voor 4K en video [1]. De huidige favorieten qua prijsprestatieverhouding voor onder de 80 euro zijn bij AMD de goedkope Athlon 200 GE en bij Intel de Pentium Gold G5400 – beide instapprocessors hebben twee echte en twee logische cpu-kernen en bieden wat gpu betreft alles wat je voor op kantoor nodig hebt.
Als je de grafische mogelijkheden van je anderszins prima werkende werkplekpc wilt opwaarderen of meer aansluitingen nodig hebt, dan kun je een grafische kaart toevoegen. Een goede en zuinige allrounder voor op kantoor blijft de Nvidia GeForce GT 1030 [2]. Die is in een passief gekoelde en daardoor stille versie al te koop voor 75 euro. De GT 1030 kan overweg met alle huidige videocodecs. De nieuwe licentievrije codec AV1, die als opvolger van VP9 en als concurrent voor H.265/EVC gepositioneerd wordt, kan daarentegen nog door geen enkele beschikbare grafische kaart hardwarematig afgespeeld worden. Dat zal waarschijnlijk pas gaan lukken met gpu's die vanaf 2020 gaan verschijnen.
De meeste fabrikanten geven DVI en HDMI 2.0 mee aan hun GeForce GT 1030. Omdat DisplayPort 1.3 naar ons idee beter op de toekomst voorbereid is, adviseren we om een kaart met die uitgang te kopen. Daar kun je met slechts één kabel een 5K-signaal op 60 Hz mee doorgeven. Maar pas op: sommige oudere 5K-displays kunnen hun beeldsignalen alleen via twee parallel aangesloten DisplayPort-ingangen ontvangen. En die zitten er niet op budgetkaarten. Of er DDR4- of het snellere GDDR5-geheugen wordt gebruikt, is voor office-gebruik niet relevant.
Als je drie signaaluitgangen nodig hebt, kun je AMD's Radeon RX 550 overwegen. Die levert bij verder gelijke mogelijkheden meer 3D-performance, maar verbruikt ook meer energie. Een stille, passief gekoelde versie is daar niet van.
Werkstation: renderen, rekenen en retoucheren
AMD en Nvidia hebben speciale kaarten voor professioneel gebruik, die bij de een Radeon Pro WX en bij de andere Quadro heten. De op dit moment beschikbare modellen kosten bij AMD tussen de 110 en ongeveer 1800 euro en bij Nvidia tussen de 120 en meer dan 10.000 euro. De toepassingen daarvan zijn professionele 10-bit fotobewerking, industrieel design met CAD en complexe berekeningen. Het bijzondere aan dergelijke werkstationkaarten zijn hun drivers: die zijn gecertificeerd voor bepaalde toepassingen, bijvoorbeeld AutoCAD, Solidworks, Siemens NX en PTC Creo. Daardoor presteren de professionele modellen bij die toepassingen beter dan hun consumentenvarianten. Dat is dan met name te zien bij het weergeven van vectormodellen. Programma's als Pathtracer Luxmark en professionele video-encoders, die puur van de shader-performance afhangen, hebben overigens geen dure kaart nodig – daar kan ook een goedkoper model uit het thuisgebruikersassortiment goed genoeg voor zijn. Het hangt van de software af welke kaart je moet kopen.
De professionele kaarten werken in principe allemaal met dezelfde Vega-, Polaris- of Pascal-architectuur als hun gaming-varianten. Ze hebben ook dezelfde video-encoders en -decoders, die met alle huidige formaten overweg kunnen en content kunnen weergeven met 10bit kleurdiepte en hoog contrast (HDR). Bovendien hebben ze moderne DisplayPort 1.4-aansluitingen. De Quadro's hebben wel een ander aantal shader-units – in tegenstelling tot bij AMD, waar elke Radeon Pro WX ook een Radeon RXtegenpool heeft.
Bij de prijsprestatieverhouding heeft AMD op het eerste gezicht bij de gehele productielijn een streepje voor. Dat is wel bijzonder extreem bij de Quadrotopmodellen, die het dubbele kosten van een Radeon Pro die dezelfde technische specificaties heeft. Daarbij leveren de AMD-kaarten een hogere theoretische rekenkracht – en zeker bij double-
precision (FP64), want Nvidia beperkt de FP64-performance om de afstand tot de topmodellen van de Quadro-, Titan- en Tesla-familie groot te houden.
Bij OpenCL-toepassingen spelen de AMD-kaarten dat voordeel vaak uit. Bovendien kunnen ze anders dan Nvidia's Pascal-kaarten parallelle grafische versnelling en berekeningen uitvoeren. Bij CAD-programma's laat Nvidia in de praktijk echter meer performance zien, zoals de werkstation-benchmark SPEC Viewperf toont. Die performancevoorsprong wil men met de nieuwe Quadro RTX-modellen van de Turing-generatie vergroten, onder meer door het gebruik van tensorcores en units voor raytracing-versnelling. Die nieuwe kaarten gaan daarbij echter tot 10.000 euro kosten, zoals de Quadro RTX 8000 met 48 GB GDDR6-RAM. Die levert met zijn shader-units wel 16 TFlops en moet bij raytracing 10 Gigarays per seconde kunnen halen.
Ook aan de softwarekant heeft Nvidia een troef in petto: de propriëtaire programmeerinterface (API) CUDA voor complexe berekeningen op de gpu. Als je eigen applicaties ontwikkelt, heb je bij Nvidia de betere tool en veel meer documentatie dan bij AMD. Bovendien heeft Nvidia veel in ontwikkelaarsrelaties geinvesteerd. AMD gaat met OpenCL dan wel voor een open API, maar ondersteunt ontwikkelaars daar niet zo goed bij als Nividia bij CUDA. Nvidia biedt bijvoorbeeld veel zwaar geoptimaliseerde bibliotheken, zodat je meteen aan de slag kunt, terwijl daar bij OpenCL in sommige gevallen helemaal niets voor is – je moet dan echt vanaf nul beginnen.
De kleinste modellen van de professionele productfamilies kunnen beelden al met 10 bit per kleurkanaal weergeven en daarmee bijzonder fijne kleurverlopen laten zien. Die zijn ook geschikt voor kleurechte fotobewerking op kalibreerbare 10-bit monitoren of medische imaging-technieken.
De Radeon Pro WX 4100 (280 euro), WX 5100 (425 euro) en de Quadro P2000 (475 euro) bevinden zich bijvoorbeeld in dezelfde performanceklasse, met een licht voordeel voor AMD. Bij CAD-benchmarks haalt de Nvidia-kaart echter hetzelfde niveau als de duurdere AMD Radeon Pro WX 7100 (650 euro), en beide blijven nog wat achter bij de Quadro P4000 (880 euro).
Bij de duurdere modellen stijgt niet alleen de prijs, maar ook de grootte van het geheugen. De Radeon Pro WX 8200 (1100 euro) heeft nog 8 GB, maar de Quadro P5000 (1850 euro) en de Radeon Pro WX 9100 (1890 euro) hebben 16 GB RAM en de P6000 (5000 euro) heeft 24 GB. Daardoor zijn die topmodellen in combinatie met hun hoge rekenkracht dan ook met name bedoeld voor grote datahoeveelheden. Een andere bijzonderheid: ze kunnen alle vier geheugenfouten met behulp van ECC ontdekken en corrigeren.
De meer dan 10.000 euro kostende Quadro GV100 heeft zelfs 32 GB HBM2geheugen en gebruikt al de recente Volta-architectuur plus tensor-cores. Die halen tot 118,5 TFlops en versnellen sterk AI-toepassingen en machine-learning. Bovendien halveert hun performance slechts bij het berekenen in doubleprecision (FP64) ten opzichte van singleprecision, van 14,8 naar 7,4 GFlops. De GeForce- en de kleinere Quadro-kaarten komen bij FP64 maar tot een tweeëndertigste van hun FP32-rekenkracht.
Rekencentra: rekenen en leren
Bij grafische en versneller-kaarten voor serverdoeleinden is het concrete doel nog belangrijker dan bij werkstations. De eisen zijn uitermate verschillend. Een algemeen advies is dan ook nauwelijks te formuleren. Complexe berekeningen voor weersystemen hebben bijvoorbeeld een hoge FP64-performance nodig, zoals de 9000 euro kostende Tesla V100 van Nvidia die levert. Op papier is die met 14 GFlops via shaders en een tensor-performance van 112 TFlops wat langzamer dan de in verhouding wat duurdere Quadro GV100 met dezelfde gpu. Dat je hier met een grafische kaart te maken hebt, kun je aan de buitenkant niet zien – de Tesla V100 heeft als pure versnellerkaart dan ook geen signaaluitgangen.
Machine-learning heeft daarentegen niet per se een dure kaart nodig. Voor veel toepassingen volstaat al een lagere nauwkeurigheid zoals FP16 – en dan ziet het er voor AMD goed uit, want de rekenkracht verdubbelt zich ten opzichte van FP32. Dan blijft voor AMD echter nog wel het probleem bestaan dat de meeste machine-learning-toepassingen CUDA gebruiken, zodat AMD's performancevoordeel dan theoretisch blijft.
Bij Nvidia's Quadro's van de Pascalgeneratie speelt een dergelijk snelheidsvoordeel echter niet, maar wel bij de Volta-kaarten Quadro GV100 en Titan V, en de modellen van de nieuwe series Quadro en GeForce RTX 2000. Die laatste zijn altijd nog goedkoper dan Titans en Tesla's. Nvidia's gebruiksvoorwaarden verbieden echter het gebruik van GeForce- en Titan-kaarten bij rekencentra – dat geldt overigens ook voor aanbieders van gamestreamingdiensten.
Conclusie
Voordat je een nieuwe grafische kaart uitzoekt, moeten de eisen duidelijk zijn. De software bepaalt welke hardware er überhaupt in aanmerking kan komen.
Als je alleen teksten moet typen, wat op internet rondsurft en een paar video's kijkt, kun je prima volstaan met een gemiddelde IGP. Een werkstationkaart, die veel moet rekenen en renderen, heeft veel shader-units nodig – maar ook toepassingen die met de API werken die de voorkeur heeft van de gpu-fabrikant. Wat dat betreft heeft Nvidia met CUDA een duidelijk voordeel. Op servergebied geldt dat des te meer. AMD biedt een betere prijsprestatieverhouding, maar alleen als je met OpenCL werkt of de shader-units zinvol kunt inzetten. (nkr)