Achterliggendetechnieken
De nieuwe PlayStation 5 en Xbox Series X/S spelcomputers lopen de technische achterstand op gaming-pc’s niet alleen in, ze lopen ze op sommige gebieden zelfs voorbij. Sony en Microsoft hebben daar speciale hardware voor ontwikkeld.
Zelden is de wapenwedloop voor de beste gameconsole spannender geweest: Sony en Microsoft hebben in november 2020 nieuwe versies van hun PlayStation en Xbox gelanceerd, die niet alleen bedoeld zijn om de enorme innovatie van gaming-pc’s in de afgelopen jaren in te halen. Aangezien de kostenmarges voor een console in tegenstelling tot bij een zelfgemaakte pc redelijk vaststaan, kunnen niet alle trends zoals een enorm aantal raytracing-units worden ingebouwd. In plaats daarvan gaat het om meer comfort voor de gamers, niet alleen om steeds betere graphics.
Hoezeer de druk door de krachtige gaming-pc’s was toegenomen, bleek al uit het feit dat de vorige consolegeneratie – dat wil zeggen de PlayStation
Hoewel in beide consoles Zen 2-kernen en RDNA 2-gpu’s zijn ingebouwd, zijn er nog steeds grote verschillen. We kijken in dit artikel voornamelijk naar de ongeveer even dure consoles PlayStation 5 (PS5) en Xbox Series X (XSX), die beide 500 euro kosten. Er bestaan van beide goedkopere versies, maar die zijn in verschillende mate afgeslankt. In de PlayStation 5 Digital Edition (400 euro) ontbreekt een optische schijf, zodat spellen uitsluitend digitaal kunnen en moeten worden gekocht. De Xbox Series S (300 euro, XSS) – ook zonder optische drive – heeft bovendien veel lagere grafische prestaties.
CPU-FAMILIE
Beide console-ontwerpen maken gebruik van acht Zen 2-kernen, zoals AMD die in 2019 introduceerde bij de Ryzen 3000-serie voor pc’s. De kloksnelheden gaan tot 3,8 GHz voor de XSX en 3,5 GHz voor de PS5. Alleen Microsoft heeft meer onthuld over het ontwerp van de cpu, van Sony is er alleen de genoemde informatie over het aantal kernen en de kloksnelheid bekend (zie ook de tabel op de laatste pagina van dit artikel). Het cpu-gedeelte van de PlayStation-processor zal echter niet significant verschillen van dat van de Xbox-chip, zeker niet gezien het modulaire ontwerpprincipe.
De Xbox-processor bevat twee cpu-clusters, elk met vier kernen en een gemeenschappelijke L3-cache. Die is slechts 4 MB groot, terwijl de desktop-Ryzens een stevige 16 MB per cluster hebben. De cachegroottes wijzen op een variant van de laptop-APU’s met de codenaam Renoir. Deze zijn sinds het begin van 2020 op de laptopmarkt geïntroduceerd in de Ryzen 4000 en hebben ook Zen 2-kernen met 4 MB L3-cache per cluster. Bij desktop-pc’s is momenteel de overstap naar Ryzen 5000 met een herziene Zen 3-architectuur actueel.
De reden voor het verkleinen van de L3-cache was waarschijnlijk de grootte van de dies. Caches zijn opgebouwd uit cellen met statisch RAM (SRAM), die zelfs met het gebruikte 7-nanometer proces van TSMC nog veel ruimte in beslag nemen. De die-oppervlakte wordt liever gebruikt voor een zo groot mogelijke gpu. Net als bij een laptop-Ryzen is er niet zoveel cache nodig om andere aspecten te compenseren. De consoles hebben geen uit verschillende chiplets samengestelde processor met hoge latenties voor de chip-to-chip-communicatie, maar een monolithische System-on-Chip (SoC). Daarbinnen vindt de communicatie tussen de cpu-clusters plaats, en worden ook alle andere eenheden van de chip met elkaar verbonden.
Microsoft is nog niet in detail getreden over het energiebeheer van de cpu, maar Sony wel. De kernen en ook de gpu werken volgens Sony voortdurend in een boost-modus, die niet alleen afhankelijk is van de temperaturen. In plaats daarvan is er een bewaking van de belasting van de afzonderlijke eenheden plus de SmartShift-technologie van AMD, die de energie tussen de cpu en gpu dynamisch kan verdelen. Dit volgt de ‘Leave no watt unused’ benadering zoals die al een decennium lang bekend is bij pc-gpu’s. De frequenties en spanningen worden constant dynamisch ingesteld, de beperkende factor is de vermogenslimiet en niet alleen de warmte.
Met de Zen 2-kernen maken beide consoles een grote prestatiesprong. De PlayStation 4 en Xbox One gebruiken Jaguar-processorkernen – ook bij de gemoderniseerde tussentijdse updates PlayStation 4 Pro en Xbox One X. AMD heeft die onder andere ontworpen voor tablets. Ze zijn conceptueel gezien de tegenhangers van Intels slome Atom-cpu’s. Naast vele andere verbeteringen bij Zen 2 zijn er nu onder andere vier ALU’s (rekenunits) per kern in plaats van twee zoals bij de Jaguar en sterk uitgebreide registers voor zowel integer- als floatingpoint-operaties. Alle verbeteringen zorgen ervoor dat programmeurs zich veel meer kunnen oriënteren op pc-code. Ze hoeven niet langer rekening te houden met de eerdere beperkingen van console-cpu’s zoals bij caches en instructies per kloktik (IPC). Bovendien zijn de SoC’s nu in staat om alle moderne instructiesetuitbreidingen tot en met AVX2 met 256-bit loads te verwerken.
GRAFISCH DEBUUT
Bij de PS5, XSX en XSS maken de RDNA 2-gpu’s hun debuut, die AMD zelf nog maar net aanbiedt als grafische kaart voor pc’s in de vorm van de Radeon RX 6000-serie. De vorige consoles waren gebaseerd op de nu sterk verouderde GCN-architectuur, die al was ingehaald door RDNA-1 oftewel Navi. AMD ging voorheen voor veel vectorunits met smalle datatypes, maar nu zijn er brede rekenunits en een tot L0 opgewaardeerd cachesysteem om benaderingen te bufferen.
Bij de vorige consoles bestonden de afzonderlijke clusters, ook wel Compute Units (CU) genoemd, elk uit vier vectoreenheden met SIMD-16-datatypen en vier Texture Mapping Units (TMU). Daar
naast waren er eenheden die dienden als decoder en commandoprocessor, evenals een 256 kB grote cache. Bij RDNA werden twee CU’s gecombineerd, met elk twee SIMD-32-units, vier TMU’s, twee decoder/commandoprocessors en een gezamenlijke 256kB-cache. Bij RDNA-2 komt daar nog een buffer bij genaamd Infinity Cache, die de dual-CU’s met elkaar verbindt. Dat stelt beide fabrikanten in staat om relatief goedkoop GDDR6-geheugen te gebruiken. Sony vertrouwt op een 256-bit bus, Microsoft kiest een 320-bit breedte. Ter vergelijking: Nvidia’s huidige RTX 3000-kaarten gebruiken GDDR6X met een 384-bit breedte. In het recente verleden hebben grafische pc-kaarten soms ook duur HBM-geheugen gebruikt. Voor consoles, die als compleet systeem minder kosten dan sommige losse high-end grafische kaarten, zijn dergelijke geheugentypes niet realistisch.
LICHTSTRALEN
Bij RDNA-2 is er voor het eerst in een AMD-gpu ook een speciale unit voor raytracing, en wel twee per dual-CU. Zowel Sony als Microsoft hebben verklaard dat de prestaties van deze Ray Accelerators (RA) en de CU’s samen niet genoeg zijn om spelscènes volledig door middel van raytracing te creëren of om daarmee een globale belichting te realiseren. Volgens Microsoft nemen de raytracing-prestaties met de RA’s afhankelijk van de toepassing echter toe met een factor 3 tot 10.
Bij het vergelijken van gpu’s – niet alleen die van PS5 en XSX – wordt vaak gebruik gemaakt van het aantal shaderkernen. Met 3328 shaders komt de Xbox Series X tot 52 CU’s, de PlayStation 5 met slechts 2304 shaders tot 36 CU’s. De gpu van de PlayStation kan door middel van een boost tot maximaal 2,23 GHz gaan, de Xbox blijft op de vaste 1825
MHz. Zelfs dan levert dit een nog steeds een voorsprong op voor de XSX van 12,15 tegen 10,28 Tflops. De goedkopere XSS haalt in het gunstigste geval overigens 4 Tflops, dus slechts een derde. Volgens Sony versnelt een hogere kloksnelheid ook de toegang tot het front-end en de fixed-function-units, evenals de interne geheugentoegang.
Wat in de praktijk meer gaat opleveren, moeten we nog afwachten. De grotere gpu geeft Microsoft meer flexibiliteit, ook voor andere toepassingen dan pure grafische berekeningen. De gpu’s moeten nu ook bijdragen leveren voor de AI, bijvoorbeeld voor tegenstanders, en voor andere rekenintensieve onderdelen. Maar ook de reeds genoemde energieverdeling via SmartShift speelt een rol. Het is mogelijk dat Sony de cpu hoger laat klokken bij een onderbenutte gpu, wat op zijn beurt het kleine kloknadeel van de Zen 2-kernen op de PS5 kan compenseren. Sony heeft dus meer flexibiliteit in de verdeling van de rekenkracht tussen cpu en gpu.
Voor beide fabrikanten blijft echter het probleem bestaan wat Microsoft al heeft geformuleerd bij de ondertussen gangbare 4K-tv’s en aankomende 8K-displays: hoe stuur je met maximaal zes keer het gpu-vermogen tien keer zoveel pixels aan in vergelijking met de voorgangers? Voor beide fabrikanten is de oplossing: trucs. Methoden zoals variabele refreshrates (VRR, momenteel alleen bij de XSX/XSS) en Variable Rate Shading staan op de agenda. Die laatste techniek is bedoeld om veel verder te gaan dan de soms lelijke artefacten producerende checkerboard-rendering van de laatste generatie, door gebruik te maken van meerdere resoluties waarin verschillende delen van een scène worden weergegeven. Verschillen op de grenzen hiervan moeten door nieuwe filters niet langer merkbaar zijn. Dat alles bespaart geheugen en rekenkracht, wat resulteert in hogere prestaties.
GLOEDNIEUWE HDMI
De nieuwe consoles zijn nu ook qua interface upto-date: HDMI 2.1 is beschikbaar met maximaal 120 hertz voor 4K en 60 hertz bij 8K. In feite is de interface zo nieuw dat er onverwachte problemen zijn ontstaan met sommige HDMI 2.1-ontvangers.
Dat de consoles in de versies met optische drive ook UHD-blu-rays en video’s met formaten zoals AVC en HEVC/VP9 doorgaans kunnen afspelen zonder cpu-belasting is bijna vanzelfsprekend. De consoles gaan traditioneel echter niet zo efficiënt om met hun resources als laptops, desktop-pc’s en stand-alone spelers, maar verbruiken bovenmatig veel energie (zie ook het vorige artikel).
GEHEUGENREVOLUTIE
Laadtijden zijn irritant. Niet alleen bij het starten van een spel zijn enkele minuten gebruikelijk tot je het hoofdmenu ziet, maar ook bij het wisselen van levels of het laden van het laatste checkpoint. Microsoft en Sony benadrukten bij de presentaties van hun nieuwe consoles dat ssd’s al lange tijd een wens