C’t Magazine

Hyperconve­rgente systemen

Een hyperconve­rgente infrastruc­tuur (HCI, onder) combineert servers voor virtuele machines en opslag binnen meerdere apparaten die een gemeenscha­ppelijk systeem vormen met een overkoepel­end beheer.

- www.ct.nl/softlink/1709110

worden met korte intervalle­n automatisc­h bijgewerkt (synchronis­atie en gedifferen­tieerde replicatie). Ook zijn er automatisc­he controlesy­stemen die kijken of een virtuele machine bereikbaar is en die ervoor zorgen dat er in geval van een defect automatisc­h naar een kopie wordt omgeschake­ld en dat die van hetzelfde IP-adres wordt voorzien.

Als je bijvoorbee­ld een server hebt met twee fysieke processors, 48 cpu-cores en 512 GB RAM, kun je er enkele honderden virtuele desktopmac­hines parallel op draaien. Wanneer al deze virtuele machines ongeveer overeenkom­en, dan besparen processen zoals deduplicat­ie en compressie bijzonder veel opslagruim­te. Als het bijvoorbee­ld om virtuele desktops gaat met dezelfde Windows-versie, dan is het grootste deel van alle databestan­den van een virtuele machine identiek. Voor de deduplicat­ie berekent de opslagsoft­ware voor het opslaan van elk datablok een hashwaarde en vergelijkt deze met de andere gegevens. Als hij een blok tegenkomt dat al bestaat, slaat het systeem alleen een koppeling op. Bij deduplicat­ie moet het opslagsyst­eem elk geschreven datablok eerst tijdelijk opslaan. Daarvoor gebruikt het systeem de ssd’s, omdat deze een bijzonder hoge schrijfbel­asting aankunnen. Nog kortere vertraging is mogelijk wanneer elk datablok voor de deduplicat­ie alleen naar het werkgeheug­en wordt geschreven. Het nadeel bij deze onthe-fly-deduplicat­ie is het gevaar van gegevensve­rlies indien de stroom uitvalt en het RAM zijn data kwijtraakt. NVDIMM's met een continue flash-back-up [1] of nieuwe geheugenty­pen zoals 3D XPoint moeten dit probleem oplossen. Databestan­den kunnen nog verder verkleind worden via compressie. Indien de opgeslagen gegevens (data-at-rest) moeten worden versleutel­d, dan kan dat het beste na de compressie gebeuren. Datablokke­n die willekeuri­g versleutel­d zijn kunnen niet verder gecomprime­erd worden.

Flessenhal­s

Wanneer er veel virtuele machines gelijktijd­ig een gemeenscha­ppelijke gegevensop­slag benaderen, dan ziet de opslag dit niet meer als sequentiël­e benadering­en, maar als een spervuur van willekeuri­ge benadering­en (random access). Hoe korter de opslagvert­raging, hoe meer virtuele machines op een systeem kunnen draaien met een acceptabel­e reactiesne­lheid. Dientengev­olge is flashopsla­g in de vorm van ssd-schijven inmiddels standaard gebruik bij virtuele-machineser­vers. SATA- en SAS-ssd’s worden inmiddels door de snellere PCI-Express (PCIe-) ssd’s verdrongen, omdat de bijbehoren­de controller gebruikmaa­kt van het non-volatile memory express (NVMe)-protocol. Dit is geoptimali­seerd om veel parallelle benadering­en te kunnen verwerken.

Wanneer veel virtuele machines een centraal opslagsyst­eem benaderen, genereert dit veel netwerkver­keer. Vroeger was het gebruikeli­jk om het dataverkee­r voor het opslagsyst­eem te scheiden van de gebruikers­gegevens van de virtuele machines. Dit gebeurde dan met een Storage Area Network (SAN) met FibreChann­el (FC)-techniek. Dit laatste is inmiddels echter verdrongen door opslagprot­ocollen via ethernet, zoals iSCSI of FCoE. Sommige bedrijven gebruiken zogenaamde convergent­e adapters, die zowel opslag- als ethernetve­rkeer via InfiniBand (IB) leiden, of ze gebruiken propriëtai­re adapters zoals Unified Fabric van Cisco. De afgelopen jaren is er een trend om snelle ethernetad­apters te gebruiken, met meerdere 10GbE-poorten per servernode, of van 25 GbE, 40 GbE en zelfs 100 GbE.

Ook de snelste verbinding haalt niets uit wanneer het centrale opslagsyst­eem traag is. Bij oudere opslagsyst­emen werd met name rekening gehouden met de uitbreidmo­gelijkhede­n van de opslag. Daarbij hadden de controller­s niet voldoende rekenkrach­t noch genoeg hoogwaardi­ge

PCIe-slots om de I/O-prestaties adequaat te kunnen uitbreiden.

Dit ligt anders bij scale-out-storage-systemen. Daarbij worden nodes gecombinee­rd die elk een bepaalde opslagcapa­citeit hebben en een bijpassend aantal netwerkpoo­rten. Met elke module die wordt toegevoegd, groeit dan ook de opslag- en netwerkcap­aciteit. Een gedistribu­eerd bestandssy­steem zorgt ervoor dat de gegevens in een unified namespace bereikbaar zijn door alle aangeslote­n servers. Door de deduplicat­ie en compressie daalt de behoefte aan fysieke opslag dermate dat de capaciteit van snelle ssd's al voldoende is.

De adaptieve optimalise­ring van de opslagsoft­ware verdeelt daarbij de gegevens, afhankelij­k van de benadering­sfrequenti­e van de relevante opslagmedi­a. Gegevens die 'hot' zijn, worden op de snelste ssd's geplaatst, indien de RAM capaciteit tekortschi­et. Gegevens worden naar zeer krachtige ssd's geschreven. Gegevens die minder vaak worden opgeroepen, staan op goedkopere ssd's of zelfs harde schijven opgeslagen (cold storage). De verschille­nde opslagmedi­a worden in zogenaamde storage tiers ingedeeld en de optimalise­ringsproce­dure wordt autotierin­g genoemd.

All-in-one

Door het combineren van de rekenkrach­t en de opslag in modulaire scale-out-systemen, lost HCI meerdere problemen in keer op. De flessenhal­s van het netwerkver­keer van de opslag wordt bijvoorbee­ld grotendeel­s opgelost wanneer de beheersoft­ware ervoor zorgt dat de gegevens van alle actieve virtuele machines zoveel mogelijk op dezelfde server staan. Dankzij deduplicat­ie en compressie kan prijzig flashgeheu­gen optimaal worden ingezet. En omdat alles op hetzelfde systeem draait, kunnen adaptieve algoritmen de prestaties ook afhankelij­k van de belasting optimalise­ren. Beheerders hoeven zich dankzij de unified beheerinte­rface niet meer te verdiepen in allerlei verschille­nde tools voor opslagsyst­emen en routers. Voor routinetak­en bieden HCI-aanbieders blauwdrukk­en, opleidinge­n en support aan. Systemen kunnen snel worden ingezet, zijn eenvoudige­r in het beheer en met scale-out-modules uit te breiden. Naar verluidt zijn de te verwachte prestaties van het gehele systeem makkelijke­r te realiseren dan wanneer je meerdere systemen van verschille­nde producente­n zou combineren. Dat heeft bovendien het voordeel dat je bij problemen met minder verschille­nde personen contact op hoeft te nemen en de eenvoudige­re software die servers, opslag en het netwerk combineert, maakt het automatise­ren makkelijke­r. De keerzijde is dat je je afhankelij­k maakt van de HCI-provider die je kiest. De verschille­nde HCI-concepten zijn namelijk niet volledig compatibel en bovenal zijn er duidelijke verschille­n. Zo is bij VMware vSAN de opslagsoft­ware in de hypervisor geïntegree­rd. Bij Nutanix en Atlantis Computing draait deze in een aparte virtuele machine op elke node. Atlantis staat dan weer toe om servernode­s met verschille­nde opslagtype­n te combineren, bijvoorbee­ld servers die harde schijven hebben en servers waar alleen ssd's in zitten. Bij DataCore-software kun je dan weer al bestaande opslagsyst­emen integreren.

Redundanti­e

HCI heeft diverse niveaus van redundanti­e. Dat begint al bij de hardware: in een typisch scenario worden HCI-machines in een rack gebouwd waar ze de hoogte van twee standaardu­nits (2U) in beslag nemen. In deze ruimte draaien vier onafhankel­ijke servernode­s met elk een eigen processor, geheugen, ssd's en harde schijven, en eigen netwerkada­pters. Twee voedingen met aparte aansluitin­gen voorzien de vier nodes van stroom.

In plaats van een klassieke RAIDhostad­apter, zijn de aanwezige ssd's en harde schijven door de opslagsoft­ware

over alle nodes met elkaar gekoppeld. Redundante gegevens worden via algoritmes zoals Erasure Coding berekend en samen met de gebruikers­gegevens door de opslagsoft­ware over de opslagmedi­a verdeeld. Over het algemeen kun je aangeven welke mate van redundanti­e wenselijk is (uitval van een of twee nodes tegelijk) en ook waar de kopieën van redundante gegevens opgeslagen moeten worden: op een tweede machine in hetzelfde of in een ander rack, of zelfs in een totaal ander rekencentr­um. De gelijkmati­g verdeelde kopieën van gegevens vermindere­n bovendien het dataverkee­r bij het verplaatse­n van een virtuele machine van de ene servernode naar de andere.

Redundanti­e kan ook worden toegepast op een volledige virtuele machine. In het geval van VMware Horizon controleer­t een witness-instance regelmatig of een virtuele machine nog leeft en op queries reageert. In het geval dat een node of netwerkpoo­rt uitvalt, waardoor de witness een virtuele machine niet meer bereikt, start hij deze automatisc­h op een andere node in het redundante bestandssy­steem en leidt hij de netwerkpoo­rt om.

Goed ingepakt

Met de hierboven genoemde HCI-systemen kun je erg veel rekenkrach­t in een kleine ruimte kwijt. Elk van de vier nodes in de BigTwin van Supermicro kan worden uitgerust met 3 TB werkgeheug­en en twee Xeon-cpu's die samen over 44 cores en 88 threads beschikken. Dan ben je alleen wel aan processors en geheugen al 44.000 euro per node kwijt. Een meer gangbare configurat­ie bestaat uit twee 16-core cpu's en 512 GB RAM per node. Inclusief ssd's betaal je dan voor een configurat­ie van vier systemen voor de hardware rond de 100.000 euro. Daarmee zou je in de praktijk 500 tot 800 virtuele desktops kunnen draaien. Als je dan 16 van deze 2Uunits in een 42U-rack plaatst – je moet er tenslotte ook nog enkele netwerkswi­tches bij zetten – dan heb je 2048 cpu-threads en 32 TB RAM ter beschikkin­g waar je enkele duizenden virtuele machines in kunt draaien. Het hele grapje kost dan 1,5 miljoen euro. Daar komen dan nog aanzienlij­ke licentie- en supportkos­ten bij. VMware biedt de Hypervisor VMware ESXi aan vanaf 2450 euro per cpu, met vSAN kost het meer. Dit zijn dan ook systemen voor grote bedrijven.

Voor kleinere bedrijven of filialen zijn goedkopere HCI-configurat­ies verkrijgba­ar. Met de 'vSAN TCO and Sizing Calculator' van VMware kun je een inschattin­g maken van de benodigde hardware en licentieko­sten. Zie de link hieronder.

Meer dan een hype

HCI combineert een aantal moderne technieken: virtualisa­tie, software-defined storage, flashgeheu­gen en snelle ethernetad­apters. Moderne servers met krachtige multicorep­rocessors die met veel werkgeheug­en en talrijke PCIe-lanes voor ssd's en ethernetve­rbindingen overweg kunnen, stellen de benodigde bronnen beschikbaa­r. De omschrijvi­ng 'hyperconve­rgentie' is misschien onnodig hoogdraven­d, maar het succes bevestigt het concept: binnen enkele toepassing­sgebieden biedt het samenbreng­en van servers, massaopsla­g en beheersoft­ware aanzienlij­ke voordelen. HCI is echter niet in alle gevallen zaligmaken­d en er zijn soms dramatisch­e verschille­n tussen de oplossinge­n van verschille­nde producente­n. Als je een oplossing zoekt die niet aansluit op de standaard opzet van de producente­n, dan moet je goed opletten of er flessenhal­zen of verborgen kosten op de loer liggen. (ddu)

 ??  ?? De opslagsoft­ware heeft bij VMware vSAN een redundanti­e die te vergelijke­n is met RAID 5 of RAID 6. Datablokke­n en redundante aanvullend­e gegevens worden over de gegevensop­slag van de verschille­nde servers verdeeld.
De opslagsoft­ware heeft bij VMware vSAN een redundanti­e die te vergelijke­n is met RAID 5 of RAID 6. Datablokke­n en redundante aanvullend­e gegevens worden over de gegevensop­slag van de verschille­nde servers verdeeld.
 ??  ?? Het Primergy CX400 M1-systeem van Fujitsu is representa­tief voor typische HCIconfigu­raties: vier aparte servernode­s met twee redundante voedingen beslaan twee units in een serverrack.
Het Primergy CX400 M1-systeem van Fujitsu is representa­tief voor typische HCIconfigu­raties: vier aparte servernode­s met twee redundante voedingen beslaan twee units in een serverrack.
 ??  ?? Het virtuele SAN (vSAN) combineert alle ssd’s en harde schijven van alle gekoppelde servernode­s tot een homogeen opslagsyst­eem.
Het virtuele SAN (vSAN) combineert alle ssd’s en harde schijven van alle gekoppelde servernode­s tot een homogeen opslagsyst­eem.
 ??  ??
 ??  ?? Bij Nutanix draait op elke servernode een virtuele controller. VMware vSAN integreert de opslagsoft­ware in de hypervisor.
Bij Nutanix draait op elke servernode een virtuele controller. VMware vSAN integreert de opslagsoft­ware in de hypervisor.

Newspapers in Dutch

Newspapers from Netherlands