Genoom nu echt (bijna) helemaal in kaart
Het is de belangrijkste, wonderbaarlijkste kaart ooit door de mensheid gemaakt. Deze woorden sprak de Amerikaanse president Bill Clinton uit in juni 2000, nadat het menselijke genoom was gepubliceerd in Nature en Science. Het gros van de ruim 3 miljard letters (de nucleotiden C, G, A en T) waaruit ons DNA is opgebouwd, waren uitgelezen. Helemaal compleet was de kaart nog niet. Er ontbraken vooral een aantal zeer lange repetitieve stukken DNA die waarschijnlijk niet coderen voor eiwitten en dus weinig te betekenen konden hebben, dacht men. Samen vormde dat DNA ongeveer 8 procent van ons erfelijk materiaal. Dat mocht de pret niet drukken.
115 nieuwe genen
Nu hebben ook die stukken hun plek gekregen. Tientallen vooral Amerikaanse onderzoekers schrijven op de website BioRxiv dat ze de puzzel hebben vervolledigd met de laatste 200 miljoen letters. BioRxiv is een preprintserver. Dat betekent dat collega’s het onderzoek nog moeten beoordelen voordat het definitief in een wetenschappelijk tijdschrift verschijnt.
De voltooiing van het genoom is goed nieuws. De jongste jaren groeide het besef dat veel van de andere al bekende stukken niet-coderend DNA wel degelijk belangrijke functies vervullen. Zo zouden ze mee bepalen wanneer eiwitten aangemaakt worden.
“Allerlei neurologische ziektes of gedragsafwijkingen vinden juist daar hun oorsprong”, zegt bioinformaticus en DNA-sequencing-expert Wouter De Coster van de Universiteit Antwerpen. Hij zegt onder de indruk te zijn van de publicatie.
Daarbij komt dat de onderzoekers naar schatting 115 nieuwe genen ontdekten, genen waarvan de DNA-fragmenten heel vaak achter elkaar herhaald worden. “Een evolutionair voordeel van dergelijke duplicaties is dat het genoom zich makkelijker kan aanpassen”, zegt De Coster. “Een kopie van het gen kan veranderen zonder dat het tot verlies van een belangrijke functie leidt. In deze gebieden van het genoom liggen waarschijnlijk veel genen die alleen mensen bezitten en niet de mensapen. Ze spelen een belangrijke rol bij onze uitzonderlijke hersenontwikkeling.”
Encyclopedie van het leven
Veel van het net ontsloten DNA zit in de centromeren. Dat zijn de gecomprimeerde centrale delen van chromosomen. Hier hangen de zusterchromosomen aan elkaar tijdens de celdeling. En een deel bevindt zich juist in de uiteinden van de chromosomen, bij de telomeren.
“De encyclopedie van het leven is enorm uitgebreid”, zegt geneticus Peter de Knijff, van het Leids Universitair Medisch Centrum. “Nieuwe onderzoeksterreinen binnen de genetica dienen
Geneticus Peter de Knijff zich aan. Met deze blauwdruk in de hand kunnen we honderden genomen van mensen met verschillende etnische achtergronden in kaart brengen om meer te weten te komen over de variabiliteit en de mogelijke functies van de stukken repetitieve DNA.” En dan, lachend: “Het onderzoek zal vast veel nieuwe vragen opleveren. We moeten niet de illusie koesteren dat we nu opeens snappen hoe we in elkaar steken.”
Waarom liet deze upgrade zo lang op zich wachten? Om het genoom te ontcijferen hak je het op in stukjes. Die worden allemaal apart uitgelezen. Met de eerste generatie sequentietechnologie kon je stukken met een lengte van 1.000 nucleotiden ontcijferen. Dat zijn vrij korte fragmenten. Geavanceerde software legt alle stukken naast elkaar, zoekt de overlap en bepaalt hoe de delen elkaar zouden moeten opvolgen. De tweede generatie las nog kortere stukjes uit, maar wel sneller en tegen een lagere prijs.
“Het probleem met deze methoden is dat repetitief DNA veel langer kan zijn dan 1.000 nucleotiden”, zegt De Coster. “Als je die delen uitleest, levert je dat talloze stukken op die (vrijwel) identiek zijn. Daar kun je niet mee puzzelen. Zie het als een legpuzzel met piepkleine stukjes van een groot stuk blauwe lucht.”
“De gamechanger was de innovatie van het bedrijf Pacific Biosciences waardoor je stukken tot dertigduizend nucleotiden kon lezen. Hierdoor kunnen we lange repetitieve fragmenten nu overbruggen en die blauwe lucht afmaken.”
Wie is de persoon die zich heeft blootgegeven, wier meest intieme C, G, A en T-reeksen nu door iedereen op internet te zien zijn? Het is een man. Zijn genoom is van een speciale cellijn, een zogenaamde hydatiform mole. Dat is een bevruchte eicel, waarbij na bevruchting het DNA van de moeder verloren ging en dat van de vader verdubbelde. Daardoor is er van elk chromosoom maar één versie. Dat is wel zo handig. Anders heb je twee erg gelijkaardige, maar toch niet helemaal identieke legpuzzels (die van het vadergenoom en die van het moedergenoom), waarbij je niet op voorhand weet of een stukje in de ene of de andere puzzel hoort.
Het nadeel is dat het Y-chromosoom door deze aanpak nog niet volledig is uitgelezen. De zaadcel die gebruikt werd, bevatte een X-chromosoom. Dat is dus nog een los eindje.