Universiteit Leiden

nl en

Werken met datasets die groter zijn dan die van de hele universiteit

Radiotelescoop LOFAR brengt het heelal in kaart. Dat levert niet alleen bijzondere beelden op, maar vooral ook immense hoeveelheden data. Huub Röttgering, directeur van de Leidse Sterrewacht, vertelt over de uitdagingen van het werken met die enorme datasets.

Waar doet u precies onderzoek naar?

‘Ik bestudeer heel gedetailleerde beelden van het heelal, onder andere om meer te weten te komen over de evolutie van zwarte gaten. Wanneer en hoe zijn de eerste zwarte gaten ontstaan? En hoeveel zijn er eigenlijk? Daarnaast kijk ik naar hoe sterrenstelsels groeien. Ons eigen melkwegstelsel vormt ongeveer één ster per jaar, maar er zijn ook sterrenstelsels die jaarlijks meer dan honderd nieuwe sterren produceren. Ik probeer uit te zoeken wanneer en hoe dat gebeurt.’

Hoe komt u aan de beelden van het heelal die u gebruikt in uw onderzoek?

‘Die maken we met behulp van LOFAR, een enorme radiotelescoop die duizenden antennes heeft in Nederland en de rest van Europa. De telescoop vangt radiostraling op en kan op basis daarvan een soort foto’s maken van kleine stukjes van het heelal. Die beelden hebben een heel hoge resolutie, je kunt er dus heel ver op inzoomen.’

Daar is vast heel veel data mee gemoeid?

Huub Röttgering

‘Ja, ontzettend veel. Met LOFAR hebben we inmiddels rond de 30 petabytes aan data verzameld. Ter vergelijking: alle data van de hele Universiteit Leiden beslaat ongeveer 5 petabytes. Het gaat dus om gigantische hoeveelheden, en dat levert allerlei problemen op. Het is al een uitdaging om zoveel data van het meetstation naar de universiteit te verplaatsen, omdat het internet daar niet snel genoeg voor is.’

Hoe lossen jullie dat op?

‘Een deel van de dataverwerking gebeurt zo dicht mogelijk bij de meetstations. Daar filteren we bijvoorbeeld de ruis – radiostraling van tv’s, mobieltjes en vliegtuigen – eruit, waardoor er al minder data overblijft. En we middelen de data van verschillende waarnemingen, en sturen dan alleen het gemiddelde door. Dat scheelt al een hoop, waardoor we minder data hoeven te verplaatsen.’

En dan nog zijn er heel krachtige computers nodig, stel ik me zo voor.

‘Ja, met een gewone computer red je het niet. Sterker nog, we hebben zoveel rekenkracht nodig dat de data in verschillende grote computercentra wordt verwerkt: hier in Nederland, maar ook bijvoorbeeld in Duitsland en Engeland. We werken samen met informatica-onderzoekers om dat in goede banen te leiden. Zo heb ik met hoogleraar Data Science Aske Plaat een gezamenlijke promovendus - Alex Mechev -, die een systeem maakt dat de dataverwerking op al die verschillende plekken coördineert. Daardoor loopt de software die sterrenkundigen hebben ontwikkeld nu soepel op verschillende computers; een grote vooruitgang.’

Wat is de volgende stap?

‘Het zou mooi zijn als we op den duur aan deze universiteit een High Performance Computer centrum kunnen  krijgen, dat veel meer rekenkracht heeft dan de computers die er nu zijn. Dat zou niet alleen goed zijn voor het verwerken van LOFAR-data, maar ook voor andere onderzoekers binnen en buiten de sterrenkunde. Sommige van mijn collega’s maken bijvoorbeeld simulaties van stukjes van het heelal, waarvoor ze soms gebruikmaken van de grootste computers op de wereld. Maar je kunt niet in één keer van een desktop overgaan naar zo’n supercomputer, daar moet een stap tussen zitten. Als je wilt meedoen met de grote jongens op deze planeet, moet je eerst lokaal spul hebben waarop je kunt oefenen.’

Lopen sterrenkundigen altijd tegen de grenzen van rekenkracht aan?

‘Ja, het gaat altijd hand in hand. De computers worden groter en beter, waardoor de experimenten die we doen ook steeds groter en beter worden. Dus we willen steeds meer, maar er zijn altijd grenzen aan wat mogelijk is. Kijk maar naar LOFAR: we laten al die antennes steeds naar een ander klein stukje hemel kijken. Gedurende een periode van tien jaar voegen we al die stukjes samen om zo een complete kaart te krijgen van de hele noordelijke hemel. Maar als we genoeg rekenkracht hadden, zouden we al die antennes aan elkaar kunnen koppelen om in één keer de hele hemel in kaart te brengen. Dan zouden we snel klaar zijn. Maar ja, dan hebben we ineens een miljard keer meer data, dat kan gewoon niet.’

Onlangs kreeg een consortium waar ook Leidse onderzoekers in zitten een zwaartekrachtsubsidie voor het ontwikkelen van quantumcomputing. Is dat iets waar jullie in de sterrenkunde ook iets aan hebben?

Uiteindelijk wel. Als quantumcomputing van de grond komt, kunnen wij allemaal nieuwe stappen zetten in onze manier van denken over hoe je omgaat met deze hoeveelheden data. En wie weet kunnen we de data dan veel sneller, beter en dieper verwerken. Maar dat is allemaal nog ver weg.’

Was u altijd al gefascineerd door sterrenkunde?

‘Ik vond het altijd al wel boeiend, maar deed naast mijn studie sterrenkunde ook allerlei andere dingen die ik leuk vond. Pas toen ik zelf onderzoek kon gaan doen, is echt de grote interesse gekomen. Zelf het heelal onderzoeken en gebruikmaken van allerlei telescopen, dat vond ik geweldig. En nu gebeurt er zo veel hier bij de Sterrewacht: op het gebied van exoplaneten, donkere materie, donkere energie. We hebben 43 nationaliteiten in huis, het is geweldig inspirerend om met al die mensen samen uit te zoeken hoe het heelal in elkaar steekt.’

(JvdB)

Huub Röttgering promoveerde in de sterrenkunde aan de Universiteit Leiden. Na een periode als postdoc aan Cambridge University keerde hij terug naar Leiden, waar hij inmiddels hoogleraar Observationele Kosmologie en directeur van de Leidse Sterrewacht is. Als Principal Investigator van het project Development and Commissioning van LOFAR voor de astronomie, en als PI van de LOFAR surveys speelt Röttgering een leidende rol in de ontwikkeling van LOFAR. Daarnaast is hij betrokken bij de ontwikkeling van optische en infrarood interferometers.
 

In deze serie interviews komen onderzoekers van het Leiden Centre of Data Science (LCDS) aan het woord. LCDS is een netwerk van onderzoekers uit verschillende wetenschappelijke disciplines, die gebruik maken van innovatieve methodes voor het omgaan met grote hoeveelheden data. Het doel van samenwerking tussen deze onderzoekers is het vinden van slimme oplossingen voor wetenschappelijke en maatschappelijke kwesties.