Universiteit Leiden Universiteit Leiden

Nederlands English

Enorme databases doorlichten op zoek naar een medicijn tegen kanker

Bij onderzoek naar geneesmiddelen zou meer gebruik moeten worden gemaakt van data science. Dat zegt Gerard van Westen, postdoctoraal onderzoeker bij het Leiden Academic Centre for Drug Research (LACDR). ‘Als je betere medicijnen wilt hebben, moet je starten bij data.’

Het ontwikkelen van nieuwe medicijnen wordt steeds duurder en ingewikkelder; onderzoek en experimenten in het laboratorium kosten veel tijd en geld. Door eerst grote hoeveelheden data te doorzoeken en analyseren, kunnen we in medicijnenonderzoek beter voorspellen wat zal werken en wat niet. Data-Driven Drug Discovery, noemt Gerard van Westen dat. Hij kreeg een Veni-beurs van NWO om op deze manier onderzoek te doen naar een middel tegen kanker.

Waar is je onderzoek precies op gericht?

‘Ik onderzoek G Protein-Coupled Receptors (GPCRs); dat zijn eiwitten die in de celwand zitten. Via GPCRs kun je van buitenaf iets binnenin de cel manipuleren, waardoor bijvoorbeeld medicijnen goed hun werk kunnen doen. Veel geneesmiddelen, zoals antidepressiva en antihistamines, werken via GPCRs. Mijn onderzoek gaat over de vraag of we die GPCRs ook kunnen inzetten bij het bestrijden van kanker. Tot voor kort was het onderzoek naar medicijnen tegen kanker altijd gefocust op het gebruik van een ander type eiwitten, de kinases. Dat lag voor de hand, want kinases beheren de groei van de cel. Maar de rol van GPCRs is nog nooit goed onderzocht, terwijl ik vermoed dat dat veel kan opleveren.’

Wat maakt je onderzoek data-driven?

‘In de afgelopen jaren zijn er steeds meer grote, publieke databases beschikbaar gekomen, waarin onderzoekers en farmaceutische bedrijven hun data delen. Een voorbeeld is de ChEMBL database, die grote hoeveelheden data bevat over experimentele moleculen in het farmaceutisch onderzoek. Door middel van algoritmes analyseer ik de data in die databases en probeer ik er patronen in te herkennen. Ik zoek bijvoorbeeld uit hoe die experimentele moleculen en medicijnen binden met eiwitten. Op basis daarvan kan ik voorspellingen doen, bijvoorbeeld dat een bepaald medicijn wel eens goed met een bepaald eiwit zou kunnen werken. Vervolgens kan iemand in het laboratorium aan de slag om uit te zoeken of dat ook echt zo is. En bij goede resultaten kunnen farmaceutische bedrijven een medicijn gaan ontwikkelen.’

Dus door die data mining kunnen we gerichter onderzoek doen?

‘Precies. Als we goede medicijnen willen ontwikkelen, moet we uitgaan van wat we al weten. En dan bedoel ik niet drie of vier artikelen lezen, maar echt de databases raadplegen, en met behulp van data science grootschalige analyses doen. Op die manier kunnen we veel betere hypotheses genereren. Een ander voordeel van data-driven onderzoek is dat het minder ruimte laat voor de gut feeling van de onderzoeker. Iedereen heeft persoonlijke voorkeuren en is meer vertrouwd met de ene techniek dan met de andere. Dat is heel normaal, maar daardoor zijn we toch al snel geneigd in een bepaalde richting te denken. Door af te gaan op voorspellingen die de computer doet, zien we verbanden waar we anders misschien wel nooit aan hadden gedacht.’

Kleven er ook nadelen aan het gebruik van grote hoeveelheden data?

‘Ja, een gevaar van data-driven onderzoek is dat je je gaat blindstaren op data en modellen, en daarbij uit het oog verliest wat het doel is. Het is leuk, al die data analyseren, maar uiteindelijk doen we het om er een medicijn mee te maken.
En dan is er natuurlijk nog de privacykwestie: je kan werken met genetische informatie, en die zegt meer over mensen dan ze misschien zouden willen. Natuurlijk zijn er strikte regels voor het gebruik van dit soort data, dus ik denk dat er – in ieder geval in mijn vakgebied - weinig risico bestaat dat het misgaat. Maar toch zullen veel mensen aarzelen om dat soort data beschikbaar stellen. Dat is jammer, want hoe meer data we hebben, des te beter wij als onderzoekers ons werk kunnen doen.’

Hoe heeft data science je vakgebied in de afgelopen jaren veranderd?

‘De ontwikkelingen gaan razendsnel. De rekenkracht groeit enorm: dezelfde dataset waar de computer tijdens mijn stage een week mee bezig was, rekende ik vier jaar later in een paar uurtjes door. En ook de algoritmes worden steeds beter. De nieuwste ontwikkeling is deep learning: het werken met slimme algoritmes die in hun werking lijken op het menselijke brein. Daarmee kunnen we data veel efficiënter verwerken, en kunnen we bijvoorbeeld interacties tussen eiwitten en medicijnen steeds beter en sneller voorspellen. Je ziet ook dat de farmaceutische industrie zich realiseert wat er allemaal mogelijk is op het gebied van data-onderzoek, en steeds meer de samenwerking zoekt met de academische wereld.’

Hoe zie je de toekomst van Data-Driven Drug Discovery?

‘Het mooie van medicijnonderzoek is dat het een eindige ruimte is: er zijn heel veel moleculen die medicijnen zouden kunnen zijn, maar uiteindelijk is het een beperkte hoeveelheid. Dat betekent dat je in theorie een computer al die moleculen zou kunnen laten bekijken, en op basis daarvan alle mogelijke geneesmiddelen zou kunnen maken. Nou hebben we daar bij lange na nog niet genoeg data voor, maar misschien ooit, in de toekomst.’

Wat is daarvoor nodig?

‘We moeten anders met onze data leren omgaan. Wij als onderzoekers zouden alle data die we genereren moeten opslaan en voor anderen beschikbaar moeten maken. Nu verdwijnt veel data nog in de prullenbak, vooral als de uitkomsten van zo’n project tegenvallen. Zonde, want een andere onderzoeker kan er juist veel aan hebben. Door data te delen kunnen we veel efficiënter op elkaars onderzoek voortbouwen. Je ziet dat ook wel veranderen: onderzoekers sturen met hun publicaties steeds vaker ook hun data en algoritmes mee. En ook farmaceutische bedrijven delen steeds meer data, bijvoorbeeld via het project Open PHACTS. Maar toch is er op dat gebied nog veel te winnen.’


Gerard van Westen is postdoctoraal onderzoeker bij het Leiden Academic Centre for Drug Research (LACDR). Hij studeerde Bio-Farmaceutische Wetenschappen aan de Universiteit Leiden en promoveerde aan het LACDR. Daarna werkte Van Westen als postdoc in het European Bioinformatics Institute European Molecular Biology Lab (EMBL-EBI) in Hinxton, UK. Voor zijn huidige onderzoek 'Fighting cancer through G Protein-Coupled Receptors' ontving hij een Veni-beurs van NWO. Samen met Leiden Centre of Data Science is Van Westen bezig het netwerk Data-Driven Drug Discovery Network (D4N) op te zetten aan de Universiteit Leiden. 

(JvdB)

In deze serie interviews komen onderzoekers van het Leiden Centre of Data Science (LCDS) aan het woord. LCDS is een netwerk van onderzoekers uit verschillende wetenschappelijke disciplines, die gebruik maken van innovatieve methodes voor het omgaan met grote hoeveelheden data. Samenwerking tussen deze onderzoekers leidt tot nieuwe oplossingen voor wetenschappelijke en maatschappelijke kwesties.