Michael Lew onderzoekt hoe computers kunnen zien

11 januari 2021

Onderzoeken hoe computers beelden kunnen verwerken en beschrijven, net zoals mensen dat doen. Het is een van de sleutelelementen van het onderzoek van Michael Lew, die Deep Learning ziet als een veelbelovende manier om dit doel te bereiken. Op 1 januari 2021 werd hij benoemd tot hoogleraar Deep Learning aan het Leiden Institute of Advanced Computer Science (LIACS).

De semantische kloof 'overbruggen'

Een van Lew's onderzoeken is gericht op multimedia retrieval, waarbij de nadruk ligt op de manier waarop mensen digitale media, zoals afbeeldingen, vinden. Hiervoor is het essentieel dat computers leren 'zien'. ‘De grote uitdaging bij multimedia retrieval is het 'overbruggen' van de semantische kloof. Dit is de kloof die zit tussen het hoge, abstracte niveau van de menselijke concepten en het lage niveau van de beelddescriptie. Het probleem is dat computers nog niet kunnen beschrijven wat afbeeldingen laten zien op de manier waarop mensen dat kunnen. Als we dit probleem kunnen oplossen en de semantische kloof kunnen overbruggen, zou het alle verzamelde kunst en erfgoed, maar ook wetenschappelijke, internet- en persoonlijke beelden doorzoekbaar en toegankelijk maken,’ zegt Lew.

Deep Learning

Om dit doel te bereiken kunnen onderzoekers gebruik maken van Deep Learning. Deep Learning is momenteel een van de meest impactvolle en veelbelovende gebieden van Kunstmatige Intelligentie,’ legt Lew uit. ‘Het is een manier om grote datasets te analyseren en de relevante data te extraheren. Het belangrijkste verschil met andere vormen van Kunstmatige Intelligentie is dat het gemodelleerd is naar de manier waarop de neurale intelligentie van het menselijk brein werkt. In plaats van een oppervlakkige benadering gebruikt Deep Learning een hiërarchie van veel lagen om gegevens te verwerken. Elke laag voert zijn eigen taken uit, waardoor de data-analyse gedetailleerder wordt naarmate je dieper gaat. Deze complexe rekenmodellen maken dus gebruik van miljoenen neuronen en kunnen enorme hoeveelheden gegevens verwerken.’

Developing new neural networks

Lew werkt vooral aan de ontwikkeling van nieuwe neurale netwerken en architecturen voor multimedia, zoals beelden, tekst, video en audio. Lew: ‘Deze nieuwe modellen geven inzicht in drie aspecten van de neurale architecturen: hoe we het computerbrein nieuwe ideeën kunnen aanleren, waarom het bepaalde beslissingen neemt en hoe we de nauwkeurigheid ervan kunnen vergroten. Bovendien zullen ze de neurale netwerken in staat stellen om nieuwe vaardigheden te verwerven, zoals het voortdurend aanleren van nieuwe concepten.’

Van 2D- naar 3D-beelden

Een van Lew's huidige projecten gaat over hoogdimensionaal deep learning. ‘In het recente verleden lag de focus van deep learning-modellen vooral op 2D beeldgegevens,’ verduidelijkt Lew. ‘3D-beelden worden echter steeds belangrijker, bijvoorbeeld in 3D MRI-scans, zelfrijdende auto's en simulatiegegevens die worden gebruikt voor de luchtstroom en het ontwerp van de motor. In dit project ligt de focus op het ontwikkelen van nieuwe neurale modellen die specifiek ontworpen zijn voor dit soort hoogdimensionale toepassingen.’

Mensen en computers onderwijzen

Lew heeft drie specifieke doelen waar hij aan wil werken tijdens zijn hoogleraarschap. ‘Mijn eerste doel is om neurale netwerken van computers te voorzien van het vermogen om continu nieuwe concepten te leren met behulp van benaderingen die geïnspireerd zijn op het menselijk brein. Momenteel zijn de meeste neurale netwerken ontworpen voor een vast aantal visuele concepten. Voor veel situaties is dat echter zeer onrealistisch. Binnen het DeepMark Project werken we aan manieren om dit te verbeteren. Ten tweede wil ik een beter en breder begrip van neurale netwerken creëren. Ze worden nu vaak ervaren als moeilijk te begrijpen. Ik wil interactieve visualisaties van de neurale netwerken en activeringen ontwikkelen om meer inzicht te krijgen in de manier waarop ze functioneren. Ten derde is er een grote behoefte aan zeer grote trainingssets voor real world contexten. Mijn onderzoeksgroep en onze medewerkers zijn al zeer actief geweest in het ontwikkelen van veel van de topdatasets in de wereld en we verwachten dit te blijven doen.’

Tekst: Chris Flinterman