Een digitaal oog voor de archeoloog
Wouter Verschoof-van der Vaart verfijnt een kunstmatige intelligentie-systeem dat zelfstandig archeologische objecten op digitale beelden kan detecteren en classificeren. Zo’n systeem is broodnodig, want menselijke archeologen worden wereldwijd overspoeld met data.
Het Data Science Research Onderzoeksprogramma (DSO) combineert Leidse promotieonderzoeken uit allerlei disciplines met data science. Het programma loopt nu ruim twee jaar, en levert verrassende eerste resultaten op. In deze artikelenreeks bespreken we er een aantal.
Prachtig, al die beelden die archeologen tegenwoordig binnenkrijgen dankzij satellieten, hoogtemetingen en andere vormen van remote sensing. Op de scans kunnen ze onontdekte archeologische objecten vinden. Maar inmiddels is er zó veel materiaal beschikbaar, dat het onmogelijk allemaal handmatig kan worden bekeken. Archeologen ontwikkelden in de afgelopen decennia meerdere algoritmes die specifieke objecten in een bepaald gebied konden waarnemen. Helaas zijn deze systemen niet universeel te gebruiken, en zijn ze bovendien vaak niet erg gebruiksvriendelijk.
In zijn promotieonderzoek werkt Wouter Verschoof-van der Vaart daarom aan de ontwikkeling van een universeel systeem dat op basis van kunstmatige intelligentie (AI) op digitale beelden archeologische objecten kan vinden en classificeren. Dat systeem moet bovendien te gebruiken zijn door iemand die geen computerwetenschapper is.
Je onderzoek loopt nu twee jaar; hoe ver ben je?
‘Ik heb inmiddels een AI-systeem geïdentificeerd dat zeer geschikt is om digitale scans van gebieden te doorzoeken: een zogeheten Region-based Convolutional Neural Network (R-CNN). Dit model leert om te zoeken naar objecten op basis van voorbeelden die je aandraagt. Hoe meer voorbeelden je aandraagt, hoe beter de R-CNN wordt in het vinden van objecten.
Ik test het systeem nu aan de hand van LiDAR-data, gratis beschikbare hoogtekaarten van Nederland, gemaakt door Rijkswaterstaat. Het R-CNN zoekt op deze beelden naar drie soorten objecten: grafheuvels, prehistorische akkerbouwsystemen en houtkoolmeiers. De resultaten zijn zeer bemoedigend. De eerste versie van het systeem detecteerde 80% van ons bekende grafheuvels op de Veluwe, de tweede al bijna 90%. De komende twee jaar ga ik het systeem verfijnen. Zo hebben we uit Duitsland LiDAR-beelden, die de afgelopen 10 jaar door één person zijn bestudeerd. Die beelden gaan we nu incorporeren in onze dataset. En dan kijken we: komt ons netwerk tot dezelfde bevindingen? En hoeveel sneller is onze methode? Bovendien is het de bedoeling dat het netwerk straks nog meer soorten objecten kan herkennen, en in diverse gebieden.’
Wat voor meerwaarde biedt een programma als het Data Science Onderzoeksprogramma?
‘Ten eerste maken de deelnemende promovendi gebruik van vergelijkbare technieken, waardoor we problemen en oplossingen met elkaar kunnen delen. Bijvoorbeeld op het gebied van object-herkenning door een AI-systeem. Hoe zorg je ervoor dat een R-CNN een object dat net even een andere vorm heeft, of een andere oriëntatie heeft dan normaal, toch herkent? Ook voor de computerwetenschappers van het Leiden Centre of Data Science is het interessant. Zij krijgen met nieuwe typen data te maken, zoals in mijn geval LiDAR-data. Hoe deze data moet worden bewerkt om een R-CNN op los te kunnen laten is voor hen ook interessant.’
Zijn dankzij data science in de toekomst alle archeologische objecten in Nederland bekend?
‘Een model kan maar in beperkte mate beter worden dan mensen, en ziet net zoals mensen ook wel eens wat over het hoofd. Dus álle objecten in kaart, dat denk ik niet. Maar wel veel meer dan nu.’