Pas gepromoveerde doctors: ‘De ontwikkelingen in gezichtsherkenning zijn scary’
Toen Jordy Van Landeghem op de website van de VDAB ging kijken voor welke banen hij met zijn diploma taalkunde in aanmerking kwam, was de enige suggestie een vacature van een McDonald’s. Een specialisatie in artificiële intelligentie leverde hem een doctoraat en een baan bij een Amerikaans groeibedrijf op. Zijn belangrijkste aandachtspunt: hoe zorg je dat de inschatting die een machine maakt, betrouwbaar is?
“En toen dacht ik: shit” Nadat hij na zijn diploma taal- en letterkunde had gehaald, keek Jordy Van Landeghem op de website van de VDAB voor welke banen hij in aanmerking kwam. “De enige suggestie die ik kreeg, was een vacature van een McDonald’s in Leuven. Ik sta graag achter de barbecue burgers te flippen, maar als baan zag ik dat niet zitten. Ik had mijn thesis in Leuven gemaakt aan het Centrum voor Computerlinguïstiek van de faculteit Letteren, dat goed samenwerkte met het departement Computerwetenschappen. Ik schreef me daar in voor een master in artificiële intelligentie (AI).”
Met dat diploma op zak kwam Jordy Van Landeghem beter aan zijn trekken op de arbeidsmarkt. Hij ging aan de slag bij het Brusselse softwarebedrijf contract.fit. Dat leidde na drie jaar tot een doctoraat via een Baekeland-mandaat, waarmee een doctoraat wordt toegepast in de industrie.
Generatieve AI
Dat doctoraat bracht hem in contact met Instabase, waarvoor hij sinds enkele maanden werkt. Het jonge Amerikaanse bedrijf heeft een platform met geavanceerde generatieve AI, waarmee organisaties complexe, ongestructureerde gegevens kunnen omzetten in bruikbare inzichten.
“Mijn taak is minstens iets evenwaardigs te maken als een taalmodel zoals dat van ChatGPT, iets wat kan worden gebruikt voor specifieke toepassingen als documentverwerking in een gesloten omgeving, omdat bedrijven die risicogevoelige data verwerken niet willen dat hun data open zijn. Dan zouden die misbruikt kunnen worden.”
‘Als ik in mijn kmo een voldoende groot aantal noodzakelijke administratieve taken met een vrij lage complexiteit had, zou ik kijken of ik er AI-oplossingen voor kon vinden
Uw doctoraat ging ook over documentverwerking. Wat onderzocht u precies?
JORDY VAN LANDEGHEM. “Mijn doctoraat ging over de intelligente automatisering van documentverwerking met AI. Het doel was AI te gebruiken voor alle toepassingen waar documenten aan te pas komen. Verzekeringen zijn de meest voor de hand liggende toepassing, maar andere voorbeelden zijn een lening aanvragen of je belastingen invullen. Stel: ik rijd met mijn auto tegen een paal. Er komt dan een heel administratief proces op gang tussen twee verzekeringsmaatschappijen. Ik moet een foto van mijn beschadigde bumper sturen, en in die mail allerlei informatie zetten zoals mijn polisnummer. Bij de verzekeringsmaatschappij krijgt iemand die mail, die die info moet overtikken in een database – een heel manueel en saai proces. AI is nu zo vergevorderd dat het een deel van dat proces kan overnemen.
“Mijn doctoraat ging over die automatisering, waarbij de machine een inschatting moet maken of het een taak correct heeft uitgevoerd of de hulp moet inroepen van een mens. Hoe kunnen we ervoor zorgen dat de inschatting die de machine maakt betrouwbaar is? Als die inschatting betrouwbaar is, kan je bijvoorbeeld zeggen dat documenten die de machine als makkelijk inschat, kunnen worden geautomatiseerd. Je kunt dan 80 procent van de makkelijke zaken door de machine laat doen. De mensen komt enkel te pas bij 20 procent van de gevallen waar je een dieper inzicht en creativiteit voor nodig hebt.”
Hoelang hebt u gewerkt aan uw doctoraat?
VAN LANDEGHEM. “Vier jaar en twee maanden. Die twee maanden waren onverwacht. Door in IT te zitten, heb ik rugklachten gekregen. Ik heb zes weken niet kunnen werken. Na die zes weken kwam ook ons eerste kindje. Dat was even hectisch. Maar er even tussenuit zijn heeft me veel deugd gedaan. Het geeft je tijd om te herbronnen. Ook al zit je thuis, je blijft nog altijd papers lezen omdat je enthousiast bent over je onderwerp.”
Begin 2023, tijdens het werk aan uw doctoraat, brak AI helemaal door bij het brede publiek, met de lancering van taalmodellen als ChatGPT. Hoe hebt u dat beleefd?
VAN LANDEGHEM. “Dat was een gek moment. AI wordt al sinds de jaren zestig gebruikt, maar de marketing en de publieke aandacht die ChatGPT heeft gecreëerd, is nooit gezien. In 2019 wisten de mensen die in het veld actief waren al dat er iets stond te gebeuren. Het is een paradigmawissel. Tot een paar jaar geleden waren we nog aan het werken met AI-modellen die waren gebouwd in de jaren negentig. Dat je nu op de trein zit en mensen van alles vragen aan ChatGPT, is echt bizar. Vanuit het perspectief van een onderzoeker, denk je dan: hoe kan het zo goed zijn dat iedereen ermee wil werken? Zit er een geheim recept in dat we niet kennen? Eigenlijk niet, want OpenAI gebruikt dezelfde technologie als iedereen. Het verschil is de prachtige dataset (om een AI-taalmodel te trainen heb je goede data nodig zoals artikels en boeken, nvdr), die OpenAI – het bedrijf achter ChatGPT – niet wil vrijgeven. Die dataset is wellicht niet op heel legale wijze verkregen. Daarom lopen er nu ook rechtszaken, zoals die van The New York Times, die OpenAI aanklaagt omdat het vermoedt dat zijn data gebruikt zijn bij het trainen van ChatGPT, zonder dat OpenAI daar toestemming voor heeft gevraagd.”
‘Elon Musk heeft X gekocht omdat hij een platform met veel data wilde hebben’
Grote bedrijven testen hoever ze kunnen gaan bij het zich toe-eigenen van die data?
VAN LANDEGHEM. “In de Verenigde Staten kun je je beroepen op fair usage, al zijn er nu in Californië wetten die lijken op de Europese GDPR-regelgeving om de privacy meer te beschermen. Meta, het bedrijf boven Facebook, traint zijn AI-modellen op basis van alle data die gebruikers publiek hebben staan. In Europa heeft Meta de lancering daarvan stopgezet, nadat er klachten waren gekomen over inbreuken op de wetgeving en de privacy. Ik denk dat Elon Musk X heeft gekocht omdat hij een platform met veel data wilde hebben, hij heeft er nu ook zijn eigen taalmodel ontwikkeld (Grok AI, nvdr). X genereert veel data, maar door de algoritmes kun je er ook meningen mee bespelen. Misschien heb ik iets getriggerd in dat algoritme, want ik krijg nu de hele tijd video’s van immigratie in Europa te zien. Daar zijn video’s bij waarin een migrant iemand met een mes aanvalt. Musk kan zo een rechtsere ideologie aan de man brengen, en misschien indirect verkiezingen manipuleren.”
Denkt u er soms aan te stoppen met X?
VAN LANDEGHEM. “Je hebt ook veel kwaliteit op X. Posts van onderzoekers die publiceren over iets nieuws dat ze hebben ontdekt, berichten van journalisten. Dat is de reden waarom ik op X blijf, ik ben meteen op de hoogte van nieuwe modellen en scoops. Zo kan ik bij Instabase meteen zeggen welk model we moeten vastpakken of wat we moeten testen. Maar zelf post ik al jaren niets meer op X, zeker geen foto’s. Ik heb nu een kindje van anderhalf jaar. Van mij mogen er geen foto’s van haar gepubliceerd worden op X, Instagram en andere sociale media. Elke foto die je deelt, kan worden gebruikt voor advertentiedoeleinden, zonder dat daar toestemming voor nodig is.
‘Iemand met slechte bedoelingen kan een kinderfoto op sociale media met AI laten bewerken tot de foto van een volwassene om in te breken’
“Zeker met de ontwikkelingen in gezichtsherkenning, vind ik dat scary. Stel dat iemand heel succesvol wordt en een mooi huis heeft, dan kan iemand met slechte bedoelingen zo’n kinderfoto op sociale media met AI laten bewerken tot de foto van een volwassene om in dat huis binnen te raken. Onze vingerafdrukken zijn uniek, daarom worden ze ook gebruikt om je biometrisch te identificeren. Maar als je vingers zichtbaar zijn op een foto, kan iemand je vingerafdruk nabootsen.”
U bent niet voor een van de grote Amerikaanse techbedrijven gaan werken, maar voor Instabase, een in 2015 opgericht bedrijf uit San Francisco. Waarom?
VAN LANDEGHEM. “Ik had een aantal opties. Dat het Instabase is geworden, komt door een succesvol project dat ik voor mijn doctoraat heb gedaan. Ik deed dat samen met enkele mensen die ik op een conferentie heb leren kennen, onder wie iemand van Instabase. Ik heb dat project mee voorgesteld op de hoofdzetel van Adobe in Silicon Valley, het bedrijf bekend van de pdf’s, en kon daar zelfs aan de slag gaan zonder dat ik hoefde te solliciteren. Maar in dat geval zou ik naar Californië moeten verhuizen. Dat wilde ik niet, omdat we net een huis hadden gekocht en een kindje hadden gekregen.
“Instabase is een even ambitieus bedrijf, dat alle ongestructureerde data wil vastpakken en vertalen naar een structuur. Dat kan gaan om documenten, maar ook om andere data. Instabase ontwikkelde een tool die het als een intelligente laag boven op datacollecties kan leggen. Als je iets wilt weten, stel je gewoon je vraag en je krijgt de info die je nodig hebt. Er werken zo’n 300 mensen voor Instabase. Ik werk gewoon vanuit Kessel. Ik ben zo’n twee maanden geleden begonnen, maar ben nog altijd niet op het hoofdkantoor in San Francisco geweest.”
Als u CEO van een Vlaamse kmo zou zijn, maar geen AI-achtergrond hebben, hoe zou u inspelen op AI om geen kansen te missen?
VAN LANDEGHEM. “Als ik in mijn kmo een voldoende groot aantal noodzakelijke administratieve taken met een vrij lage complexiteit had – dingen die mensen bij wijze van spreken tussen de soep en de patatten kunnen doen – dan zou ik kijken of ik er AI-oplossingen voor kon vinden. Zo hoef ik niet meer met die administratie bezig te zijn. Als we weer even teruggaan naar de verzekeringen – dat is nu eenmaal het beste voorbeeld – dan hoeven verzekeringsagenten zich niet meer met de administratie bezig te houden en kunnen ze hun tijd gebruiken voor de verzekeringspakketten die ze aanbieden. Misschien wil een klant iets laten schrappen dat hij niet nodig heeft in een polis, of net voor een meerprijs een andere clausule toevoegen.”
U blijft in Kessel wonen?
VAN LANDEGHEM. “Ja, we konden een huis met een kleine tuin in een doodlopende straat op de kop tikken. Het is elke maand schrikken als ik het bedrag voor de hypotheeklening van de bankrekening zie gaan. Het is geen klein bedrag, het is dus wel een risico dat we hebben genomen. Aan de andere kant, het is ook een home office op een rustige locatie. Voor ons wonen twee ezels, achter ons twee paarden. Voor mijn Amerikaanse collega’s is dat vreemd, omdat zoiets daar onbetaalbaar is.”
Uw collega’s denken dat u heel rijk bent?
VAN LANDEGHEM. “Zeker niet, de enige die rijk is, is de bank (lacht). Ik kom uit een arbeidersgezin, mijn ouders hebben niet gestudeerd. Ik ben de enige thuis die dat wel deed en ging meteen op kot in Leuven. Als ik in mijn eerste jaar ook maar één herexamen had gehad, dat was het gedaan met op kot zitten. Mijn ouders waren daar streng in, maar ik vond dat ook wel goed. Ik heb nooit een herexamen gehad. Vanaf mijn vijftiende heb ik gewerkt als jobstudent. Kratten sleuren bij een brouwer, het heeft mijn rug geen deugd gedaan. Later heb ik vier à vijf jaar in een Delhaize in de beenhouwerij gewerkt – préparé maken vond ik geweldig. Ik heb ook bij het Amerikaans Stockhuis gewerkt, dat tweedehands legermateriaal verkoopt. Daar heb ik geleerd dat ik kan verkopen. Ik bleek goed te zijn in technical sales, omdat ik altijd uitleg gaf met een bepaalde schwung en passie. Ik bleef vooral altijd mezelf.”
Aan de drempel van hun carrière
Ze zijn dit jaar gepromoveerd, staan aan het begin van hun professionele leven en zijn op de hoogte van de nieuwste inzichten in hun specialisatie. In deze zomerreeks laat Trends vier pas gepromoveerde doctors aan het woord over hun aspiraties en het potentieel van hun vakgebied.
Bio
31 jaar, woont in Kessel
2015: master taalkunde magna cum laude (KU Leuven)
2017: master advanced artificial intelligence (KU Leuven), begint na korte opdrachten bij Oracle en Nuance te werken bij contract.fit
2020: begint in overleg met contract.fit via een Baekeland-mandaat aan een doctoraat aan de KU Leuven
2024: wordt doctor in de ingenieurswetenschappen en gaat aan de slag bij het Amerikaanse techbedrijf Instabase
Fout opgemerkt of meer nieuws? Meld het hier