'Zelfs de psychologen moeten AI beginnen te vrezen'

AI heeft nog een grote weg af te leggen. De molen maalt langzaam, maar hij blijft wel malen. Lees de column van Marc Buelens.

Het is een kwestie van tijd eer Artificiële Intelligentie (met hoofdletters) alle metingen door psychologen heeft overgenomen. Elk testresultaat, elk gesprek – ja, ook elk zogenaamd diepte-interview – resulteert vroeg of laat in een meting en een rapport. Oh ja, alleen een ervaren psycholoog kan die ‘metingen’ interpreteren, en zolang je dat gelooft, geloof je ook dat een dokter je kan vertellen aan welke ziekte je lijdt door naar je tong of naar je voetzolen te kijken.

Academisch psychologen geloven al langer in de kracht van een echte meting en niet in de blabla van bijvoorbeeld een freudiaanse psychoanalyse. Net zoals we voor de diagnose diabetes liever een analyse van het laboratorium zien, dan het oordeel van de Chinese wijze die onze tong bestudeert. Dat is natuurlijk allemaal een kwestie van smaak. Als u goede ervaringen hebt met uw freudiaanse therapeut of uw Chinese tongdeskundige, vergeet dan vooral niet dat het geloof in de arts ook belangrijk kan zijn.

Maar zal ChatGPT ooit de psycholoog kunnen vervangen? Een groep Amerikaanse academici heeft het voor u uitgezocht. De vraag is niet: zal het ooit kunnen? Maar wel: kan het nu al? Duizenden studenten werden in een gecontroleerde situatie op de goede ouderwetse manier bestookt met de crème de la crème van de gevalideerde persoonlijkheidsvragenlijsten. Ze mochten ook online een open gesprekje voeren met een AI-chatbox. De onderzoekers beschikten over echte schoolresultaten van de studenten.

Wat leverde die eerste grootschalige studie op? De AI doet het nog zo slecht niet. De resultaten zijn eenvoudig samen te vatten. De metingen zijn vrij betrouwbaar, in ieder geval veel betrouwbaarder dan de vragenlijstjes die u ijverig invult in uw weekblad of bij een weinig scrupuleus selectiekantoor. De AI-metingen correleren vrij sterk met de beste vragenlijsten. Wel correleren ze niet hoog met de echte studieresultaten. Maar dat doen de ernstige, goed gevalideerde vragenlijsten ook niet. Het is en blijft moeilijk het gedrag van mensen goed te voorspellen. De AI-metingen bleken wel iets aanvullends te meten. Het resultaat was beter mét dan zonder AI.

Voorts waren de metingen te weinig onafhankelijk. De deelschalen die AI produceerde, voldeden echt niet aan wat je mag verwachten van zulke schalen. Met dat probleem hebben overigens ook menselijke psychologen tientallen jaren geworsteld. Kort door de bocht: de besten in taalvlotheid zijn gemiddeld genomen ook de besten in analyse, nauwkeurigheid en andere metingen. Dat is contra-intuïtief, maar besef vooral dat echt domme mensen zowat over de hele lijn dom zijn, en slimme mensen zowat op alle gebieden slim. Een Vlaamse topwiskundige spreekt meestal ook wel een aardig mondje Engels.

Ik rapporteer hier wetenschappelijk onderzoek. AI heeft nog een grote weg af te leggen. De molen maalt langzaam, maar hij blijft wel malen. Merk toch twee dingen op: hoe snel men al grondige studies heeft opgezet, en hoe veelbelovend de eerste resultaten al zijn. Moeten selectiebureaus voor hun toekomst vrezen? Nog niet. Maar ze mogen toch best alert zijn voor de manier waarop chatboxen data halen uit onschuldig ogende gesprekken. Je kunt natuurlijk de wereld blijven vertellen dat jij de enige bent die bekwaam is om de resultaten van zo’n AI-analyse te interpreteren, maar met dat verhaaltje blijf je niet wegkomen. Te veel klanten zullen aan ChatGPT vragen wat de meerwaarde van zulke ‘klinische’ praatjes is.

De auteur is professor-emeritus aan de Vlerick Business School. Volg mij op www.marcbuelens.com.

Lees meer over: