De verkiezing van de Amerikaanse president Donald Trump en de overwinning van het Leave-kamp tijdens het referendum over het Britse lidmaatschap van de Europese Unie, waren niet voorspeld in de klassieke opiniepeilingen. Het kleine Zuid-Afrikaanse bedrijf BrandsEye had het wel juist dat Donald Trump zou winnen en dat het Leave-kamp zou zegevieren. Het bedrijf analyseerde op sociale media zoals Twitter of mensen eerder een positief of een negatief sentiment lieten blijken in wat ze schreven over de brexit of Trump.

Het Antwerpse Textgain monitort elke dag wat over Belgische politici wordt gezegd op Twitter (zie infografiek Bart De Wever in poleposition). Het doet dat vooral om potentiële klanten uit te leggen wat met de taaltechnologie van de start-up mogelijk is, want het heeft geen politieke partijen onder zijn klanten. Klanten gebruiken de software van Textgain, dat tweets in meer dan vijftien talen kan analyseren, om uit te vlooien hoe hun merk overkomt of hoe op een nieuw product wordt gereageerd.

Een belangrijk verschil tussen de sentimentsanalyse via de sociale media en de klassieke peilingen is het ogenblik waarop de mensen worden aangesproken, zegt Guy De Pauw, de medeoprichter van Textgain. "In traditionele opiniepeilingen worden mensen bevraagd op een moment dat ze nog niet over het onderwerp hebben nagedacht. Als mensen iets op Facebook of Twitter plaatsen, hebben ze er wel over nagedacht en hebben ze hun opinie gevormd. Dat is het moment waarop wij meten."

Al geeft De Pauw meteen toe dat sentimentsanalyse ook nadelen heeft. Hoe representatief is het Twitter-publiek voor de bevolking? En hoe meet je sarcasme en ironie in een tweet, zodat het ironische 'Goed bezig, Politicus X' als een negatieve en niet als een positieve beoordeling wordt herkend?

Het verhaal achter de data

"Ook in het klassieke marktonderzoek wordt sentimentsanalyse steeds vaker gebruikt", zegt Tom Meere, de directeur van het onderzoeksbureau Why5Research. "De vraag is hoe het zit met de representativiteit. Op sociale media maak je een momentopname, terwijl bij een representatieve steekproef iedereen uit een bepaalde populatie evenveel kans moet maken om bevraagd te worden. Wij hebben ook geëxperimenteerd met artificiële intelligentie en bots, maar weinig computers kunnen een zinvolle inhoudsanalyse maken. In de contacten met bedrijven merk ik dat veel wordt geïnvesteerd in data, maar bedrijven zoeken vooral naar het verhaal achter die data."

"Weten dat 60 procent positief is over iets, 20 procent negatief en 20 procent neutraal, is op zich inderdaad niet zo interessant", zegt Guy De Pauw. "Tenzij je kunt achterhalen wie die personen zijn. Man of vrouw, jong of oud, hoger of lager opgeleid?" Textgain gebruikt taaltechnologie om op basis van de schrijfstijl van mensen te bepalen of iemand een jonge, hoger opgeleide vrouw of een oudere, lager opgeleide man is.

BrandsEye, dat de verkiezing van Trump en de brexit heeft voorspeld, werkt met een combinatie van technologische en menselijke analyse om de nauwkeurigheid te verhogen. Het laat eerst zijn algoritmes los op de sociale media, maar vervolgens stuurt het een representatief staal van die commentaren naar een crowdsourcingplatform. Daar analyseren mensen of een commentaar positief of negatief is.

Deep learning

Veeleer dan om de verkiezingsuitslag te voorspellen kunnen politici sentimentsanalyse gebruiken om uit te zoeken waar de zwevende kiezer zit, suggereert Guy De Pauw. Zit hij bijvoorbeeld vooral op Twitter of Instagram, of toch op Facebook? En welke onderwerpen houden hem bezig?

Voorlopig is sentimentsanalyse niet nauwkeurig genoeg om verkiezingen te voorspellen, zegt ook Pieter Van Tendeloo, digital marketing director van het digitaliserings- en socialemediabureau The Reference. Dat bedrijf gebruikt onder meer software voor sentimentsanalyse om snel negatieve feedback of buzz over bedrijven op te pikken. "Sentimentsanalyse is vooral bruikbaar om een zeer uitgesproken sentiment in kaart te brengen, maar heeft het een stuk moeilijker met ingetogen of genuanceerd sentiment", zegt Pieter Van Tendeloo. "Als we dat zouden toepassen op het politieke domein, vrees ik een beetje dat de resultaten kunstmatig nog meer gepolariseerd worden voorgesteld dan de realiteit."

The Reference gebruikt voor zijn sentimentsanalyse technologie van andere bedrijven, maar acht het plausibel dat het zelf deep-learningprojecten gaat ontwikkelen. Pieter Van Tendeloo verwacht dat die geavanceerde vorm van artificiële intelligentie nauwkeuriger onderzoek mogelijk maakt, ook voor verkiezingspeilingen. "Deep learning is in volle ontwikkeling en de kwaliteit van de algoritmes groeit snel. Daarom behoort het wel tot de mogelijkheden dat data-analyse - laat het ons zo even noemen, want ik weet niet of sentimentanalyse de juiste methode is om stemgedrag te voorspellen - de klassieke verkiezingsenquêtes kan vervangen."

Lizi helpt rekruteerders

Op het Antwerpse technologiefestival SuperNova stelde Guy De Pauw onlangs met Lizi een nieuw bedrijf voor, dat hij mee heeft opgericht. Voortbordurend op de taaltechnologie van Textgain ontwikkelde Lizi software voor de hr-sector. "Er bestaat heel wat software die kan kijken of iemands competenties passen bij een baan, maar er was nog niets voor soft skills. We hebben software ontwikkeld om mensen psychologisch te profileren op basis van hoe iemand schrijft. Door iemands cv en begeleidingsbrief te analyseren, kunnen we een vrij gedetailleerd persoonlijkheidsprofiel opstellen."