Geld verdienen met big data blijkt moeilijker dan gedacht

SEPPE VANDEN BROUCKE "Data zijn niet als grondstoffen, die meteen geld opbrengen als je ze bovenhaalt." © Debby Termonia
Jozef Vangelder
Jozef Vangelder redacteur Trends

Big data hebben pas waarde als je ze weet te gebruiken. Die simpele waarheid heeft op het terrein al veel zweet en tranen gekost, aldus de Leuvense datawetenschapper Seppe vanden Broucke. Vandaag maakt artificiële intelligentie furore als bigdatatoepassing, en opnieuw dreigen veel bedrijven een blauwtje te lopen.

” Data, het nieuwe goud? Er doet veel marketingpraat de ronde”, zegt Seppe vanden Broucke, professor datawetenschappen aan de KU Leuven. “Data zijn niet als grondstoffen, die meteen geld opbrengen als je ze bovenhaalt. Je moet data eerst omzetten in nuttige kennis, en daar heb ik veel bedrijven op hun gezicht zien gaan. Ze lazen iets over big data in Forbes, kochten het eerste het beste softwarepakket, en verbrandden hun vingers.”

Dat komt omdat big data te veel tot de verbeelding sprak, en uitgroeide tot een hype, volgens Vanden Broucke. “Slimme verkopers stapten op bedrijven af en zeiden: ‘U hebt big data, en u wilt die gebruiken? Doe het dan zoals Yahoo en Google het doen, dan is het zeker goed.’ Yahoo en Google hadden eigen systemen ontworpen voor dataverwerking, en die vervolgens vrij beschikbaar gemaakt op het internet, als zogenoemde opensourcesoftware. De slimme verkopers herverpakten dat materiaal tot een eigen product en trokken de markt op. Maar voor veel bedrijven bleek het een serieuze miskoop. Hun oude databasesystemen werkten beter, en van hun aankoop hadden ze veel meer verwacht.”

Wat hadden ze dan verwacht?

SEPPE VANDEN BROUCKE. “Inzichten. Een simpel rapportje uitrollen, dat kon nog. Maar de echte data-analyse – voorspel eens welke klanten ik volgende maand zal verliezen – kon niet. Daarvoor was het herverpakte product te veel blijven steken in dataloodgieterij, de verwerking van grote hoeveelheden gegevens. Voor ondernemingen als Yahoo en Google was dat belangrijk, maar het viel niet altijd samen met wat het bedrijfsleven verwachtte. Het was een grote waarschuwing: big data is één ding, kennis halen uit big data is iets anders. Dat laatste is pas later gekomen, met systemen zoals Spark, ook gegroeid uit de opensourcegemeenschap. Spark is helemaal toegespitst op analyse, ook van kleinere hoeveelheden data. Voor veel bedrijven was dat een enorme verademing.”

Waarom?

VANDEN BROUCKE. “Je hoefde niet langer op een berg data te zitten om aan vruchtbare analyses te doen. Je hebt vooral slimme algoritmes en modellen nodig. Het komt altijd op hetzelfde neer: je hebt data, maar wat kun je ermee? Het hoeven niet eens je eigen gegevens te zijn. Veel data zijn ‘open’, of vrij verhandelbaar op de markt. Ook daarmee kun je aan de slag. Intussen hebben ook de slimme verkopers de bocht van big data naar data-analyse gemaakt. IBM, Hortonworks en Cloudera herverpakten Spark, en trokken opnieuw de boer op. Zelfs marktleider SAS, die tot dan toe vertrouwd had op eigen producten, is onlangs met een concurrent voor Spark op de proppen gekomen, Viya.”

Naar verluidt is ook de nieuwe generatie datawetenschappers enkel nog bezig met data-analyse.

VANDEN BROUCKE. “Dat geeft soms problemen op de werkvloer. Bij aanwerving is zo’n pas afgestudeerde datawetenschapper er vaak op gebrand het nieuwste algoritme of model uit te testen. Maar in een bedrijf is er vaak geen plaats voor lange experimenten. Voor het management gelden heel andere prioriteiten. Een model moet gemakkelijk te installeren, te bedienen en te onderhouden zijn, en een week of een maand later nog altijd werken. Om die reden maken vertrouwde namen als IBM en SAS kans op een revival. Managers hebben hun lesje geleerd, ze zullen niet meer op de nieuwste hype springen. Grote spelers als IBM en SAS mogen dan niet altijd mee zijn met de allernieuwste trends, hun modellen zijn wel betrouwbaar.”

Gaan daardoor geen kansen verloren? Zo’n jonge datawetenschapper kan toch goeie ideeën hebben?

VANDEN BROUCKE. “Zeker, maar zij tonen wat ze waard zijn via consultancy-opdrachten. Of ze schrijven een doctoraalscriptie, en richten samen met gelijkgezinden een bedrijfje op, om hun kennis te verzilveren. Maar nogmaals, bleeding edge-technologie is niet de grootste zorg van een bedrijf. Denk alleen nog maar aan de nieuwe Europese regels voor het gebruik van persoonlijke data, die volgend jaar van kracht worden. Daardoor krijgen bedrijven een pak verplichtingen, die ze moeten integreren in hun IT-systemen. Daarvoor ga je niet naar een start-up met twee man. Daarvoor moet je bij spelers als IBM en SAS zijn.”

Krijgen vertrouwde namen als IBM en SAS last van titanen als Amazon, Google en Microsoft, die zich almaar meer toeleggen op data-analyse?

VANDEN BROUCKE. “Amazon en Google focussen vooral op opslag van data in de cloud. Data-analyse nemen ze erbij, bovenop hun cloudplatform. Je ziet wel dat Google krachtige software voor data-analyse beschikbaar stelt in open source. Ook Microsoft is erg actief in de cloud en zet hard in op data-analyse, bijvoorbeeld via het aanbod van kleinschalige toepassingen. De marketingmanager kan zo een modelletje bouwen, een aantal data inladen, en daar wat inzichten uit halen, in een namiddag tijd voor enkele tientallen dollars. IBM en SAS daarentegen gaan voor zware projecten van miljoenen dollars, waar ze maandenlang aan werken, meestal samen met het IT-team van het bedrijf.”

De Amerikaanse internetreuzen en hun Chinese collega’s als Alibaba en Baidu investeren massaal in artificiële intelligentie, the next big thing in de wereld van big data. Zal dat de sector opnieuw door elkaar schudden?

VANDEN BROUCKE. “Nu spreek je over deep learning of zelflerende modellen. Dat is een vorm van artificiële intelligentie die data verwerkt met modellen geïnspireerd op het menselijke brein, bijvoorbeeld voor gezichtsherkenning of zelfrijdende auto’s. Tot nu toe blijft het vooral een aangelegenheid voor onderzoekers in laboratoria. Maar vergis u niet: artificiële intelligentie wordt de nieuwe hype in het bedrijfsleven. Het vertrouwde scenario zal zich herhalen. Je zal de slimme verkopers opnieuw zien opduiken, pronkend met veelbelovende deeplearningtoepassingen, die in werkelijkheid slecht in elkaar zitten. Bedrijven zullen zich daaraan verbranden, alweer.”

Maar ook die hype zal voorbijgaan. Als de ontgoochelingen verwerkt zijn, kan het echte werk beginnen.

VANDEN BROUCKE. “Uiteraard, de toestand zal zich na een tijd stabiliseren, zoals bij elke hype. Maar zover staan we nog niet. Net zoals big data destijds, lijken artificiële intelligentie en deep learning fantastische mogelijkheden te bieden. Bijna dagelijks verschijnen wetenschappelijke artikels die enorm tot de verbeelding spreken. Je kunt je voorstellen dat bij veel bedrijven het water in de mond loopt. ‘Dat moeten wij hebben, het is zo cool. We kunnen ons daarmee profileren.’ Je voelt vandaag de hype opborrelen. Maar opnieuw is de vraag: wat kun je ermee doen? Zijn er al toepassingen die zullen slagen op het terrein, waarmee geld te verdienen valt? Zelfrijdende wagens allicht, maar niet elk bedrijf zal die maken. Moet je nu investeren, of wacht je beter?”

Als het iets wordt met deep learning, zullen reuzen als Google en Alibaba de dienst uitmaken in de bigdatasector. Betekent dat gevaar voor oude waarden IBM en SAS?

VANDEN BROUCKE. “Zeker. IBM heeft bijna nog geen enkele deeplearningtoepassing, en SAS kan het technisch niet halen tegen andere projecten, zoals die van Microsoft en Google. Maar beide zijn zich ervan bewust dat de vraag naar zulke toepassingen zal stijgen. Alleen bekijken ze nog hoe ze deep learning in de markt zullen plaatsen met concrete toepassingen. De vraag is of ze in dat geval een inhaalbeweging zullen kunnen maken tegenover de vroege vogels. Maar IBM en SAS zullen zeker niet verdwijnen.

“De feitelijke strijd zal weer gestreden worden op de bedrijfsvloer. Deeplearningtoepassingen verschillen erg van de traditionele technologie. Ze zijn een hel voor de IT-afdeling van een bedrijf. Je krijgt dat gewoon niet geïnstalleerd. Op je eigen laptop gaat dat nog, omdat je dan volle vrijheid hebt. Maar een bedrijf is niet het Wilde Westen, je doet niet eender wat met het IT-systeem. Opnieuw, managers kijken in de eerste plaats naar betrouwbaarheid, gebruiksvriendelijkheid, gemakkelijk onderhoud, en ondersteuning bij defecten. Artificiële intelligentie, het klinkt heel cool. Maar bij de grote bedrijven moet ik nog altijd het eerste IT-team zien dat het met open armen ontvangt.”

De botsing met de praktijk

“Een telecomoperator had het perfecte algoritme aangeschaft om nieuwe, winstgevende klanten op te sporen”, vertelt Seppe vanden Broucke. “Maar toen de verkopers de klanten opbelden, vroegen die hoe de telecomoperator aan hun naam gekomen was. De verkopers moesten opbiechten dat de klanten uitgekozen waren door een computeralgoritme, dat naar hun gegevens gekeken had. Dat bleek een afknapper. Zo zie je dat big data in de praktijk om veel meer gaat dan een algoritme of een model.”

Vanden Broucke heeft een goed zicht op de praktijk. Hij is professor en coördinator van het Leuvense postgraduaat Big Data & Analytics, dat zich richt op mensen uit de bedrijfswereld. Data-analyse dient om antwoorden te geven. Maar een antwoord vereist een vraag. Dat blijkt de struikelsteen. “Veel bedrijven kochten een systeem voor data-analyse zonder te weten welk probleem ze wilden oplossen. Zoek je hoeveel brandstof je kunt besparen, of welke leeftijdscategorie van consumenten zich aangesproken zal voelen door je nieuwe product? Bedrijven schaften een datasysteem aan en dachten dat de inzichten er vanzelf zouden uitrollen. Maar zo gaat het niet.”

Vanden Broucke ziet almaar meer bedrijven een eigen datawetenschappelijk team opzetten. “Data-analyse is geen zaak van eenmalig een beroep doen op een consultant, en daarna hopen dat alles wel vanzelf zal lopen. Deskundigheid blijft nodig, en veel bedrijven bouwen die liever binnenshuis op. Want de consultant werkt vandaag in mijn bedrijf, maar gaat morgen naar een sectorgenoot. Wat garandeert dat het model dat hij voor mij heeft gebouwd, het mijne blijft?”

Voor banken, supermarktketens en andere grote bedrijven zijn big data niet meer weg te denken. De loodgieter om de hoek heeft er allicht geen boodschap aan. Waar ligt het omslagpunt? Hoe groot moet een bedrijf zijn om baat te hebben bij data-analyse? “Zelfs een loodgieter kan wat opsteken van eenvoudige databewerkingen. In welke gemeenten heeft hij veel klanten? Waar zit zijn concurrent hem op de hielen? Hoe zit het met de achterstallige betalingen? Op zijn beurt zal de iets grotere kmo al gebaat zijn met een geavanceerdere analyse. Denk bijvoorbeeld aan de screening van reacties op sociale media. Hoe reageren de klanten op mijn promotiecampagne? Zijn ze tevreden of roddelen ze, zodat ik snel moet reageren? Veel kmo’s kennen de mogelijkheden van data-analyse, maar vrezen dat ze te klein zijn om er rendement uit te halen. Begin daarom met kleine, afgelijnde projecten die al na korte tijd hun resultaat laten zien.”

De wereld digitaliseert razendsnel, waarbij sensoren in apparaten voortdurend data genereren, tot en met de smartphone in ieders broekzak. “Ieder bedrijf zal vroeg of laat met big data in contact komen. Blijf dus niet te lang hangen bij de vraag of data-analyse wel rendabel is. Maar ik geef toe, de slager die iedereen in de straat kent, heeft iets meer tijd.”

Fout opgemerkt of meer nieuws? Meld het hier

Partner Content