" Data, het nieuwe goud? Er doet veel marketingpraat de ronde", zegt Seppe vanden Broucke, professor datawetenschappen aan de KU Leuven. "Data zijn niet als grondstoffen, die meteen geld opbrengen als je ze bovenhaalt. Je moet data eerst omzetten in nuttige kennis, en daar heb ik veel bedrijven op hun gezicht zien gaan. Ze lazen iets over big data in Forbes, kochten het eerste het beste softwarepakket, en verbrandden hun vingers."
...

" Data, het nieuwe goud? Er doet veel marketingpraat de ronde", zegt Seppe vanden Broucke, professor datawetenschappen aan de KU Leuven. "Data zijn niet als grondstoffen, die meteen geld opbrengen als je ze bovenhaalt. Je moet data eerst omzetten in nuttige kennis, en daar heb ik veel bedrijven op hun gezicht zien gaan. Ze lazen iets over big data in Forbes, kochten het eerste het beste softwarepakket, en verbrandden hun vingers." Dat komt omdat big data te veel tot de verbeelding sprak, en uitgroeide tot een hype, volgens Vanden Broucke. "Slimme verkopers stapten op bedrijven af en zeiden: 'U hebt big data, en u wilt die gebruiken? Doe het dan zoals Yahoo en Google het doen, dan is het zeker goed.' Yahoo en Google hadden eigen systemen ontworpen voor dataverwerking, en die vervolgens vrij beschikbaar gemaakt op het internet, als zogenoemde opensourcesoftware. De slimme verkopers herverpakten dat materiaal tot een eigen product en trokken de markt op. Maar voor veel bedrijven bleek het een serieuze miskoop. Hun oude databasesystemen werkten beter, en van hun aankoop hadden ze veel meer verwacht." SEPPE VANDEN BROUCKE. "Inzichten. Een simpel rapportje uitrollen, dat kon nog. Maar de echte data-analyse - voorspel eens welke klanten ik volgende maand zal verliezen - kon niet. Daarvoor was het herverpakte product te veel blijven steken in dataloodgieterij, de verwerking van grote hoeveelheden gegevens. Voor ondernemingen als Yahoo en Google was dat belangrijk, maar het viel niet altijd samen met wat het bedrijfsleven verwachtte. Het was een grote waarschuwing: big data is één ding, kennis halen uit big data is iets anders. Dat laatste is pas later gekomen, met systemen zoals Spark, ook gegroeid uit de opensourcegemeenschap. Spark is helemaal toegespitst op analyse, ook van kleinere hoeveelheden data. Voor veel bedrijven was dat een enorme verademing." VANDEN BROUCKE. "Je hoefde niet langer op een berg data te zitten om aan vruchtbare analyses te doen. Je hebt vooral slimme algoritmes en modellen nodig. Het komt altijd op hetzelfde neer: je hebt data, maar wat kun je ermee? Het hoeven niet eens je eigen gegevens te zijn. Veel data zijn 'open', of vrij verhandelbaar op de markt. Ook daarmee kun je aan de slag. Intussen hebben ook de slimme verkopers de bocht van big data naar data-analyse gemaakt. IBM, Hortonworks en Cloudera herverpakten Spark, en trokken opnieuw de boer op. Zelfs marktleider SAS, die tot dan toe vertrouwd had op eigen producten, is onlangs met een concurrent voor Spark op de proppen gekomen, Viya." VANDEN BROUCKE. "Dat geeft soms problemen op de werkvloer. Bij aanwerving is zo'n pas afgestudeerde datawetenschapper er vaak op gebrand het nieuwste algoritme of model uit te testen. Maar in een bedrijf is er vaak geen plaats voor lange experimenten. Voor het management gelden heel andere prioriteiten. Een model moet gemakkelijk te installeren, te bedienen en te onderhouden zijn, en een week of een maand later nog altijd werken. Om die reden maken vertrouwde namen als IBM en SAS kans op een revival. Managers hebben hun lesje geleerd, ze zullen niet meer op de nieuwste hype springen. Grote spelers als IBM en SAS mogen dan niet altijd mee zijn met de allernieuwste trends, hun modellen zijn wel betrouwbaar." VANDEN BROUCKE. "Zeker, maar zij tonen wat ze waard zijn via consultancy-opdrachten. Of ze schrijven een doctoraalscriptie, en richten samen met gelijkgezinden een bedrijfje op, om hun kennis te verzilveren. Maar nogmaals, bleeding edge-technologie is niet de grootste zorg van een bedrijf. Denk alleen nog maar aan de nieuwe Europese regels voor het gebruik van persoonlijke data, die volgend jaar van kracht worden. Daardoor krijgen bedrijven een pak verplichtingen, die ze moeten integreren in hun IT-systemen. Daarvoor ga je niet naar een start-up met twee man. Daarvoor moet je bij spelers als IBM en SAS zijn." VANDEN BROUCKE. "Amazon en Google focussen vooral op opslag van data in de cloud. Data-analyse nemen ze erbij, bovenop hun cloudplatform. Je ziet wel dat Google krachtige software voor data-analyse beschikbaar stelt in open source. Ook Microsoft is erg actief in de cloud en zet hard in op data-analyse, bijvoorbeeld via het aanbod van kleinschalige toepassingen. De marketingmanager kan zo een modelletje bouwen, een aantal data inladen, en daar wat inzichten uit halen, in een namiddag tijd voor enkele tientallen dollars. IBM en SAS daarentegen gaan voor zware projecten van miljoenen dollars, waar ze maandenlang aan werken, meestal samen met het IT-team van het bedrijf." VANDEN BROUCKE. "Nu spreek je over deep learning of zelflerende modellen. Dat is een vorm van artificiële intelligentie die data verwerkt met modellen geïnspireerd op het menselijke brein, bijvoorbeeld voor gezichtsherkenning of zelfrijdende auto's. Tot nu toe blijft het vooral een aangelegenheid voor onderzoekers in laboratoria. Maar vergis u niet: artificiële intelligentie wordt de nieuwe hype in het bedrijfsleven. Het vertrouwde scenario zal zich herhalen. Je zal de slimme verkopers opnieuw zien opduiken, pronkend met veelbelovende deeplearningtoepassingen, die in werkelijkheid slecht in elkaar zitten. Bedrijven zullen zich daaraan verbranden, alweer." VANDEN BROUCKE. "Uiteraard, de toestand zal zich na een tijd stabiliseren, zoals bij elke hype. Maar zover staan we nog niet. Net zoals big data destijds, lijken artificiële intelligentie en deep learning fantastische mogelijkheden te bieden. Bijna dagelijks verschijnen wetenschappelijke artikels die enorm tot de verbeelding spreken. Je kunt je voorstellen dat bij veel bedrijven het water in de mond loopt. 'Dat moeten wij hebben, het is zo cool. We kunnen ons daarmee profileren.' Je voelt vandaag de hype opborrelen. Maar opnieuw is de vraag: wat kun je ermee doen? Zijn er al toepassingen die zullen slagen op het terrein, waarmee geld te verdienen valt? Zelfrijdende wagens allicht, maar niet elk bedrijf zal die maken. Moet je nu investeren, of wacht je beter?" VANDEN BROUCKE. "Zeker. IBM heeft bijna nog geen enkele deeplearningtoepassing, en SAS kan het technisch niet halen tegen andere projecten, zoals die van Microsoft en Google. Maar beide zijn zich ervan bewust dat de vraag naar zulke toepassingen zal stijgen. Alleen bekijken ze nog hoe ze deep learning in de markt zullen plaatsen met concrete toepassingen. De vraag is of ze in dat geval een inhaalbeweging zullen kunnen maken tegenover de vroege vogels. Maar IBM en SAS zullen zeker niet verdwijnen. "De feitelijke strijd zal weer gestreden worden op de bedrijfsvloer. Deeplearningtoepassingen verschillen erg van de traditionele technologie. Ze zijn een hel voor de IT-afdeling van een bedrijf. Je krijgt dat gewoon niet geïnstalleerd. Op je eigen laptop gaat dat nog, omdat je dan volle vrijheid hebt. Maar een bedrijf is niet het Wilde Westen, je doet niet eender wat met het IT-systeem. Opnieuw, managers kijken in de eerste plaats naar betrouwbaarheid, gebruiksvriendelijkheid, gemakkelijk onderhoud, en ondersteuning bij defecten. Artificiële intelligentie, het klinkt heel cool. Maar bij de grote bedrijven moet ik nog altijd het eerste IT-team zien dat het met open armen ontvangt."