Op zoek naar goud in data
De hoeveelheid data neemt exponentieel toe. Volgens sommige bronnen verdubbelen de businessdata om de 1,2 jaar. We spreken niet meer over miljoenen gegevens, maar over miljarden. Gegevens van transacties via kredietkaarten, kastickets, overschrijvingen liggen al jaren slapend in reusachtige servers.
Sinds enkele jaren is daar nog een andere goudmijn bij gekomen. Miljarden gegevens zijn beschikbaar via je zoekprocessen op Google, via je leuke foto’s op Facebook en je super- belangrijke berichten op Twitter. Allemaal digitaal en dus potentieel ontsluitbaar, bestudeerbaar, analyseerbaar.
Maar er is meer. Voor elke klant die bij je koopt, zijn er vele klanten die niet bij je kopen. Sommigen hebben misschien wel geprobeerd. Ze hebben je website bezocht en hebben dan afgehaakt. Dat is ook zeer waardevolle informatie, misschien waardevoller dan de statistieken over je bestaande klanten.
De militaire wereld en de geheime diensten speuren in die miljarden bits en bytes naar verdachte patronen. Als u in hun vizier wil komen, dan moet u met een tiental vrienden uit verschillende landen afspreken om geregeld, het liefst in gebroken Engels, allerlei berichten naar elkaar te sturen waar een eenheid van tijd en plaats in voorkomt, het liefst een bekend groot gebouw en een symbolische datum. 11 september 2013 bijvoorbeeld, of iets met veel zessen, het duivelsgetal. Zorg er wel voor dat u geregeld vrij grote sommen naar elkaar overschrijft.
Marketeers hebben die goudmijn natuurlijk ook al lang gezien. Je kunt de ontvangsten aan de kassa van de bioscoop bij de lancering van de film al vrij nauwkeurig voorspellen op basis van het Twitter-verkeer voor de film in de bioscoop is.
Vlak na een ramp kan je de schade vrij goed beginnen in te schatten op basis van de boodschappen die mensen naar hun familie en vrienden sturen. Te midden van de paniek, de geblokkeerde wegen, de doden en gewonden blijven mensen berichten sturen. Denk maar aan Pukkelpop of de slachting door Anders Breivik in Noorwegen. Het meest geciteerde voorbeeld is de reactie van Walmart dat via zijn databases bij orkaan Katrina perfect kon volgen naar welke producten er abnormale vraag was, en zeer snel, en zeer menslievend kon reageren met reële hulp. Walmart heeft een slecht imago in de VS, maar die actie alleen al heeft veel schade aan dat imago kunnen herstellen.
De meningen onder experts zijn uiteraard verdeeld. Er is veel ophef gemaakt over de mogelijkheid om de verspreiding van een epidemie te voorspellen op basis van zoektermen in Yahoo! of Google. Maar blijkbaar bieden die modellen dan nauwelijks meerwaarde boven andere modellen. Maar misschien is het voldoende dat nu andere personen snel het uitbreken van een epidemie kunnen voorspellen dan diegenen die over die andere modellen beschikken. Als journalisten bijvoorbeeld snel toegang hebben tot die gegevens, wordt er sneller over gerapporteerd, kan sneller hulp worden gemobiliseerd enzovoort. In de moderne wereld betaat iets maar als het op tv is geweest, en misschien ligt daar al een grote impact.
Statisticus is meer dan ooit een beroep met toekomst. Grote bedrijven werven er tientallen aan. Hun weddes stijgen sneller dan de Griekse staatsschuld. En wees maar zeker dat overal ter wereld statistici de data exploreren om snel het nieuwe Griekenland te vinden. Niet simpel als je weet dat de overheidstekorten in Duitsland, Ierland en… België vol rekenfouten zitten.
De eerste studies die aantonen dat bedrijven die echt datagedreven beslissen tot 6 procent hoger rendement halen, zijn al verschenen. Dat is indrukwekkend. Wordt de toekomst van het management dan echt een datagedreven activiteit?
Maar waar schuilt het addertje in het gras? Bij communicatie. Je hebt twee groepen nodig die je goudmijnen aan informatie te lijf gaan. Eerst heb je de nerds nodig. De quants. Je hebt heel speciale methodologieën nodig om een database met 200 miljard data te lijf te gaan. Maar die analytici kennen niets van de business. Ze zoeken blind. En ze zullen altijd wel wat vinden. Daarom heb je mensen met inzicht in de business nodig. Die met echte klanten praten in een echte taal. En die twee groepen moeten dan op hun beurt met elkaar praten. De ‘dure’ jongens van de neurale netwerken, de polynomiale regressie en de dure computers, moeten praten met de verhalen vertellende experts, de mensen uit de field. Zonder een dialoog tussen die twee groepen krijg je betekenisloze cijfers en hopeloze kreten.
Het is zoals de piloot die een vliegtuig in moeilijke omstandigheden moet besturen. Hij (of zij) heeft eindeloze data ter beschikking. Maar het helpt af en toe toch wel even uit het raam te kijken.
De auteur is partner-hoogleraar management aan de Vlerick Leuven Gent Management School.
MARC BUELENS
De ‘dure’ jongens van de neurale netwerken, de polynomiale regressie en de dure computers, moeten praten met de verhalen vertellende experts, de mensen uit de field.
Fout opgemerkt of meer nieuws? Meld het hier