Een nieuwe goldrush
Bedrijven en overheden investeren jaarlijks miljarden euro’s in serverparken om meer en meer informatie op te slaan. Door een betere analyse van die enorme hoeveelheden gegevens hopen ze die investeringen dubbel en dik terug te verdienen.
De hoeveelheid informatie die de mensheid in 2011 zal produceren, past volgens een schatting van het onderzoeksbureau IDC in opdracht van IT-dienstenleverancier EMC op een harde schijf van 1,8 zettabyte. In bytes is dat 18 met 20 nullen erachter. Als je die informatie zou opslaan op iPads, dan heb je er meer dan 57,5 miljard van nodig. Met die tablet-pc’s kan je een berg maken van 94.400 meter, meer dan tien keer hoger dan Mount Everest. Door de explosieve groei van informatie zullen die cijfers binnen twee jaar verdubbelen. Ondertussen hinkt onze opslagcapaciteit achterop. Wetenschappers berekenden dat we voor 2007 slechts 295 exabyte (of 0,295 zettabyte) aan informatie konden opslaan op al onze media, gaande van papier tot harde schijven.
IDC verwacht dat binnen tien jaar het aantal servers om informatie op te slaan wereldwijd zal vertienvoudigen. Een reden voor die aangroei is de fors gedaalde kostprijs van computergeheugen en steeds verbeterende technologie om datacenters, die ‘ the cloud‘ in de lucht houden, efficiënter te beheren. Bovenal is een wapenwedloop bezig tussen bedrijven, waardoor jaarlijks wereldwijd honderden miljarden euro’s worden gespendeerd aan het bouwen of het huren van serverparken. Dat gebeurt omdat zaken zoals audio en video nu digitaal worden verspreid, maar ook omdat bedrijven geld willen verdienen met een betere ontsluiting van de massa’s gegevens ( big data) die ze opslaan.
Grote besparingen
Datamining heet de techniek om uit die enorme gegevensbestanden informatie te destilleren die bedrijven kunnen gebruiken om hun processen te verbeteren of om de voorkeuren van klanten beter te verstaan. De techniek bestaat al een tijd. Een uit de kluiten gewassen bedrijf heeft meestal al een ‘ Business Intelligence‘-afdeling. Maar de schaal waarop het nu gebeurt en de potentiële opbrengsten ervan zijn wel veel groter geworden. Zo maken onderzoekers van het consultancybedrijf McKinsey zich sterk dat het ontsluiten van big data in de Amerikaanse gezondheidssector meer dan 216 miljard euro aan besparingen oplevert. Europese overheden sparen volgens de onderzoekers zelfs 250 miljard uit.
Datamining wordt nu al toegepast door de sociale inspectie van de federale overheid. In een proefproject werden met behulp van die techniek potentiële gevallen van sociale fraude in de bouwsector geïdentificeerd. In 63 procent van die gerichte controles stelden inspecteurs effectief fraude vast. De traditionele fraudeopsporing levert slechts in een kwart van de gevallen resultaat op. Bovendien konden de inspecteurs het aantal dagen onderzoek per overtreding bij die gerichte controles met de helft terugdringen. Nu is de federale overheidsdienst Sociale Zekerheid van plan om de methode ook in andere sectoren toe te passen, zoals in de horeca.
Winkelketens zouden hun marges volgens McKinsey met liefst 60 procent optrekken doordat ze met die informatie hun processen verbeteren en veel gerichtere aanbiedingen aan hun klanten doen. In webbedrijven en in de telecomsector zijn die analyses al sterk ingeburgerd. Amerikaanse operatoren sturen bijvoorbeeld bij hernieuwingen van hun abonnementen speciale aanbiedingen naar klanten die veel last hebben van afgebroken gesprekken. Die klanten zijn namelijk erg geneigd bij het aflopen van het contract naar een andere operator over te stappen. In andere sectoren staat het gebruik van geavanceerde dataminingtechnieken nog in de kinderschoenen. Naast de schaalgrootte zijn er nog evoluties gaande in datamining. Zo gebeuren de analyses van die data veel sneller en zo goed als in real time, onder meer dankzij flexibelere technologieën zoals cloud computing. De navigatiespecialist TomTom kan zo op basis van anonieme data die rechtstreeks worden doorgestuurd van zijn gps-toestellen en via een samenwerking met gsm-operatoren weggebruikers altijd de meest recente verkeersinformatie aanbieden.
Orkanen en koekjes
Wal-Mart, de grootste supermarktketen ter wereld, is een pionier in het gebruik van datamining. In de VS heeft het concern al jaren een systeem dat leveranciers automatisch op de hoogte brengt wanneer de voorraden in een winkel te veel geslonken zijn. Zo worden klanten veel minder met lege rekken geconfronteerd. De keten gebruikt die informatie ook om te anticiperen op momenten waarop bepaalde producten opeens bijzonder in trek zijn. Dankzij datamining weet Wal-Mart bijvoorbeeld dat zijn klanten bij orkanen vooral een speciale soort koekjes en meer bier inslaan.
In België verspreidt de winkelketen Colruyt sinds oktober 2010 om de twee weken aan zijn 1,6 miljoen klanten een gepersonaliseerde folder. De distributeur uit Halle zegt dat zijn klanten daardoor meer ingaan op aanbiedingen, terwijl het bedrijf kan besparen op papier- en drukkosten. Groepen als Colruyt en Wal-Mart halen die informatie vooral uit de analyse van de informatie die ze via getrouwheidskaarten krijgen over hun klanten.
“Van onze 600 Belgische klanten hebben zeker twintig bedrijven meer dan een petabyte (1 miljoen gigabyte, nvdr.) aan gegevens”, zegt Geert Van Peteghem van EMC België. “Dat zijn de grotere datakritische bedrijven zoals telecomoperatoren en mediabedrijven, maar ook organisaties zoals de federale overheidsdienst Financiën voor haar Tax-on-web-toepassing. Bedrijven hebben zich altijd geconcentreerd op het verzamelen van een soort datakubus. Dat waren vrijwel steeds historische gegevens. Men keek achteruit om op die manier over langere termijn een meerwaarde te creëren. Nu gaat dat allemaal veel sneller.”
STIJN FOCKEDEY
Fout opgemerkt of meer nieuws? Meld het hier