Ieder zijn berg big data

18/09/14 om 10:26 - Bijgewerkt om 10:26

Veiligheid is slechts een van de aandachtspunten voor bedrijven en overheden nu ze meer gevoelige gegevens in de cloud stoppen. De risico's van onlineopslag wegen meestal niet op tegen de voordelen, zeker nu men de stroom aan informatie beter wil analyseren.

Ieder zijn berg big data

© Belga

Begin septembe raakte bekend dat hackers intieme foto's hadden ontfutseld van een rist Hollywoodsterren. De sterren gebruikten Apple, Dropbox of andere populaire diensten om foto's en filmpjes online op te slaan die ze met hun smartphone hadden genomen. Die onlinereserveopslag heeft in theorie een robuuste beveiliging, maar in de praktijk is die slechts zo sterk als zijn zwakste schakel. In dit geval zijn gebrekkige procedures waarschijnlijk de boosdoener. Die staan eigenlijk los van de beveiligingstechnologie. Bedrijven lopen niet het risico letterlijk in hun blootje te worden gezet door datalekken via de cloud. Maar de reputatieschade is minstens even aanzienlijk en de commerciële verliezen vaak nog groter.

Zeker nu meer bedrijfsgevoelige gegevens online worden opgeslagen. De hoeveelheid data is meestal wel nog op een lokale computer op te slaan, maar opslag in de cloud is vaak de meest efficiënte manier om een voortdurende stroom aan informatie te laten analyseren. "Bedrijven moeten toch opletten", waarschuwt professor Bart Baesens van de KU Leuven. Hij is gespecialiseerd in datamining en bracht deze zomer een boek uit over die geavanceerde data-analysetechnieken. "Elk bedrijf zit op een berg informatie die almaar sneller aangroeit. De inzichten die men in die berg van big data vindt, zijn veel geld waard. Bedrijven moeten zorgvuldig omspringen met die informatie. In hun plaats zou ik toch goed nadenken of ik die cruciale data toevertrouw aan Amazon of andere populaire buitenlandse cloudaanbieders. Het is beter de onlineopslag zelf te beheren of te werken met een betrouwbare lokale partner."

Als bedrijven al een betrouwbare infrastructuur hebben, dan missen ze vaak gekwalificeerd talent om die big data te analyseren.

Bart Baessens: "Toch moeten ze die expertise binnenhalen. Door de data-analyse uit te besteden aan een externe partij is er altijd het risico dat die waardevolle inzichten ook aan concurrenten worden doorgegeven. Zo gooien bedrijven hun competitieve voordeel te grabbel. In de VS bestaat het besef al meer dat data-analyse een strategische activiteit is. Grote Amerikaanse bedrijven hebben al een CAO, chief analytics officer."

Welke vaardigheden moeten die experts in big data hebben?

Bart Baessens: "Zij moeten kunnen programmeren. Daarnaast moeten ze wiskundig en statistisch onderlegd zijn. Het is ook nodig dat ze voldoende voeling hebben met de bedrijfsactiviteiten. Iemand die voor een bank het risico op wanbetaling door klanten inschat, weet bijvoorbeeld het best hoe een hypotheek in elkaar zit. Er komt ook veel creativiteit bij kijken. De oplossingen liggen niet zomaar voor het rapen."

De datawetenschappers ook niet. In de VS zijn ze zo begeerd dat ze gemakkelijk 200.000 euro per jaar kunnen verdienen.

Bart Baessens:"Het zijn inderdaad zeer zeldzame profielen. Het hoger onderwijs moet de hand een beetje in eigen boezem steken. Er zijn hier nog geen volledige gespecialiseerde opleidingen, maar wie bijvoorbeeld handelsingenieur in de beleidsinformatica studeert, kan door een aantal keuzevakken te volgen toch als datawetenschapper gevormd worden. In Leuven kiezen jaarlijks vijftien studenten voor die optie. We moeten er meer kunnen overtuigen. De meeste andere studenten worden afgeschrikt door het programmeerwerk. Het lijkt moeilijk en saai. Het is niet gemakkelijk, maar saai is het niet."

"Ik ken bijvoorbeeld een Europees farmabedrijf dat beter de bijwerkingen van zijn medicijnen in kaart wilde brengen. In plaats van nog meer dure tests in labo's uit te voeren, analyseerde men eerst wat mensen over hun medicijnen vertelden op sociaalnetwerksites. Die screening op klachten doen ze nu voortdurend. De overheid gebruikt gesofisticeerde data-analyse om netwerken van socialezekerheidsfraude op te sporen. De effectiviteit van de controles stijgt daardoor tot 20 procent. Dit zijn slechts enkele voorbeelden waar datamining het verschil maakt."

Zijn er naast mensen en infrastructuur nog andere obstakels?

Bart Baessens: "Alles staat of valt met de kwaliteit van de data. Zelfs de beste chef kan geen goed gerecht maken met slechte ingrediënten. De data mogen zo weinig mogelijk hiaten en andere onregelmatigheden bevatten. Sommige zaken kunnen worden verholpen met statistische trucjes, maar het is beter het probleem bij de wortel aan te pakken. De afgelopen tien jaar hebben bedrijven, ook in België, zwaar geïnvesteerd in platformen om data op te slaan en te beheren. Nu ligt de klemtoon op analyse en is de kwaliteit van data zeker een prioriteit."

Kmo's kunnen zich vaak zulke investeringen niet veroorloven.

Bart Baessens: "Een oplossing op maat is duur, maar er zijn ondertussen al kant-en-klare pakketten om bepaalde soorten gegevens te analyseren. Een van de bekendste diensten is Google Analytics, waar men het verkeer op websites kan analyseren. Dat is bijzonder nuttig, zeker voor kmo's. Ze kunnen onder meer zien hoe klanten op hun website komen, welke pagina's er worden bezocht en hoe goed ze scoren op relevante zoekwoorden."

Prof. Bart Baesens, Analytics in a Big Data World: The Essential Guide to Data Science and its Applications, uitgegeven bij Wiley.

Lees meer over:

Onze partners