Data zijn vandaag alomtegenwoordig. Uw reisroutes, uw zoekopdrachten op het web, het functioneren van industriële robots: alles wordt gemeten en geanalyseerd. Data zijn er altijd geweest, maar nooit in zulke grote hoeveelheden. Volgens het marktonderzoeksbureau IDC zal de omvang van het digitale universum 180 zettabytes (180 gevolgd door 21 nullen) bedragen tegen 2025. Volgens IT-bedrijf Cisco zullen er in 2021 driemaal meer toestellen met het internet verbonden zijn dan er mensen rondlopen op aarde. Dat zal de datastroom alleen maar doen aanzwellen.
...

Data zijn vandaag alomtegenwoordig. Uw reisroutes, uw zoekopdrachten op het web, het functioneren van industriële robots: alles wordt gemeten en geanalyseerd. Data zijn er altijd geweest, maar nooit in zulke grote hoeveelheden. Volgens het marktonderzoeksbureau IDC zal de omvang van het digitale universum 180 zettabytes (180 gevolgd door 21 nullen) bedragen tegen 2025. Volgens IT-bedrijf Cisco zullen er in 2021 driemaal meer toestellen met het internet verbonden zijn dan er mensen rondlopen op aarde. Dat zal de datastroom alleen maar doen aanzwellen. Niet alleen de hoeveelheid, ook de aard van de data is veranderd. Het gaat al lang niet meer om klassieke persoonsgegevens, zoals leeftijd, geslacht en inkomen. De nieuwe economie draait om de analyse van binnenstromende, ongestructureerde data, zoals foto's en video's op sociale media, informatie van pendelaars op weg naar hun werk, of data van sensoren in vliegtuigmotoren, metro's en windturbines. Zelfs wc-brillen en broodroosters worden leveranciers van data. De wereld zal wemelen van sensoren verbonden met het internet, zodat mensen overal een digitaal spoor zullen achterlaten, ook al zitten ze zelf niet op het web. Ten slotte - en het belangrijkst - stijgt ook de waarde van data. Vroeger gebruikten Google en Facebook de data van hun gebruikers voor doelgerichte advertenties. De jongste jaren ontdekten ze dat data ook bruikbaar zijn in toepassingen van artificiële intelligentie, waarmee mogelijk geld te verdienen valt. Denk maar aan vertaling, gezichtsherkenning of de inschatting van iemands persoonlijkheid. Het zijn allemaal toepassingen die verkocht kunnen worden. Veel bedrijven proberen een plaatsje te veroveren op de markt van big data, maar technologiegiganten als Google, Facebook, Amazon en Apple gaan met de grootste brokken lopen. Dat komt omdat zij het meest profiteren van het netwerkeffect. Zij verzamelen data van hun gebruikers, waarmee ze hun dienstverlening verbeteren, waardoor ze nieuwe gebruikers aantrekken. Zo krijgen ze nog meer data binnen, waarmee ze hun dienstverlening opnieuw kunnen verbeteren, enzovoort. Hoe meer mensen commentaren schrijven, 'likes' uitdelen of boodschappen achterlaten op Facebook, hoe beter het sociaal netwerk zijn gebruikers leert kennen, en hoe meer het zijn diensten kan verfijnen en, uiteraard, zijn advertenties aanpassen. Die opwaartse spiraal speelt ook bij Google: hoe meer zoekopdrachten op het web, hoe beter de resultaten, en hoe meer gebruikers. Of kijk naar Tesla. Dat is een fabrikant van elektrische auto's, maar zijn nieuwste modellen verzamelen bergen data, waarmee Tesla zijn zelfrijdende algoritmes optimaliseert. Met de vernieuwde algoritmes past Tesla vervolgens zijn software aan. Uber van zijn kant is bij de meesten bekend voor zijn goedkope taxiritten. Maar zijn beurskapitalisatie van 68 miljard dollar is vooral te danken aan zijn immense databank van chauffeurs en passagiers. Wat niet betekent dat klassieke bedrijven achterop geraken in de wereld van big data. Het industrieel conglomeraat General Electric bijvoorbeeld ontwikkelde een systeem voor de controle van machines via het internet. Het systeem verzamelt tegelijk een heleboel gegevens over de machines, mengt die met andere data, en verfijnt daarmee algoritmes om elektriciteitscentrales beter te doen werken, om het onderhoud van vliegtuigmotoren beter te plannen, en zo meer. Big data lijken wel het nieuwe zwarte goud. De beurskapitalisatie van de internetreuzen overtreft ruimschoots die van de belangrijkste petroleumspelers (zie tabel). Maar er is een cruciaal onderscheid tussen olie en big data. In geldtermen is olie de meest verhandelde grondstof ter wereld. Big data daarentegen worden bijna niet verhandeld, toch niet voor geld. Het komt bedrijven meestal beter uit om data zelf te verzamelen, om ze daarna binnenshuis te houden en eigenhandig te verwerken. Want data zijn niet als grondstoffen. Elk vat olie gelijkt op een ander, maar iedere datastroom is verschillend, en daarom is hun waarde moeilijk met elkaar te vergelijken. Dat maakt het voor een koper moeilijk om de data te vinden die hij zoekt, en daar ook een prijs op te plakken. In de praktijk omzeilen bedrijven het prijszettingsprobleem door elkaar gewoonweg over te nemen, ook al draait de overname alleen om data. In 2015 telde het IT-bedrijf IBM 2 miljard dollar neer voor Weather Company, enkel om de hand te leggen op een massa weergegevens en de weerstations die ze verzamelden. Maar dat is nog niet alles. Een vat olie kan maar één keer gebruikt worden. Data daarentegen kunnen gekopieerd en gebruikt worden door meer dan één persoon of bedrijf tegelijk. Dat maakt het gemakkelijker om data te gebruiken voor andere doeleinden dan overeengekomen. En het kan bovendien verwarring scheppen over eigendom. Wie bezit de data verzameld door zelfrijdende auto's? De producent van de auto, de leverancier van de sensoren, de passagier of - op termijn - de auto zelf? Daarom is datahandel vaak bilateraal en ad hoc, gegoten in ingewikkelde contracten van tientallen pagina's. Voor persoonlijke data liggen de zaken nog moeilijker. In een ideale wereld was er een gereguleerde markt ontstaan voor de koop en verkoop van persoonlijke informatie, waar de verkoper het recht heeft om te bepalen hoeveel gegevens hij kwijt wil. De werkelijkheid ziet er compleet anders uit. Particulieren geven maar al te graag persoonlijke info weg aan de internetreuzen, in ruil voor gratis diensten. Beide partijen zitten vast in een vreemde omhelzing. Particulieren weten niet hoeveel hun persoonlijke gegevens waard zijn, en voelen zich machteloos bij de onleesbare 'terms and conditions'. Dat laat hen weinig andere keuzes dan het hokje 'I agree' aan te vinken. De internetreuzen van hun kant zijn verslaafd geworden aan de gratis persoonsdata, en hebben geen belang bij verandering. Betaling voor de data en de bouw van systemen om elke bijdrage te traceren zouden hun winsten flink aanvreten. Slotsom: de data-economie lijdt aan een gebrekkige marktwerking. Dat heeft zware economische kosten. Er ontstaan niet alleen monopolies (zie kader De nieuwe machthebbers), maar we missen ook kansen. Als voor digitale informatie niet betaald wordt, wie zal dan nog waardevolle data willen creëren? En als data vast blijven zitten bij enkele bedrijven, blijft veel potentiële maar verscholen waarde allicht onontgonnen. Want de internetreuzen zijn dan wel machtig, ze hebben geen monopolie op innovatie. Misschien hebben andere bedrijven slimmere datatoepassingen. De nieuwe economie is daarom geen betere economie. The Economist, Christophe Charlot