Data zijn vandaag alomtegenwoordig. Uw reisroutes, uw zoekopdrachten op het web, het functioneren van industriële robots: alles wordt gemeten en geanalyseerd. Data zijn er altijd geweest, maar nooit in zulke grote hoeveelheden. Volgens het marktonderzoeksbureau IDC zal de omvang van het digitale universum 180 zettabytes (180 gevolgd door 21 nullen) bedragen tegen 2025. Volgens IT-bedrijf Cisco zullen er in 2021 driemaal meer toestellen met het internet verbonden zijn dan er mensen rondlopen op aarde. Dat zal de datastroom alleen maar doen aanzwellen.

Niet alleen de hoeveelheid, ook de aard van de data is veranderd. Het gaat al lang niet meer om klassieke persoonsgegevens, zoals leeftijd, geslacht en inkomen. De nieuwe economie draait om de analyse van binnenstromende, ongestructureerde data, zoals foto's en video's op sociale media, informatie van pendelaars op weg naar hun werk, of data van sensoren in vliegtuigmotoren, metro's en windturbines. Zelfs wc-brillen en broodroosters worden leveranciers van data. De wereld zal wemelen van sensoren verbonden met het internet, zodat mensen overal een digitaal spoor zullen achterlaten, ook al zitten ze zelf niet op het web.

Ten slotte - en het belangrijkst - stijgt ook de waarde van data. Vroeger gebruikten Google en Facebook de data van hun gebruikers voor doelgerichte advertenties. De jongste jaren ontdekten ze dat data ook bruikbaar zijn in toepassingen van artificiële intelligentie, waarmee mogelijk geld te verdienen valt. Denk maar aan vertaling, gezichtsherkenning of de inschatting van iemands persoonlijkheid. Het zijn allemaal toepassingen die verkocht kunnen worden.

Zelfversterkende netwerken

Veel bedrijven proberen een plaatsje te veroveren op de markt van big data, maar technologiegiganten als Google, Facebook, Amazon en Apple gaan met de grootste brokken lopen. Dat komt omdat zij het meest profiteren van het netwerkeffect. Zij verzamelen data van hun gebruikers, waarmee ze hun dienstverlening verbeteren, waardoor ze nieuwe gebruikers aantrekken. Zo krijgen ze nog meer data binnen, waarmee ze hun dienstverlening opnieuw kunnen verbeteren, enzovoort.

Hoe meer mensen commentaren schrijven, 'likes' uitdelen of boodschappen achterlaten op Facebook, hoe beter het sociaal netwerk zijn gebruikers leert kennen, en hoe meer het zijn diensten kan verfijnen en, uiteraard, zijn advertenties aanpassen. Die opwaartse spiraal speelt ook bij Google: hoe meer zoekopdrachten op het web, hoe beter de resultaten, en hoe meer gebruikers.

Wie bezit de data verzameld door zelfrijdende auto's? De producent van de auto, de leverancier van de sensoren, de passagier of de auto zelf?

Of kijk naar Tesla. Dat is een fabrikant van elektrische auto's, maar zijn nieuwste modellen verzamelen bergen data, waarmee Tesla zijn zelfrijdende algoritmes optimaliseert. Met de vernieuwde algoritmes past Tesla vervolgens zijn software aan. Uber van zijn kant is bij de meesten bekend voor zijn goedkope taxiritten. Maar zijn beurskapitalisatie van 68 miljard dollar is vooral te danken aan zijn immense databank van chauffeurs en passagiers.

Wat niet betekent dat klassieke bedrijven achterop geraken in de wereld van big data. Het industrieel conglomeraat General Electric bijvoorbeeld ontwikkelde een systeem voor de controle van machines via het internet. Het systeem verzamelt tegelijk een heleboel gegevens over de machines, mengt die met andere data, en verfijnt daarmee algoritmes om elektriciteitscentrales beter te doen werken, om het onderhoud van vliegtuigmotoren beter te plannen, en zo meer.

Moeizame handel

Big data lijken wel het nieuwe zwarte goud. De beurskapitalisatie van de internetreuzen overtreft ruimschoots die van de belangrijkste petroleumspelers (zie tabel). Maar er is een cruciaal onderscheid tussen olie en big data. In geldtermen is olie de meest verhandelde grondstof ter wereld. Big data daarentegen worden bijna niet verhandeld, toch niet voor geld. Het komt bedrijven meestal beter uit om data zelf te verzamelen, om ze daarna binnenshuis te houden en eigenhandig te verwerken.

Want data zijn niet als grondstoffen. Elk vat olie gelijkt op een ander, maar iedere datastroom is verschillend, en daarom is hun waarde moeilijk met elkaar te vergelijken. Dat maakt het voor een koper moeilijk om de data te vinden die hij zoekt, en daar ook een prijs op te plakken.

In de praktijk omzeilen bedrijven het prijszettingsprobleem door elkaar gewoonweg over te nemen, ook al draait de overname alleen om data. In 2015 telde het IT-bedrijf IBM 2 miljard dollar neer voor Weather Company, enkel om de hand te leggen op een massa weergegevens en de weerstations die ze verzamelden.

Maar dat is nog niet alles. Een vat olie kan maar één keer gebruikt worden. Data daarentegen kunnen gekopieerd en gebruikt worden door meer dan één persoon of bedrijf tegelijk. Dat maakt het gemakkelijker om data te gebruiken voor andere doeleinden dan overeengekomen. En het kan bovendien verwarring scheppen over eigendom. Wie bezit de data verzameld door zelfrijdende auto's? De producent van de auto, de leverancier van de sensoren, de passagier of - op termijn - de auto zelf? Daarom is datahandel vaak bilateraal en ad hoc, gegoten in ingewikkelde contracten van tientallen pagina's.

De markt werkt niet

Voor persoonlijke data liggen de zaken nog moeilijker. In een ideale wereld was er een gereguleerde markt ontstaan voor de koop en verkoop van persoonlijke informatie, waar de verkoper het recht heeft om te bepalen hoeveel gegevens hij kwijt wil. De werkelijkheid ziet er compleet anders uit. Particulieren geven maar al te graag persoonlijke info weg aan de internetreuzen, in ruil voor gratis diensten.

Beide partijen zitten vast in een vreemde omhelzing. Particulieren weten niet hoeveel hun persoonlijke gegevens waard zijn, en voelen zich machteloos bij de onleesbare 'terms and conditions'. Dat laat hen weinig andere keuzes dan het hokje 'I agree' aan te vinken. De internetreuzen van hun kant zijn verslaafd geworden aan de gratis persoonsdata, en hebben geen belang bij verandering. Betaling voor de data en de bouw van systemen om elke bijdrage te traceren zouden hun winsten flink aanvreten.

Slotsom: de data-economie lijdt aan een gebrekkige marktwerking. Dat heeft zware economische kosten. Er ontstaan niet alleen monopolies (zie kader De nieuwe machthebbers), maar we missen ook kansen. Als voor digitale informatie niet betaald wordt, wie zal dan nog waardevolle data willen creëren? En als data vast blijven zitten bij enkele bedrijven, blijft veel potentiële maar verscholen waarde allicht onontgonnen. Want de internetreuzen zijn dan wel machtig, ze hebben geen monopolie op innovatie. Misschien hebben andere bedrijven slimmere datatoepassingen. De nieuwe economie is daarom geen betere economie.

De nieuwe machthebbers

De internetreuzen worden almaar dominanter. Amazon neemt de helft van alle onlinebetalingen in de VS voor zijn rekening. Google en Facebook waren in de VS samen goed voor het overgrote deel van de omzetgroei in digitale publiciteit vorig jaar. De roep weerklinkt om de internetreuzen op te breken in kleinere bedrijven. Maar omvang is geen misdrijf. De consumenten doen trouwens geen slechte zaak. Wie kan vandaag nog leven zonder de gratis diensten van Google of Facebook?

Toch moeten we ons zorgen maken. De controle over onze gegevens geeft de internetreuzen enorm veel macht. De internetreuzen kunnen meer gebruikersdata verzamelen, zodat ze betere diensten kunnen leveren, en nog meer gebruikers kunnen aantrekken. Zo houden ze mogelijke concurrenten op een afstand. Gevaar voor nieuwkomers die met revolutionaire technologie of concepten de markt overrompelen, is er niet. Het detectiesysteem van de internetreuzen overspant de hele economie: Google ziet wat mensen zoeken, Facebook wat ze delen, en Amazon wat ze kopen. Een succesvol nieuw product of dienst merken de reuzen meteen op, en snijden het de pas af, door het te kopiëren of simpelweg op te kopen.

De mededingingsautoriteiten moeten nieuwe remedies vinden om de concurrentie intact te houden. Bij de goedkeuring van een overname moeten ze niet alleen marktaandelen in rekening brengen, maar ook het gewicht van de data in handen van de betrokken bedrijven. En als een gevestigde speler een potentiële rivaal opkoopt, kan de overnameprijs dienen als alarmsignaal. Facebook telde liefst 22 miljard dollar neer voor WhatsApp, dat amper inkomsten had en nog geen 60 werknemers telde.

De greep van de internetbedrijven op de data moet kleiner worden. Laat de controle verschuiven naar de leveranciers van de data. Transparantie zou al veel helpen. Verplicht bedrijven om aan consumenten te vertellen over welke informatie ze beschikken, en hoeveel geld ze ermee verdienen. En laat de overheid haar databestanden openstellen. Dat geeft kansen aan nieuwe, kleine concurrenten met goede ideeën. De overheid zou ook het delen van data verplicht kunnen maken. Europa vraagt bijvoorbeeld aan de banken om klantengegevens beschikbaar te maken voor derde partijen.

Niet dat dit alle problemen zal oplossen. Als persoonsgegevens vlot verhandeld en gedeeld kunnen worden, stijgt ook de kans op lekken. Om dat risico te milderen, treedt volgend jaar de GDPR (General Data Protection Regulation) in werking in de EU, nieuwe regulering voor de bescherming van persoonsgegevens. Maar bescherming van data kan botsen met concurrentie. Grote bedrijven hebben meer middelen om ingewikkelde privacywetten na te leven. En zulke wetten geven de grote bedrijven de mogelijkheid nog meer controle uit te oefenen op data dan ze vandaag al hebben. De nieuwe economie kent zo haar paradoxen.

The Economist, Christophe Charlot