Welke combinatie van smaken is het lekkerst? Wat maakt een blog populair? Hoeveel is uw huis waard? Hoeveel energie produceert het windpark in de komende uren?
...

Welke combinatie van smaken is het lekkerst? Wat maakt een blog populair? Hoeveel is uw huis waard? Hoeveel energie produceert het windpark in de komende uren? De voorspellende gegevensanalyse van DataStories International kan op veel terreinen een verschil maken. 'Geef ons een werkblad, wij geven u een strategie' claimt het bedrijfje uit Turnhout. Oprichtster Ekaterina 'Katya' Vladislavleva (38) spreekt liever over "verbeterde intelligentie" dan over "artificiële intelligentie". Dat onderstreept dat de software een hulp is voor de mens en geen vervanging. Intelligentie definieert ze als "de capaciteit om te voorspellen". DataStories specialiseert zich in voorspellende analyse van niet-lineaire verbanden. Dat zijn situaties waarin het resultaat niet evenredig varieert met de input, zoals wanneer enkele vrachtwagens plots alle verkeer stilleggen op de Antwerpse ring. Vorig jaar kwam de start-up als beste algemene oplossing uit de hackathon voor duurzame fabricage van de Brussels Data Science Community. Daar was de vraag hoe de energie-efficiëntie van een fabriek van Procter & Gamble kon worden verbeterd. "Wij ontdekten dat de gegevens van slechts een tiental sensoren nodig waren om het energieverbruik nauwkeurig te voorspellen", vertelt Vladislavleva. De Russische heeft een postgraduaat ontwerpersopleiding in industriële mathematica van de Technische Universiteit Eindhoven en een PhD van de Universiteit Tilburg, naast een master in intelligente systemen van de Lomonosov-universiteit in Moskou. Haar PhD-thesis in datagedreven probleemoplossing deed ze bij Dow Chemical in Terneuzen. Daar leerde ze ook haar echtgenoot Guido Smits kennen. Ze stopte in 2011 met lesgeven aan de Universiteit Antwerpen om DataStories te beginnen. Tegen die tijd was ze al coauteur van publicaties over voorspellende mathematische technieken, vaak samen met Smits. "Vandaag publiceren we niet langer. Onze unieke algoritmes (wiskundige procedures, nvdr) voor machine-leren zijn ons concurrentieel voordeel." Guido Smits: "Met 'artificiële intelligentie' zoek je verbanden, patronen. Wanneer je dat probeert te automatiseren, weet je initieel niets van het probleem. Alles is even belangrijk. De truc is het juiste belang van elk van de variabelen te onderscheiden. Je eindigt met verbanden die wiskundig waar zijn. De causaliteit tussen die verbanden is een heel ander verhaal. Als het helder weer is overdag, schijnt waarschijnlijk de zon. Dat wil niet zeggen dat de zon begint te schijnen als het licht aangaat. Inzicht in causaliteit krijg je alleen door die gesofistikeerde algoritmes in handen te geven van domeinexperts, die de resultaten kunnen interpreteren." Vladislavleva: "Voorspellende analyse schittert in het ontwerp van nieuwe producten, recepten of materialen, bijvoorbeeld een soep. Je wil dat die een artisanale volheid heeft, een bepaalde smaak, niet te zout is en goed scoort bij het panel. Dat zijn je kritische performantie-indicatoren (kpi's). Je bedenkt wat die indicatoren drijft en je creëert formuleringen die je opdrachtgever laat testen door een smaakpanel. Dat zijn dure testen. Met de feedback bouw je nieuwe modellen, die je opnieuw test. Na een tijd beginnen je modellen overeen te komen met de quoteringen. Zodra je model accuraat is, kan je het evalueren op een miljard verschillende componenten in de computer, zonder ze uitgebreid opnieuw te testen. Je hebt lagere kosten en kunt veel sneller naar de markt trekken. Daarin zit je winst." DataStories haalde vorig jaar 400.000 euro omzet. De software wordt sinds januari op de markt gebracht. De referenties heten Anheuser-Busch, P&G en Unilever. Vladislavleva: "Zulke klanten komen alleen naar ons als ze al met de grote jongens hebben gewerkt. Daar leren ze dat je algoritmes voor bigdata-analyse niet zomaar naar je gegevens kunt gooien. Je moet je probleem goed formuleren en je doel kennen." Smits: "Wat tijd kost, is de vertaling van de gegevens van een potentiële klant en hoe je zijn vraag echt kunt formaliseren en aflijnen. Slechte projecten herken je snel. Als de data over de muur gesmeten worden - 'zoek eens iets' - weet je hoe laat het is." Vladislavleva: "Daarnaast moet je de resultaten van je analyse terugbrengen naar de klant onder de vorm van een vertelling en niet onder de vorm van een model of een vergelijking. Vandaar dat we het bedrijf DataStories hebben herdoopt (in 2011 heette de start-up Evolved Analytics, nvdr)." Klanten krijgen een automatisch uitgeschreven dossier en een grafische interface die interactief de verbanden en het effect van veranderingen in de variabelen toont. De groep is sinds 2015 gegroeid tot zeven mensen. CTO Sean Stijven, senior data scientist Wouter Minnebo en hoofdarchitect Robbe Block zijn drie PhD's met wie Vladislavleva gewerkt heeft in Antwerpen. Senior data scientist Artem Markin, net als Vladislavleva een master van de Lomonosov universiteit, werkte voordien bij de business intelligence-hoogvliegers Qlik en SAS Institute. Ook solutions architect Alexander Ampleev komt van SAS Institute. Ze zijn allemaal aandeelhouders. De software is geschreven als een webtoepassing en draait op Amazon Web Services. Een offlineversie moet klanten aanspreken die kostbare gegevens bij zich willen houden. Gebruikers betalen een licentie op jaarbasis en consultancy afhankelijk van het soort en de waarde van de opdracht. DataStories wil van een klein consultingbedrijf naar een productbedrijf uitgroeien. Vladisleva wil dit jaar op 800.000 euro omzet uitkomen en volgend jaar opnieuw verdubbelen. "We willen specialiseren: DataStories voor predictieve marketing, voor energie-beheer, voor predictief onderhoud." DataStories kon rekenen op steun van het Vlaams Agentschap voor Innoveren & Ondernemen (ex-IWT) en krijgt ook Europese subsidies via het Belgisch-Duitse Flex4Apps-project. DataStories levert er de technologie voor voorspellende analyse. "Voor onlinesoftwarebedrijven en e-handel willen we een verticaal platform bouwen waarop we elke klik van elke gebruiker kunnen traceren vanuit de vraag: wat drijft conversie? Waarom koopt de ene klant op uw website niets en de andere wel? De subsidie is een grote hulp om het risico van dat soort ontwikkelingsinspanningen te verminderen", zegt Vladislavleva. Tot vorig jaar werkte de starter zonder extern kapitaal. Dit jaar kwam er een kapitaalverhoging door hoofdzakelijk Luc De Vos (ex-voorzitter Arkafund), die de starter 'pre-money' waardeerde op 875.000 euro. Het startersteam houdt een grote 77 procent van de aandelen. Bruno Leijnse, fotografie Debby Termonia"Met voorspellende analyse heb je lagere kosten en kun je veel sneller naar de markt. Daarin zit je winst"