De software zoekt het uit

Bruno Leijnse Redacteur bij Trends

Data mining kan een enorme groei tegemoet zien door de gigantische hoeveelheden gegevens die neringdoenders allerhande verzamelen. De Leuvense start-up Synes lanceert software om die massa’s bytes eindelijk automatisch te kunnen ontginnen.

Het is een evidentie. Opslag- en verwerkingscapaciteit zijn spotgoedkoop geworden. Banken, telecomoperatoren, distributeurs of verzekeraars kunnen elk detail over de transacties met hun klanten opslaan en analyseren. Dus explodeert de markt voor analysesoftware. Specialisten zoals SPSS, Business Objects of Cognos scoren omzetstijgingen in business intelligence in de orde van 45 percent of meer en voorspellen een verdere groei door de nood aan “e-intelligence”.

Business intelligence is echter een breed domein. Het strekt zich uit van hulpmiddelen voor ondervraging en rapportering en zogenaamde online analytical processing (OLAP), tot meer specialistische statistische en regelgebaseerde analysetools, die met de grootschalige (en voorbereidende) “data mining” worden geassocieerd. Helemaal onderaan in de keten zit de neurale netwerktechnologie, de basis van de automatische “data mining server”, die de Leuvense start-up Synes op 11 mei zal voorstellen.

Data mining – het zwaardere werk – kende een krisis en een consolidatie in 1997-98, die GartnerGroup – de naam komt nog terug in dit verhaal – er anderhalf jaar geleden toe verleidde te titelen dat “de geruchten over het overlijden van data mining schromelijk overdreven (waren)”. “Hype van fabrikanten en de problemen om data mining-technologie echt te installeren hebben de vraag verminderd, ondanks de verleidelijke beloften,” scheef de marktonderzoeker. Eén van die redenen, aldus Gartner, is dat er “wetenschappers” nodig waren om de systemen goed te laten werken.

Precies dat probleem beweert Synes nu aan te pakken. “De huidige data mining-technieken hebben tot nog toe nood aan mathematici die de juiste analysemethodes weten te kiezen en dan ook nog eens de juiste parameters. Eigenlijk gaan ze meer inzichten valideren, dan zelf inzicht te verschaffen,” zegt Kris Lebacq (25), chief executive officer van Synes. “Onze software haalt de structuur in de data zelfstandig naar boven,” stelt hij.

Bovendien is het aantal dimensies dat met de klassieke technologie kan worden geanalyseerd beperkt, omdat de complexiteit met het aantal dimensies exponentieel de hoogte in schiet. “Meestal ging het om tien tot vijftien dimensies. Vijftig was al heel wat. Maar wij gaan commercieel tot duizend dimensies en in laboratoriumomstandigheden tot vijfhonderdduizend,” zegt professor Marc Van Hulle, de ontwikkelaar van de technologie en aandeelhouder van Synes (de naam is de samentrekking van Synergetic Network Solutions, maar bekt lekker als “Science”).

Professor Van Hulle is ingenieur, maar tegelijk docent bij de faculteit geneeskunde en onderzoeksleider bij het Fonds voor Wetenschappelijk Onderzoek. Hij werkt, met vijf doctoraatsstudenten, over een gedeelte van onze hersenen dat bekend staat als de visuele cortex. “Hoe halen we informatie uit wat we zien? Hoe herken ik lijnen, hoe classificeren wij objecten? Zelforganisatie is één van de belangrijke technieken. De leerprocessen zijn autonoom en ze vangen ook fenomenen op zoals het afsterven van cellen in de hersenen.”

Neurale netwerken – de wiskundige beschrijving van deze hersenprocessen – worden al zowat vijftig jaar gezien als een middel om computers te laten leren van de resultaten van hun eigen analyses. De manier waarop de data server van Synes dat doet – de leerregel – is nu het voorwerp van een patent dat Synes heeft aangevraagd in Europa en de VS ( Kernel based maximum entropy learning rule) en waarover Marc Van Hulle in januari trouwens een boek heeft gepubliceerd, Faithful Representations and Topographic Maps: From Distortion- to Information-Based Self-Organisation.

“De applicatie zelf is niet wereldschokkend, wel dat ze nu eenvoudig kan worden gebruikt en men dit neurale netwerk ongesuperviseerd kan laten werken,” zegt Steven Raekelboom, een handelsingenieur beleidsinformatica en actuariële wetenschappen die bij professor Van Hulle (en Synes) terechtkwam toen hij daarna een Masters in artificial intelligence ging volgen. De data mining server eindigt met een veel kleinere hoeveelheid data – gedelegeerd bestuurder Kris Lebacq van Synes spreekt over 5 à 10 megabytes uit een staal van een gigabyte – zonder informatie te verliezen. Op deze “samenvattingen” kunnen dan de eigenlijke analyses gebeuren. Analysemodules – die moeten toelaten om de opgespoorde informatie te visualiseren en te verwerken – zijn in proef. “De definitieve versie is voor augustus,” belooft Kris Lebacq.

Synes heeft de technologie al in het veld getest, al houdt het de namen van zijn klanten liever stil. Maar de toepassingen zijn divers: een mobilofoonoperator wil de Synes-data server gebruiken om churn (het overlopen van klanten naar concurrenten) te beperken, een distributiebedrijf hanteerde het om te bepalen hoeveel kranten op een bepaalde dag op een verkooppunt moeten worden geleverd, de server kan worden ingebouwd in testapparatuur om onregelmatigheden in een farmaceutisch productieproces op te sporen. Telkens gaat het om complexe problemen met veel dimensies, werk voor echte getallenkrakers. Sun Microsystems leverde vorige week Synes’ nieuwste speeltje: een E3000-systeem met 2 gigabyte geheugen, prijs vijf miljoen frank.

De voorbije week snoof Kris Lebacq Italiaanse lentelucht op het Spring symposium van GartnerGroup in Firenze. “Gartner (nvdr – wereldwijd de grootste marktonderzoeker in de informatica) is het soort publiek dat we nodig hebben,” zegt Lebacq. “Op zo’n Symposium kan je een half uur krijgen met een analist. We hebben hem uitgelegd wat we kunnen. De volgende stap is een aantal referenties doorpraten.”

Analist John Bardwell van Gartner wil best bevestigen dat hij “highly impressed” is door wat Kris Lebacq hem vertelde. “Goede geautomatiseerde data mining tools behoren tot de minst rijpe technologieën om een bedrijfsstrategie van customer relationship marketing te ondersteunen. Synes heeft een product dat een gat in de markt kan vullen,” mailt hij.

De Haasrodenaren willen hun product via drie kanalen vermarkten: in België rechtstreeks naar de large accounts. Synes werkt op projectbasis – typisch twee maanden – voor ongeveer een half miljoen frank per opdracht. Elders worden partners ingeschakeld. “Denk aan de Big Five (nvdr – de grote bedrijfsadviseurs),” zegt Kris Lebacq. En na enig aandringen: “Arthur Andersen is een heel goede kandidaat.” (AA maakte vorige maand een participatie bekend in Customer Dialogue Systems, actief in customer relationship marketing-software voor de financiële sector, een eind verderop op het industrieterrein van Haasrode). Tenslotte ziet Synes ook een afzetmarkt als toeleverancier van fabrikanten van test- en monitoringsystemen, die het neurale netwerk in hun systeem kunnen integreren.

De concurrentie heet IBM (met zijn Intelligent Miner), Angoss met zijn Angoss Knowledge Suite, Oracle (dat onder meer Thinking Machines opkocht), SAS Institute met zijn Enterprise Miner, SGI met MineSet en SPSS met Clementine. Telkens gaat het om omvattende aanbiedingen, waartegenover Synes zich enkel als een gespecialiseerde nichespeler kan profileren. PC Week noemde in een recent overzicht de data mining markt “ontluikend”. Aandeelhouder Werner Goeminne van Synes heeft het over een “enorm potentieel”. Synes, dat startte met 13 mensen en in zijn eerste jaar 27 miljoen frank omzet puurde uit werk voor klanten als Agfa of Swift (en zeven miljoen frank verlies), telt nu 25 medewerkers.

Kris Lebacq: “We staan voor een explosie in de vraag. We trekken nieuwe medewerkers aan om dat zo goed mogelijk op te vangen. Daardoor zal er misschien extra kapitaal nodig zijn.” Hoorden we daar het woord beursintroductie?

BRUNO LEIJNSE

Fout opgemerkt of meer nieuws? Meld het hier

Partner Content