Wat zegt u, dokter?
Vlaanderen heeft wat met taaltechnologie. In het Oost-Vlaamse Zonnegem ontpopt momenteel een leider in medische taaltechnologie. Het jonge Language and Computing wil 10% veroveren van een potentiële wereldmarkt van 5 miljard dollar. Daarvoor haalt het binnenkort 50 miljoen durfkapitaal op.
Dat het handschrift van een arts zo goed als onleesbaar is voor een niet-medicus is een bekend gegeven. Maar de natuurlijke taal van de medische wereld is ook voor computers niet te vatten. Een machine begrijpt mensentaal pas als die wordt gecodeerd of gestructureerd. Alleen dán kan de computer de ingevoerde informatie interpreteren en verwerken. Dat is uiteraard niet anders voor medische informatieverwerking. Bovendien is medische informatie bij uitstek ongestructureerd. Een diagnose is dan ook een stuk moeilijker te coderen dan bijvoorbeeld een bankoverschrijving. Daarbij komt ook nog dat elke arts wel zijn eigen taaltje hanteert. Suikerziekte heet bij de ene arts gewoon suikerziekte, bij een andere diabetes en bij een derde diabetes mellitus. Voor de computer is dat een babylonische spraakverwarring. Voor de toepassing van informatietechnologie in de medische sector is die brede kloof tussen natuurlijke taal en machinetaal een stevige handicap.
Bruggenbouwers
Language & Computing ( L&C) wil bruggen bouwen over deze kloof, zegt mede-oprichter Werner Ceusters. “Onze taaltechnologie moet ervoor zorgen dat de computer de natuurlijke medische taal begrijpt. De dokter vertelt met eigen woorden, de computer codeert de informatie zelf. Ons uitgangspunt is dat de machine de arts moet begrijpen, en niet omgekeerd, omdat de medische wereld zeer wantrouwig staat tegenover elke ingreep die de arts zou beperken in zijn uitdrukkingsmogelijkheden. Uiteraard kunnen we de machine niet laten denken of een diagnose laten stellen.”
L&C wil zich specifiek richten op de medische sector. “De geneeskunde vormt een afgebakend terrein en een mooie nichemarkt,” meent co-stichter Maarten Laga. “De wereldmarkt voor deze medische taaltechnologie is momenteel jaarlijks 1,5 miljard dollar groot. De potentiële markt bedraagt 5 miljard dollar. We gaan daarbij wel uit van de hypothese dat bijvoorbeeld elk ziekenhuis geïnformatiseerd wordt.”
De informatietechnologie sijpelt in elk geval de gezondheidszorg binnen. Het structureren van informatie is een enorm hulpmiddel voor artsen, ziekenhuizen, farmaceutische bedrijven en beleidsmakers (zie kaderstuk: Toekomstmuziek). Werner Ceusters: “Binnen vijf tot tien jaar willen we 10 tot 12% van die theoretische markt veroveren.”
Startersprijs
Het zijn steile ambities voor een bedrijfje dat goed en wel één jaar oud is. L&C is in april 1998 opgericht door Ceusters en Laga. Enkele weken geleden won L&C nog de FTI-Technoland-startersprijs.
Werner Ceusters is neuropsychiater, informaticus, linguïst en kennisingenieur. Hij is al sinds de jaren tachtig actief in allerlei Europese researchprojecten op het gebied van medische taaltechnologie, onder andere bij Office Line Engineering. Eerder had hij ideeën opgedaan op de dienst medische informatica van professor Georges De Moor aan de Universiteit Gent. Ceusters geldt als een wereldautoriteit op het vlak van de medische taaltechnologie.
Maarten Laga is master in informatica, master in gezondheidszorgbeleid en kmo-management (aan de Vlerick Leuven Gent Management School). Hij was bestuurder en mede-oprichter van Quadrat, een bedrijf dat actief is op de markt van de medische software en leverancier van 300 instellingen in de gezondheidszorg.
Samen baggeren
ze Medical Language Valley uit – dat zou dan al de elfde vallei in Vlaanderen zijn – rond het Oost-Vlaamse dorpje Zonnegem, niet ver van de E40, tussen Aalst en Gent. Verscholen tussen de koeien en de velden ligt het hoofdkwartier van L&C in het Moorhof, een gerestaureerde boerderij. Ceusters: “Een ideale ligging, want we moeten het niet hebben van toevallige passanten.”
Ceusters en Laga zijn begonnen met een kapitaal van 9 miljoen frank. Op 31 december 1998 volgde een injectie van nog eens 20 miljoen frank. Die diende om de hoeksteen van L&C – een zelf ontwikkelde centrale kennisbank van medische terminologie en de relaties tussen al de verschillende termen – verder uit te bouwen. In deze databank zit ook een linguïstische laag, waar de terminologie wordt opgeslagen in verschillende talen. L&C vult deze kennisbank voortdurend aan en puurt er een groot aantal producten en toepassingen uit.
Ceusters ziet vier grote toepassingsgebieden van medische taaltechnologie: “Hulp bij het coderen van medische gegevens voor verwerking door bijvoorbeeld ziekenfondsen of het ministerie van Volksgezondheid, het omzetten van teksten naar structuren die overeenstemmen met databases waarin bijvoorbeeld gegevens van ziekenhuizen worden opgeslagen, het opzoeken van niet-gestructureerde informatie en controle of alle procedures bij een ingreep worden gerespecteerd.”
Concurrentie
“Technologisch liggen we op kop,” weet Ceusters. Naast L&C zijn er nog drie Amerikaanse spelers actief op deze markt. “Maar zij kunnen niet naar Europa, wegens hun eenzijdige benadering van de taal. Hun techniek zal vastlopen als ze zich in een andere taalgroep wagen. Wij werken multilinguïstisch. Dat impliceert wel dat we op korte termijn niet dezelfde efficiëntie halen inzake ontwikkeling van de technologie, maar op lange termijn betekent de taalveelzijdigheid een enorm competitief voordeel. Wij kunnen wél naar de VS. L&C werkt, na de grote Europese talen, nu vooral aan Zuid- en Oost-Europese talen.”
Laga: “Het is wel belangrijk dat we ons nu snel op de VS-markt positioneren, omdat de Amerikaanse concurrenten er al verder staan op de markt. Het is van groot belang dat artsen ook onze producten kunnen beoordelen vooraleer ze hun keuze maken. Want eens de keuze gemaakt, veranderen ze niet zo gauw meer van systeem.”
L&C wil daarom
meer aandacht schenken aan marketing in de VS en Europa. Het bedrijf haalt daarvoor op korte termijn 50 miljoen venturekapitaal op, dat ook voor een stuk zal dienen om verder de technologie te ontwikkelen. Laga: “Eventueel richten we satellietkantoren op in de VS en in Zuid-Oost Azië. De Europese markt bewerken we vanuit Zonnegem.”
Ceusters: “We zijn begonnen de artsen te evangeliseren. De reacties zijn positief, tot nu toe. Geneesheren zien in dat we een oplossing bieden voor hun noden. De contacten groeien nu exponentieel. Hopelijk tonen de contracten binnenkort dezelfde curve.”
L&C heeft al een samenwerkingsakkoord met Information Mapping Inc uit Boston, in het domein van de farmacie. Ook Clinicare, een Canadese leider in medische software, integreert L&C-technologie in zijn producten. Een soortgelijk akkoord is er ook met Datasoft Management. L&C haalde ook een project van het Vlaams Instituut voor de bevordering van het Wetenschappelijk-Technologisch onderzoek in de industrie (IWT) binnen ter waarde van 17 miljoen frank, om een automatisch codesysteem voor medische teksten te ontwerpen.”
Ceusters: “Financiers vinden vormt geen probleem. Al is het niet gemakkelijk investeerders duidelijk te maken wat we doen of willen doen. Medische taaltechnologie is beperkt tot een clubje van dertig mensen. De geschikte partner brengt internationale contacten in en is eventueel afnemer van ons.”
Laga: “Binnen twee tot drie jaar willen we die 50 miljoen frank terugverdiend hebben. Over drie jaar moeten we vijftig medewerkers hebben, terwijl we nu nog met acht zijn. Voorwaarde is wel dat we 21 key people op strategisch in te vullen vacatures kunnen plaatsen. Want de grootste rem op de groei vormt het vinden van bekwame mensen.”
Wie de vacatures van L&C wil invullen, moet over aardig wat vaardigheden beschikken. Ceusters: “Je moet de medische terminologie onder de knie hebben, wat in de praktijk betekent dat je arts moet zijn. Je moet een gedegen informaticakennis hebben, op de hoogte zijn van computerlinguïstiek, en een nieuwe taal aan het bestaande team toevoegen. Voor artsen volstaan twee van de drie laatste eisen. Ik besef dat we goudvinken zoeken en daarom recruteren we ook in het buitenland. Maar we zullen opdrachten moeten weigeren. We bewegen ons in steeds nieuwe domeinen.”
DAAN KILLEMAES
Fout opgemerkt of meer nieuws? Meld het hier