Het kost wat oefening om op het Web van het Internet informatie te vinden. Maar wie de verschillende zoeksystemen meester wordt, mag mooie verrassingen verwachten.Enkele strategieën...
...

Het kost wat oefening om op het Web van het Internet informatie te vinden. Maar wie de verschillende zoeksystemen meester wordt, mag mooie verrassingen verwachten.Enkele strategieën...Het aantal inwoners van Zaïre, de shows op Broadway, de koers van de DM : het Internet bevat een interessante waaier van informatie. Maar men moet ze kunnen vinden.De eerste stappen op het multimedia-netwerk van databanken, het World Wide Web, zijn verwarrend en frustrerend. Met een metodische aanpak, enkele goede adressen en de nodige oefening is de weg naar het juiste antwoord nochtans niet moeilijk te vinden. Laten we beginnen met de meest voor de hand liggende mogelijkheid. Als u een server wilt raadplegen die u kent, is de eenvoudigste manier om hem te bereiken... zijn adres te noteren. Steeds meer bedrijven en organizaties nemen die gegevens op in hun prospektus en reklame.Vaak weet men echter niet goed waar men de informatie moet vinden. In dat geval heeft men een navigatiemetode nodig. Er zijn twee mogelijkheden : een zoeksysteem gebruiken of algemene sites raadplegen. ZOEKSYSTEMEN.Het Internet is bezaaid met instrumenten die het opzoeken van servers en informatie vergemakkelijken : de search engines (letterlijk : zoekmachines). Het eerste wat een netwerkgebruiker moet doen, is ze vinden. Daarna moet hij ze leren gebruiken. De meeste zoeksites zijn in de VS gevestigd en gaan te werk door voor elke opgespoorde of gesignaleerde server trefwoorden te verzamelen. Hier gelden twee principes. Het eerste : geen enkel systeem garandeert een volledige dekking. Het is dus mogelijk dat het zoeksysteem een bepaalde server heeft overgeslagen. Wanneer één search engine een slecht resultaat oplevert, betekent dat niet dat andere zoeksites evenmin iets zullen vinden. Principe twee : de zoeksites werpen netten uit die bij sommige diensten grote en bij andere kleine mazen hebben. Alles hangt af van het aantal trefwoorden en de pagina's die voor elke databank van het Web geregistreerd zijn. Een praktische metode bestaat erin dat u verscheidene zoeksystemen na elkaar gebruikt, beginnend met de snelste en meest beknopte en verdergaand met de sites die meer uitgebreide maar moeilijker te analyzeren antwoorden geven. De zoektaal is meestal van het booleaanse type ( en, of, in de nabijheid van...), met verscheidene varianten. Ze is niet moeilijk te gebruiken, want elke zoeksite geeft een beknopte gebruiksaanwijzing. Sommige systemen wagen zich aan natuurlijke taal. In teorie is het dan mogelijk te vragen "hoeveel inwoners heeft België ?" in plaats van het booleaanse "België EN bevolking". Engels is altijd de efficiëntste taal. De meeste interessante gegevens zijn Angelsaksisch en de zoeksites aanvaarden niet altijd aksenten. Toch begint het principe van het opzoeken in verschillende talen ingang te vinden.ENKELE ZOEKSITES.Webcrawler (http://www.webcrawler.com) is eenvoudig en efficiënt, een uitstekend vertrekpunt. Deze zoekdienst beschikt over een geautomatizeerd systeem, de crawler, die elke dag een groot aantal servers ondervraagt en er telkens minstens één trefwoord oppikt. Zijn grote voordeel is zijn snelheid, zelfs ( mutatis mutandis) in de piekuren. Dat verklaart ook zijn grote populariteit : hij ontvangt momenteel meer dan 2,2 miljoen verzoeken per dag. De meest modieuze server is Yahoo (http://www.yahoo.com). Hij is ongeveer even doeltreffend als Webcrawler. Hier krijgt men twee diensten aangeboden : men kan één of meer woorden intikken of een tematische index met een boomstruktuur doorlopen (bedrijven, streken...). De index heeft het voordeel dat hij lijsten van sites geeft. U vindt er bijvoorbeeld meer dan 150 Belgische servers, wat echter misschien maar de helft of een derde is van het echte totaal. Het systeem heeft een zeer behoorlijke performantie. Yahoo was één van de eerste zoekmotoren om advertenties te introduceren en levert nu ook, dankzij een overeenkomst met Reuter, het belangrijkste nieuws van de dag. MEER VERMOGEN.Wie een krachtiger systeem wenst, kan Lycos raadplegen (http://www.lycos.com) of OpenText (http://www.opentext.com:8080). Beide systemen zijn erg sterk maar produceren lange lijsten van antwoorden, die u geduldig moet uitpluizen. Gebruik ze beter als reservemogelijkheid. Het vergelijkbare Infoseek heeft een gratis en een betalende "Professional" dienst, die ook bronnen buiten het Internet bestrijkt. Een "Standard" abonnement daarop kost 9,95 dollar per maand voor 100 opzoekingen, plus extra kosten voor sommige database-raadplegingen. Men kan het vermogen van de verschillende zoeksystemen bundelen door een metasysteem te gebruiken : een server die een verzoek naar verscheidene zoeksystemen (Yahoo, Lycos enzovoort) verstuurt en de resultaten verzamelt. De idee lijkt aanlokkelijk, maar omdat het procédé zo complex is, kost het veel tijd. De site Savy Search (http://guaraldi.cs.colostate.edu:2000/) werkt volgens dit principe en geeft vrij goede resultaten. Hij biedt het voordeel dat hij de meest uiteenlopende zoeksystemen samenbrengt, tot buiten de perimeter van het Web. Men kan bijvoorbeeld ook in de diskussieforums van het Internet zoeken (de newsgroups van Usenet), waar komplete handleidingen over allerlei onderwerpen te vinden zijn : de FAQ's (frequently asked questions : lijsten met vaak gestelde vragen). BETER LUI DAN MOE.Rechtstreeks zoeken is echter niet altijd erg doeltreffend. Soms moet men sluw zijn om interessante informatie te verkrijgen. Indien iemand bij voorbeeld belangstelling heeft voor telekommunikatie, zal hij vrijwel niets boeiends vinden door in een zoeksysteem "Belgacom" te tikken. Hij brengt beter een bezoek aan een site met bronnen. In de wat chaotische wereld van het Internet hebben vele vrijwilligers, meestal aan de universiteiten, geduldig indexen opgesteld van alle servers omtrent een bepaald domein. Dergelijke lijsten bestaan voor alle denkbare onderwerpen, van financiën tot landbouw of ekonomie, wijn of telekommunikatie. Deze katalogen zijn zelden uniek en niet noodzakelijk volledig, maar wel erg handig. Sommige sites verzamelen zelfs lijsten voor alle domeinen. Een voorbeeld is de WWW Virtual Library. U kan haar per tema raadplegen (http://www.w3.org/pub/DataSources/bySubject/Overview.html) of per land (http://www.w3.org/pub/DataSources/WWW/Servers.html), maar voor veeleisende gebruikers is ze aan de zwakke kant. We nemen opnieuw het voorbeeld van Belgacom en volgen een onrechtstreekse zoekweg door in het zoeksysteem "telecommunication resources" op te vragen. Dit levert enkele interessante index-sites op met allerlei bronnen : telefoonmaatschappijen, fabrikanten van materieel, bronnen over reglementeringen en technieken, vakbladen. Bij die laatste eindigt onze zoektocht : de groep CMP, die onder meer Communication Week en zijn internationale editie publiceert, is zo vriendelijk de archieven van haar bladen open te stellen voor Internet-gebruikers. Wanneer we in het zoeksysteem van deze Amerikaanse groep het woord "Belgacom" ingeven, krijgen we enkele tientallen artikels over de Belgische telefoonmaatschappij. GOEDE REPERTORIA.Als aanvulling van de zoektocht kan men een algemene server raadplegen, die niet noodzakelijk aan een bepaald domein gebonden is. Een voorbeeld : de Wall Street Journal laat Internetgebruikers gratis in zijn archieven de artikels van de jongste dertig dagen raadplegen. Dergelijke bronnen kunnen nuttige elementen opleveren voor een zoektocht zoals boven beschreven. Ze kunnen ook bijdragen tot het samenstellen van een konsekwent dossier. Onder algemene sites verstaat men sites die te vergelijken zijn met woordenboeken, telefoongidsen, encyclopedieën of andere repertoria. Men moet ze kennen, want de zoeksystemen maken geen inventaris van hun inhoud. Webcrawler, Yahoo en Infoseek weten bijvoorbeeld niet noodzakelijk dat het verzoek "Angola" in het Internet-wereldjaarboek van de CIA (!) een komplete fiche met feiten over dat land oplevert. Veel van deze diensten zijn gratis bijvoorbeeld de Belgische telefoongids van Infobel (http://www.infobel.be). De meeste grote betalende informatiediensten, zoals Dialog, kunnen echter eveneens via het Web worden geraadpleegd. NIEUWE SITES VINDEN.Hoe komt u nieuwe sites op het spoor ? Natuurlijk door uw ogen open te houden en de gespecializeerde rubrieken van kranten en tijdschriften te lezen.Het kan ook systematischer, door regelmatig de sekties "new" of "what's new" van grote zoeksystemen als Yahoo of Lycos te bekijken. Ook de Internetserver van Netscape heeft een rubriek met nieuwigheden. Het voordeel is dat hij heel eenvoudig toegankelijk is met de populaire Netscape Navigator webbrowser. U hoeft in het programma slechts op een knop te klikken om een lijst van nieuwe sites op uw scherm te krijgen. ROBERT VAN APELDOORN. WEBCRAWLER Een eenvoudige, doeltreffende maar rudimentaire zoeksite.