Internet

Zoeken volgens George Boole (02/03/96)

Deze Internet column verschijnt elke zaterdag in de bijlage Ter Zake van De Morgen

door Jozef Schildermans

Uit een test van vijftien Web-zoekmachines, uitgevoerd door Data TestLab in opdracht van Computer!Totaal en Data News, blijkt dat vooral Alta Vista en Lycos redelijk goede resultaten geven. De ideale Web-zoekmachine bestaat echter niet. Een Nederlandstalige overzichtspagina van enkele goede zoekmachines vindt u op URL http://www.dma.be/p/bewoner/bim/search/index_d.htm. U kunt de zoekmachines direct van deze pagina bevragen. Dat bespaart weer wat tijd, want de populairste zoekmachines bevinden zich in Amerika en zijn dikwijls moeilijk te bereiken, zeker in de namiddag.

Uit het onderzoek blijkt ook dat "natural language searching" (waarbij u de zoekopdracht opgeeft zoals u hem tijdens een gewoon gesprek zou uitspreken) slechte resultaten geeft. Om enig succes te hebben, moet je booleaanse operatoren gebruiken. George Boole, een Engelse wiskundige en logicus die leefde van 1815 tot 1864, was de eerste die inzag dat je met de heel eenvoudige woorden "en", "of" en "niet", zowat alle vragen kunt oplossen. Met die drie termen, die als een soort eerbetoon de booleaanse operatoren genoemd worden, kan je je vraagstelling zodanig preciseren dat je gegarandeerd een precies en volledig antwoord krijgt.

Lycos en Alta Vista (en andere Web-zoekmachines) ondersteunen de belangrijkste booleaanse operatoren. Bij Alta Vista dient u te kiezen voor de Advanced Query. Bij Lycos klikt u op Search Options. Lycos heeft als voordeel dat u de booleaanse operatoren uit afrolmenu's kunt kiezen. Het nadeel is dat u geen haakjes kunt gebruiken.

De booleaanse operator OR (of) wordt gebruikt om een zoekterm uit te breiden met alternatieven (synoniemen, spellingvarianten, enzovoort). Hoe meer termen u met OR verbindt, hoe groter de verzameling zoekresultaten wordt. Met de operator AND (en) kunt u de zoekresultaten met elkaar in verband brengen of beperken met bijkomende criteria. Hoe meer termen u met AND verbindt, hoe kleiner de verzameling zoekresultaten wordt. De nabijheidsoperatoren zoals ADJ, WITH of NEAR duiden aan dat twee of meer woorden in dezelfde zin, hetzelfde veld of hetzelfde artikel moeten voorkomen. Deze operatoren worden niet door alle zoekmachines ondersteund. Ongewenste zoektermen sluit u uit met de operator NOT (soms AND NOT).

U kunt meer dan één booleaanse operator gebruiken in een zoekopdracht. De prioriteitsregels van de booleaanse logica dicteren dat NOT prioriteit heeft op AND en OR en dat AND perioriteit heeft op OR. U kunt de prioriteitsregels wijzigen door haakjes te gebruiken. Zouden we in de Engelse versie van het zoekvoorbeeld dat we vorige week gaven geen haakjes hebben gebruikt (dus "acid rain or acid percipitation and econom*") dan zou deze zoekopdracht het equivalent zijn geweest van "acid rain or (acid percipitation and econom*)". U zou dan alle documenten terugkrijgen die te maken hebben met acid rain plus alle documenten die te maken hebben met acid percipitation én economy. Dit zou de zoekresultaten vertekenen. Let er dus op dat u de haakjes op de juiste manier gebruikt.


Bijgewerkt op 2/06/96 / jozef@datatestlab.com / © Copyright 1995-96 by DTL bvba, Oud-Turnhout, Belgium
Data TestLab® is a registered trademark of DTL bvba, Oud-Turnhout, Belgium