Click here to make Megalink your default homepage (only for IE5)
 

Zoeken op het Internet

Dit is een lange tekst. Als u hem echt op uw gemak wilt lezen, print hem dan uit. Bij on line raadplegen (zoals u nu doet), kunt u wel direct doorklikken naar de genoemde zoekmachines.


Inleiding

Het Word Wide Web is een onuitputtelijke bron van nuttige informatie, die helaas niet altijd even makkelijk te vinden is. Zoekprogramma’s (search engines) zijn onontbeerlijk om zo snel mogelijk tot resultaat te komen.
Een search engine is een online te raadplegen database (gegevensbestand: opslag van gegevens) met trefwoorden, tekst, omschrijvingen en de bijbehorende verwijzingen naar webpagina’s. U kunt die database bedienen vanaf een webpagina door middel van het opgeven van een of meer trefwoorden. Lijfelijk kunt u zich voorstellen dat er ergens krachtige computers staan waarop continu een programma draait dat de database beschikbaar houdt en telkens aanvult. Webpagina’s waarop de door u aangegeven trefwoorden worden aangetroffen, worden door het programma getoond in een overzicht. In dat overzicht staan de links waarop u kunt klikken, zodat u gelijk naar de betreffende pagina kunt. Meestal krijgt u bij elke link een omschrijving zodat u ongeveer weet wat er op de bewuste pagina te vinden is.

De werking

Het is onmogelijk een search engine te maken die alle webpagina’s indexeert, maar er zijn wel programma’s die een groot deel van het Web bestrijken. Bij deze engines worden ook de meeste nieuwe adressen aangemeld, waardoor de kans op een succesvolle zoektocht daar het grootste is.
Hoe komt een search engine nu aan die nieuwe adressen? In de eerste plaats worden die door de makers van de pagina’s aangemeld. Daarnaast bevatten de meeste engines zogenaamde ‘spiders’ of ‘robots’. Dat zijn programma’s die zelfstandig het Net kunnen afspeuren op zoek naar nieuwe pagina’s en hun inhoud. De spiders houden de zaak ook up to date. Gegevens van pagina’s die niet meer bestaan, worden regelmatig verwijderd uit de database. Wanneer een pagina uit de database een link bevat, dan wordt ook die bezocht en aan de database toegevoegd. Zo worden er dagelijks gigantische hoeveelheden pagina’s afgezocht. Hoe de gegevens worden verwerkt, verschilt per search engine, evenals de frequentie waarmee de database wordt bijgehouden. Sommige robots gaan dagelijks aan de slag, terwijl andere het rustiger aan doen. Bij sommige search engines is er een menselijke redactie die de pagina’s verwerkt.
Om een search engine te laten werken, is een heleboel apparatuur nodig, wat veel kosten met zich meebrengt. Toch is het gebruik van de zoekmachines gratis. Hoe kan dat? Het antwoord is: reclame. Een populaire engine trekt per dag heel wat bezoekers. Web Crawler wordt bijvoorbeeld per dag rond de vijf miljoen keer geraadpleegd! Dat is voor adverteerder dus bijzonder aantrekkelijk, zodat zij graag voor heel veel geld willen adverteren.

Er zijn ook zoekmachines die wat anders werken. Een voorbeeld hiervan is Yahoo: deze zoekmachine toont categorieŽn met subcategorieŽn. Zo is er bijvoorbeeld de categorie Business and Economy, met als subcategorie Companies en als subsubcategorie Books. In elke categorie zijn verwijzingen opgenomen naar relevante pagina’s. De indeling gebeurt handmatig, zodat de indeling ook heel betrouwbaar is.
Verder zijn er nog zoekmachines die zelf weer zoekacties ondernemen bij andere zoekmachines. Deze noemen we meta search engines.

Het zoekprincipe

De werking van de grootste engines ontloopt elkaar niet veel. Als u een search engine bezoekt, is er altijd een invulveld te vinden waarin u een of meer trefwoorden kunt invullen. Verder is er altijd een knop waarmee u de engine na het invullen aan het werk zet.
De meeste engines zitten slim in elkaar en proberen een opdracht zo goed mogelijk te analyseren. Het eerste wat u kunt proberen, is een of meer trefwoorden op te geven, of een omschrijving van wat u zoekt. Wanneer u bijvoorbeeld op zoek bent naar informatie over bruine teddyberen, dan kunt u een poging wagen in de vorm van de woorden bruine teddyberen. Als u Nederlandse woorden invult, is dat geen probleem omdat de meeste Nederlandse pagina’s ook worden aangemeld bij de grote Engelstalige zoekmachines. Aan de andere kant moet u wel beseffen dat u dan ook alleen Nederlandse pagina’s zult vinden (of het Nederlandse woord moet per ongeluk ook in een andere taal voorkomen, met godweetwelke betekenis).
Wanneer het woord dat u invult, erg algemeen is, zal het aantal pagina’s dat gevonden wordt, enorm groot zijn. Wilt u effectief zoeken, dan moet u een meer gedetailleerde zoekopdracht geven, dus uw zoekopdracht verfijnen. Het kiezen van de juiste woorden is een kunst. Zoekt u naar appels of mag het fruit zijn? Of alleen Granny Smith? Zoekt u iets over Karel Appel of over een appel?

Logische operatoren

U kunt een zoekopdracht verfijnen met behulp van zogenaamde logische operatoren (de zogenaamde boolean search). U kunt dan bijvoorbeeld aangeven dat wilt zoeken op het woord Internet, maar dat u niet geÔnteresseerd bent in pagina’s die over E-mail gaan. Verder kunt u aangeven dat een pagina verschillende woorden moet bevatten. Als u handig om kunt gaan met dit soort technieken, zult u veel beter zoekresultaat hebben.
De logische operatoren zijn: AND, OR, NOT en NEAR.
Zo zal een zoekopdracht waarin u eenvoudigweg de woorden jul en jut achter elkaar zet (wat hetzelfde is als wanneer u er OR tussen zet), pagina’s opleveren waarin jut voorkomt, alsmede pagina’s waarin jul voorkomt, alsmede pagina’s waarin ze beide voorkomen. De opdracht jut AND jul (maak er een gewoonte van de boolean phrase, de logische operator, in hoofdletters te zetten) levert alleen pagina’s op waarin beide woorden voorkomen. Bij sommige engines kan men ook een plusteken voor het woord zetten om aan te geven dat er per se in voor moet komen: jut + jul (of: +jut +jul).
De opdracht auto NOT Fiat maakt duidelijk dat u alle pagina’s zoekt waarin het woord auto voorkomt, behalve die waarin het woord Fiat voorkomt. Denk eraan dat u dan ook een pagina waarin de zin staat: "wij houden van elke auto behalve als het een Fiat is" niet in de lijst zult gaan aantreffen!
Wilt u heel precies naar een zinsnede of een woordcombinatie zoeken, dan kunt u het hele stuk tussen aanhalingstekens plaatsen: "Annie M.G. Schmidt" .
Met de logische operator NEAR kunt u aangeven dat de ingevulde trefwoorden in de pagina’s bij elkaar moeten staan. Afhankelijk van de zoekmachine wordt er dan gezocht naar woorden die vlak naar elkaar staan. Voorbeeld: pink NEAR floyd zoekt alleen naar die pagina’s waarin de woorden pink en floyd vlak naast elkaar staan. De meeste zoekmachines gaan overigens een stap verder: u kunt aangeven hoever de woorden uit elkaar mogen staan. U kunt bijvoorbeeld werken met de zoekopdracht pink NEAR/10 floyd: hierbij wordt gezocht naar pagina’s waar beide woorden binnen een afstand van tien woorden van elkaar voorkomen.
De logische operatoren kunt u direct in het invulveld opgeven. De meeste zoekmachines hebben echter ook de mogelijkheid om via een menu aan te geven welke logische operator u wilt hebben.
Overigens: de meeste zoekmachines maken geen onderscheid tussen hoofd- en kleine letters, maar voor alle zekerheid kunt u beter wel gebruik maken van kleine letters.

De logische operatoren kunnen ook nog gecombineerd worden, zodat ingewikkelde zoekopdrachten ontstaan zoals: (dieren OR animals OR animaux) AND (mensen OR people OR hommes) NOT Darwin.

De zoekmachines

Altavista (www.altavista.digital.com)

Aantal pagina’s in database: 100 miljoen
Updatefrequentie: 1 dag tot drie maanden
Altavista neemt ook de inhoud van nieuwsgroepen op in de database.
U kunt zoeken naar afbeeldingen. U doet dit door in het invulveld aan te geven: image:naam (waarbij voor naam het onderwerp ingevuld wordt waarvan u een afbeelding zoekt. Bijvoorbeeld: image:clinton.
U kunt ook nog op vergelijkbare wijze andere dingen specificeren. De help-functie van het programma geeft daarvoor aanwijzingen.
Altavista laat een beknopte beschrijving zien van elke gevonden pagina. Verder is de omvang van de pagina in bytes aangegeven. Ook de datum van aanmelding van de pagina wordt weergegeven, evenals de taal ervan.

Excite (www.excite.com)

 

Copyright © 1999 Megalink.nl    ALL RIGHTS RESERVED.    Design by Webmaster Mario