Om informatie op internet te zoeken, maken we gebruik van zoekmachines.

We kunnen de zoekmachines in 2 categorieën indelen:

Zoekrobots of search engines. Zoekrobots zijn computers die voortdurend het web doorzoeken en de gevonden resultaten in een database bewaren.

Webgidsen, directories of catalogussen Dit zijn catalogussen die door mensen zelf samengesteld zijn. Ze worden eerst gecontroleerd en pas wanneer ze aan voldoende kwaliteitseisen voldoen, worden ze opgenomen in de gids.

 

Zo werkt een zoekmachine.

1. Het opzoeken van internetadressen

De zoekmachine is een computer die uitgerust is met speciale software (= spider). Deze spider is voortdurend op jacht:

• leest elke internetpagina en stuurt de inhoud door naar de zoekmachine

• volgt alle links op webpagina's en stuurt ook deze inhoud door naar de zoekmachine

• komt geregeld terug bij reeds gevonden pagina's om te controleren of er iets gewijzigd werd

• het werk van een zoekmachine is dus nooit af

 

2. Het opslaan van de gevonden internetadressen

Alle webpagina's die door de spider worden doorgestuurd, worden geïndexeerd en opgenomen in een database (= reuzengrote tabel). Zo'n database kan honderden miljoenen pagina's bevatten. Iedere zoekmachine gebruikt zijn eigen methodes om deze database aan te leggen. Vandaar dat je vaak een ander resultaat krijgt als je eenzelfde zoekopdracht uitvoert met verschillende zoekmachines.

3. Tonen van het zoekresultaat

Iedere zoekmachine biedt de gebruiker een zoekpagina met een vak waarin een zoekopdracht getypt kan worden. Na het invoeren van de zoekopdracht gaat de zoekmachine op zoek in zijn database naar de gevraagde informatie. Als je dus iets opzoekt met een zoekmachine, zoek je niet op het echte internet, maar in een database.

De zoekmachines geven als resultaat een lijst met gevonden webpagina's. Hoe hoger de webpagina in de lijst voorkomt hoe relevanter. Iedere zoekmachine gebruikt een eigen manier om webpagina's te rangschikken. Zo wordt er o.a. rekening gehouden met hoeveel keer het zoekwoord op de pagina voorkomt, of het ook in titels en kopteksten voorkomt. Er wordt gekeken naar het aantal koppelingen van en naar een pagina. Er wordt ook rekening gehouden met het aantal keer dat de pagina bezocht wordt.