Wie funktioniert eine Suchmaschine?

 

"Suchmaschinen" sind umfangreiche Computerprogramme, mit denen man im Internet systematisch suchen kann.

Es gibt viele verschiedene Suchmaschinen und sie liefern unterschiedliche Ergebnisse, auch wenn man die gleichen Suchbegriffe eingibt. Lästig ist bei vielen Suchmaschinen die Werbung und außerdem dauert die Suche lange.

Damit eine Suchmaschine möglichst schnell die passenden Verweise (Links) anzeigen kann, bedarf es einiger Vorarbeiten.


 

Arbeitsschritte

Jede Suchmaschine arbeitet deshalb in mehreren Arbeitsschritten, die zunächst in drei Arbeitsphasen aufgeteilt werden:

 


 

1. Erfassen von www-Dokumenten

Damit eine Suchmaschine immer aktuelle Suchergebnisse bieten kann, müssen regelmäßig die bereits erfassten Dokumente überprüft und neue aufgenommen werden.

Dazu hat jede Suchmaschine einen Programmteil, der auch als "Suchroboter&qout; bezeichnet wird.

Der "Suchroboter&qout; sucht der Reihe nach Server für Server ab, indem er jedes Dokument herunterlädt und auswertet. Bei der Auswertung wird jeder Text vollständig analysiert und die Begriffe erfasst.

 

2. Sortieren aller gefundenen Begriffe

Die erfassten Begriffe werden anschließend sortiert und gespeichert. Außerdem werden die Fundstellen registriert, also die Internet-Adressen der einzelnen Seiten in denen die Begriffe gefunden wurden.

Darüber hinaus werden von den Suchmaschinen die Titel, Datum und sogar knappe Textauszüge gespeichert: all das, was man nach der Recherche als Information zu jeder Seite erhält.

 

3. Zusammenstellen einer Verweisliste

Wenn man die Suchmaschine aufgerufen und seine Suchbegriffe in das Eingabefeld eingetragen hat, wird der letzte Arbeitsschritt der Suchmaschine bewirkt. Die eingegebenen Begriffe werden in der vorbereiteten Datensammlung gesucht.

Anschließend werden die dazugehörigen Fundstellen und weitere Informationen zusammengeführt und die erwünschte Liste mit den Suchergebnissen ausgegeben. Über das Internet wird dieses Ergebnis dann von der Suchmaschine zum Nutzer übertragen.

 

Warum sind die Rechercheergebnisse so unterschiedlich?

Suchmaschinen zeigen bei Eingabe gleicher Stichworte unterschiedliche Ergebnisse an. Dies hat verschiedene Ursachen, die keineswegs zufällig sind. So begründen sich die Unterschiede in abweichenden Formen

  • der Dokumentenerfassung,
  • der Auswertung sowie
  • der Zusammenstellung der Suchergebnisse.

 

Verfahren zur Seitenerfassung

Suchmaschinen erfassen nur solche Server mit ihren Dokumenten, die registriert sind. So kann man beispielsweise eine Schulhomepage bei ausgewählten Suchmaschinen anmelden, damit diese erfasst und zur Information angeboten wird.

Da aber nicht jeder Webmaster bei allen Suchmaschinen seine Homepage anmeldet, ergeben sich hierdurch voneinander abweichende Informationen. Vorsichtigen Schätzungen zufolge sind lediglich rund 20 Prozent aller öffentlich zugänglichen www-Dokumente von Suchmaschinen erfasst.

 

Auswertung

Ebenso wie bei der Erfassung durch den "Suchroboter" ergeben sich Unterschiede bei der Auswertung der erfassten Dokumente.

Die Unterschiede ergeben sich u.a. durch den Umfang und der ausgewerteten Textpassagen. Manche Suchmaschine wertet den vollständigen, im Browser sichtbaren Text aus, andere erfassen zudem die unsichtbaren Texte, die in dem Dokument programmiert sind. Dazu ge