SUCHE + SUCHMASCHINEN

 

SUCH- MASCHINEN
  • Um Informationen gezielt im Internet zu erhalten oder bestimmte Seiten zu finden, empfiehlt es sich eine der zahlreichen Suchmaschinen zu nutzen, siehe Provider 

  • Suchmaschinen sind sehr ähnlich aufgebaut. 

  • Nach Eingabe eines oder mehrerer Begriffe, Namen, Marken, Kategorien, o. ä.   startet man die Suchmaschine  

  • in der Regel erhält man eine Vielzahl von Möglichkeiten (Links) und wählt den gewünschten Hyperlink durch anklicken 

  • Bekannte Hyperlinks können auch direkt eingegeben werden (z.B. www.merz-it.com)

META-SUCH- MASCHINEN U. A.

Suchmaschinen, die andere Suchmaschinen auflisten oder verfügbar machen>; Z.B.:    META-SUCHMASCHINE - SUCHMASCHINEN-FÜHRER - Announcen-Suche

Spezialisierte Suchmaschinen sind themenorientiert; z.B.:   MUSIK MP3 - WAP-ANGEBOTE - NAMENS-SUCHE - ALL-THE-WEB - FOTOSUCHE - u.v.a.m.

QUANTITÄT

Man geht aktuell von ca. 500 Mio. bis 2 Mrd. Seiten aus, die durch Hyperlinks verbunden sind. Durch die Vielzahl der Verknüpfungen (Links) untereinander geht man davon aus, das jede Webpage von einer beliebigen anderen nur 19 Links entfernt ist. Sich also alles prinzipiell finden lässt. Heute geht man jedoch davon aus, das eine große Anzahl von Seiten mit konventionellen Suchtechniken nicht mehr erfasst werden können. 

SUCH- METHODEN
  • Softwareseitig orientierte Suchmaschinen bauen auf superschnelle Rechner mit gigantischer Kapazität und Servertechnologie, um die Verwaltung der Index-Datenbank zu realisieren (z.B. Alltheweb mit ca. 500 Mio. Seiten)

  • Hardwareseitig und mengenmäßig orientierte  Suchmaschinen bauen auf der Speicherung aller gefundenen Webseiten (z.B. Computerfarm mit 6000 Zentraleinheiten bei Google). Sie verwenden mathematische Verfahren, um Webseiten nach inhaltlichen Kriterien zu organisieren. Bewertet wird die Häufigkeit des Zugriffs auf eine Webseite, die die Wahrscheinlichkeit der Relevanz der Informationen erhöht.

  • Volltext-Indizierung ist eine andere  Methode, die auf Suchroboter basiert, die das Web durchsuchen und die jeden Begriff der in Dokumente n auftaucht der Index-Datenbank hinzufügt (siehe z.B. Altavista, die täglich über 20 Mio. Seiten durchforsten, d.h. ca. 800 DIN A4-Seiten pro Sekunde)

PROVIDER

z.B. Yahoo, Alta-Vista, Fireball, Crawler, Lycos, NathanGoogle u.v.a.m. siehe Suche, Suchmaschinen und Metasuche - siehe auch SUCHE

BEGRIFFE
  • Agenten:

  • Roboter: 

  • Einstiegs- oder Anfangsseiten: Beginn eines Katalogs, Zugangsseiten für andere Seiten (siehe z.B. Referatsthemen); Zentrale Knoten sind von hier aus gut erreichbar (ca. 25% der Seiten)

  • Knoten: auch Giant Strongly Connected Components (SCC), d.h. eng miteinander verknüpfte Seiten; gute Linkverbindungen zwischen den Angeboten; leicht zu finden (ca. 30% der Seiten)

  • Endpunkte: Angebote ohne weitere Links, höchstens Rückkehr zu Knotenseiten (ca. 25% der Seiten)

  • unverbundene Seiten (Tendrils): Seiten, die keine Verbindung zu anderen Seiten haben, z.B. Datenbanken von Firmen, Verbände oder Organisationen; oft in kryptischen Dateiformaten, Animation, Bilder oder Audiodateien sind ggf. integriert; da Agenten auf HTML-Seiten trainiert sind, werden diese Seiten kaum oder gar nicht gefunden (ca. 20% der Seiten)

BILD- FAHNDUNG

Grafisch orientierte Fahndung im Internet mittels Software in 3 Stufen:

  1. digitales Dokument (Foto, Negativ) wird eingescannt

  2. Das Programm rechnet die Abbildung in ein dreidimensionales Gittermodell um und vermisst spezifische Körpermerkmale (z.B. Abstand zwischen den Augen, Proportionalität, Maße)

  3. Die Bilder einer Datenbank, die aus dem Internet geladen wurde, werden mit den 3-D-Merkmalen verglichen. Bilder mit ähnlichen Merkmalen werden mit der Webadresse angezeigt.

Verwendung: Kinderpornografie; Suche nach vermissten Kindern / Personen; Nachweis von Marken-Fälschungen (Logos etc.). Siehe auch Steganografie

INFOS