SUCH-
MASCHINEN |
-
Um
Informationen gezielt im Internet zu erhalten oder bestimmte Seiten zu
finden, empfiehlt es sich eine der zahlreichen
Suchmaschinen zu nutzen, siehe Provider
-
Suchmaschinen
sind sehr ähnlich aufgebaut.
-
Nach
Eingabe eines oder mehrerer Begriffe, Namen, Marken, Kategorien, o. ä.
startet man die Suchmaschine
-
in
der Regel erhält man eine Vielzahl von Möglichkeiten (Links) und
wählt den gewünschten
Hyperlink
durch anklicken
-
Bekannte
Hyperlinks können auch direkt eingegeben werden (z.B. www.merz-it.com)
|
META-SUCH-
MASCHINEN U. A. |
Suchmaschinen, die andere Suchmaschinen auflisten oder
verfügbar machen>; Z.B.: META-SUCHMASCHINE
- SUCHMASCHINEN-FÜHRER - Announcen-Suche
-
Spezialisierte Suchmaschinen sind themenorientiert;
z.B.: MUSIK MP3 - WAP-ANGEBOTE
- NAMENS-SUCHE - ALL-THE-WEB
- FOTOSUCHE -
u.v.a.m.
|
QUANTITÄT |
Man geht aktuell von ca. 500 Mio. bis 2 Mrd. Seiten aus,
die durch Hyperlinks verbunden sind. Durch die Vielzahl der Verknüpfungen
(Links) untereinander geht man davon aus, das jede Webpage von einer
beliebigen anderen nur 19 Links entfernt ist. Sich also alles prinzipiell
finden lässt. Heute geht man jedoch davon aus, das eine große Anzahl von
Seiten mit konventionellen Suchtechniken nicht mehr erfasst werden
können.
|
SUCH-
METHODEN |
-
Softwareseitig orientierte Suchmaschinen bauen auf
superschnelle Rechner mit gigantischer Kapazität und
Servertechnologie, um die Verwaltung der Index-Datenbank zu
realisieren (z.B. Alltheweb mit
ca. 500 Mio. Seiten)
-
Hardwareseitig und mengenmäßig orientierte
Suchmaschinen bauen auf der Speicherung aller gefundenen Webseiten
(z.B. Computerfarm mit 6000 Zentraleinheiten bei Google).
Sie verwenden mathematische Verfahren, um Webseiten nach inhaltlichen
Kriterien zu organisieren. Bewertet wird die Häufigkeit des Zugriffs
auf eine Webseite, die die Wahrscheinlichkeit der Relevanz der
Informationen erhöht.
-
Volltext-Indizierung ist eine andere Methode, die auf
Suchroboter basiert, die das Web durchsuchen und die jeden Begriff der
in Dokumente n auftaucht der Index-Datenbank hinzufügt (siehe z.B. Altavista,
die täglich über 20 Mio. Seiten durchforsten, d.h. ca. 800 DIN
A4-Seiten pro Sekunde)
|
PROVIDER |
z.B. Yahoo, Alta-Vista, Fireball, Crawler,
Lycos, Nathan, Google,
u.v.a.m.
siehe Suche, Suchmaschinen
und Metasuche - siehe auch SUCHE
|
BEGRIFFE |
-
Agenten:
-
Roboter:
-
Einstiegs- oder Anfangsseiten: Beginn eines Katalogs,
Zugangsseiten für andere Seiten (siehe z.B. Referatsthemen);
Zentrale Knoten sind von hier aus gut erreichbar (ca. 25% der Seiten)
-
Knoten: auch Giant Strongly
Connected Components
(SCC), d.h.
eng miteinander verknüpfte Seiten; gute Linkverbindungen zwischen den
Angeboten; leicht zu finden (ca. 30% der Seiten)
-
Endpunkte: Angebote ohne weitere Links, höchstens Rückkehr
zu Knotenseiten (ca. 25% der Seiten)
-
unverbundene Seiten (Tendrils): Seiten, die keine Verbindung zu
anderen Seiten haben, z.B. Datenbanken von Firmen, Verbände oder
Organisationen; oft in kryptischen Dateiformaten, Animation, Bilder
oder Audiodateien sind ggf. integriert; da Agenten auf HTML-Seiten
trainiert sind, werden diese Seiten kaum oder gar nicht gefunden (ca.
20% der Seiten)
|
BILD-
FAHNDUNG |
Grafisch orientierte Fahndung im Internet mittels
Software in 3 Stufen:
-
digitales Dokument (Foto, Negativ) wird eingescannt
-
Das Programm rechnet die Abbildung in ein dreidimensionales
Gittermodell um und vermisst spezifische Körpermerkmale (z.B. Abstand
zwischen den Augen, Proportionalität, Maße)
-
Die Bilder einer Datenbank, die aus dem Internet geladen wurde,
werden mit den 3-D-Merkmalen verglichen. Bilder mit ähnlichen
Merkmalen werden mit der Webadresse angezeigt.
Verwendung: Kinderpornografie; Suche nach vermissten Kindern /
Personen; Nachweis von Marken-Fälschungen (Logos etc.). Siehe auch Steganografie
|
INFOS |
|