Wer suchet der findet - Suchdienste im Internet
R.-I. Stempfle / B. Brandel
Die Fülle der Informationen im Internet nimmt Tag für Tag zu.
Die Pessimisten verzweifeln an der unübersichtlichen,
ungeordneten, chaotischen Menge von Informationen,
greifen kraftvoll in die Jammerharfe und bringen sie dahingehend
zum Erklingen, dass
zuviel Information eigentlich schon wieder Nicht-Information sei.
Die Optimisten hingegen freuen sich über dieses riesige
Informationsangebot, da es mit dem Internet möglich ist, die
neuesten und aktuellsten Fakten in wissenschaftliche Arbeiten,
Seminararbeiten und Referate einbringen zu können.
Mit dem zunehmenden
Informationsangebot im Internet wächst auch die Notwendigkeit,
für ein zu bearbeitendes Thema neben der gewohnten Recherche
in der Bibliothek auch eine Recherche im Internet durchzuführen.
So sind beispielsweise die neuesten Firmendaten für
Wirtschaftswissenschaftler
oder die aktuellsten Ergebnisse einer Grabungskampagne für Archäologen
nicht in einem längst gedruckten Buch sondern eben im Internet zu
finden.
Kein erfahrener Benutzer einer großen Bibliothek fühlt sich durch den
Anblick der
zigtausendfachen Masse von Büchern erschlagen, nein, es gibt und gab
immer Suchinstrumentarien, um die gewünschte Literatur zu finden:
Früher die Karteikästen, dann den Microfiche, heute
den Online Public Access Catalogue, kurz OPAC. Bibliotheken
benutzen wir schon seit vielen
Generationen, wir sind es gewohnt, mit ihnen umzugehen.
Mit dem neuen Medium Internet
ist erst unsere Generation konfrontiert.
Doch auch dafür stehen Suchinstrumentarien zur Verfügung, nämlich
die Suchdienste im Internet.
Von diesen Suchdiensten gibt es verschiedene Arten, die wir hier kurz
vorstellen möchten.
1. Suchmaschinen
Als "Suchmaschinen" werden alle diejenigen Suchdienste bezeichnet,
die auf ihrer Hauptseite ein Eingabefeld bieten, in das der Suchende
einen Suchbegriff eingeben kann, danach klickt er mit der Maus
auf ein ebenfalls auf dieser Seite befindliches
Startknöpfchen:
Daraufhin rappelt es, je nachdem, wie gut das Internet gerade läuft,
mehr oder weniger lang in der Kiste und der Suchende
wird mit 100.000 oder mehr Suchresultaten beglückt.
Das Wort "Suchmaschinen" steht im obigen Satz deswegen
in Anführungsstrichen, da der Endanwender mit einer Maschine
gar nicht konfrontiert wird. Die sogenannte Maschine ist in Wirklichkeit
ein von den Betreibern eines derartigen Suchdienstes entwickeltes
Computerprogramm, das diese über die gesamte Welt hinweg zum Einsatz bringen.
Ziel dieses Programms ist es, die World-Wide-Web-Server nach dort angebotenen
Internetseiten
zu überprüfen, sie zu scannen, vergleichbar, wie ein Antivirenprogramm
die Dateien eines Computers nach Viren scannt.
Nach Auffindung der Internet-Seiten, genauer gesagt der HTML-Seiten
- derjenigen Dateien, die in der HyperText Markup
Language abgefasst sind, der Sprache für Dokumente im
Internet - staubsaugern
diese Progamme Informationen daraus auf, schicken die so gewonnenen
Informationen zum Suchdienstbetreiber zurück und füttern dessen
Datenbank mit diesen Informationen.
Je nach Suchdienst sind diese Informationen reichhaltig oder weniger
reichhaltig. Dies ist von der Programmierung des Suchprogramms
und der entsprechend gestalteten Datenbank abhängig. Die Suchprogramme
laden die Seiten, stellen ihre Internet-Adresse, genannt
Uniform Resource Locator oder kurz URL
(Ein URL-Beispiel ist http://www.ku-eichstaett.de/
für die Katholische Universität Eichstätt.), fest,
prüfen die Seiten und extrahieren Informationen daraus, um die Seiten
beschreiben zu können. Einige arbeiten einfacher und listen
alle auf einer Seite vorkommenden Wörter auf, andere aufwendiger,
indem sie
ganze Wortgruppen zusammenfassen.
Wieder andere versuchen "sogar anhand von Konzepten die Dokumente
Themenkreisen zuzuordnen", weswegen bei der Abfrage auch Seiten
gefunden werden, "in denen der Suchbegriff
nicht vorkommt" (Lynch, Clifford : Weltbibliothek Internet?,
in : Spektrum der Wissenschaft, Mai 1997, 90 - 94.),
wie der Suchdienst Excite (Excite : http://www.excite.com/
Auch mit einstellbarer deutscher Version.).
Die Namen dieser Suchprogramme lauten robots und - jetzt kommt
die Suchdienst-Zoologie - spider (Spinne) und crawler
(Kriechtier).
Manche Suchdienste haben sich ihren Namen nach diesen Tieren gegeben:
So zum Beipiel der Suchdienst Lycos (
Lycos : http://www.lycos.com/ für die amerikanische Fassung,
http://www.lycos.de/ für die deutsche Fassung, das "de" steht
für Deutschland..
Lycos kommt von der
lateinischen Bezeichnung der Spinnengattung der Lycosidae
(abgeleitet aus dem griechischen Wort
für Wolf),
den Wolfsspinnen,
die ihre Beute nicht in Netzen fangen, sondern aus Höhlen heraus,
schnell, wie ein schwarzer Blitz, zu Fuß erjagen.
Der Suchdienst will damit signalisieren, dass er einen Suchroboter einsetzt,
also "roboterbasiert" ist und den Anspruch erhebt, sehr
schnell zu sein.
Andere Beispiele - um nur einige zu nennen - sind der
italienische Suchdienst
Il Ragno Italiano (
Il Ragno Italiano : http://ragno.ats.it/ in italienischer Sprache;
http://ragno.ats.it/indexuk.html in englischer Sprache (Italian Spider).
Weitere Suchdienste zu Italien sind zu finden unter
http://ku-eichstaett.de/WWF/Suche/Europa/it.htm .,
die italienische Spinne, und der
WebCrawler (WebCrawler : http://webcrawler.com/ .),
ein amerikanischer Suchdienst.
Die Recherche bei einer sogenannten Suchmaschine startet nicht eine
Suche im gesamten Internet, sondern ist letzten Endes nichts anderes
als eine Datenbank-Abfrage in der Datenbank eines Suchdienstbetreibers,
die durch Suchroboter erstellt wurde. Die so entstandene Datenbank ist
maschinell entstanden und daher unintelligent.
Fragt man beispielsweise nach Pater Rupert Mayer, so erhält man nicht nur
die Seiten zu der Biographie des Pater Rupert Mayer,
sondern darüber hinaus auch Seiten ganz
anderen Inhalts, wenn nur jemand im Internet seine Adresse angibt und
in einer Pater-Rupert-Mayer-Straße wohnt.
Wenn diese Seite wie übrigens alle Beiträge der Zeitschrift INKUERZE des
Rechenzentrums der Katholischen Universität Eichstätt
im Internet erscheint, wird bei einer Abfrage zu Pater Rupert Mayer
in einer Suchmaschine
auch diese Seite erscheinen, möglicherweise sogar ganz vorne, denn
Pater Rupert Mayer ist hier bis jetzt fünfmal erwähnt.
Je häufiger ein Suchbegriff auf
einer Seite erscheint, desto einschlägiger gilt diese Seite für
eine Suchmaschine
und dann wird sie ganz vorne platziert. Die besten Resultate einer
Datenbankabfrage stehen nämlich immer ganz vorne.
Dabei ist es aber vollkommen egal, ob sich eine solche Seite nun wirklich
mit Pater Rupert Mayer beschäftigt, oder ob sie eigentlich,
wie hier in einem Text zu Suchdiensten, einen
ganz anderen Inhalt hat und der Selige Rupert Mayer S.J. nur als Beispiel
gewählt wurde. (Jetzt ist Rupert Mayer schon achtmal erwähnt.)
Man kann mehrere Suchbegriffe, durch Leerzeichen getrennt, eingeben, z.B.
Pater Rupert Mayer.
Die Suchmaschinen schaufeln dann kritiklos alles heran:
Gute, mittelmäßige und schlechte WWW-Seiten, und dies in Hülle und Fülle,
nämlich alle Patres, alle Ruperts und alle Mayers.
Es gibt allerdings ein Remedium, um diese Flut etwas eindämmen zu können.
Zum Beispiel gibt es in der Suchmaschine Alta
Vista (http://altavista.digital.com/ Der amerikanische Suchdienst
hat zur Zeit einen Prozess einer gleichnamigen europäischen Firma wegen des
Namens am Hals.)
die Möglichkeit der erweiterten Suche. Dort kann mit Hilfe von logischen
Operatoren der Booleschen Algebra (George Boole, englischer
Mathematiker, 2.11.1815 - 8.12.1864. Er entwickelte 1854 die nach
ihm benannnte Boolesche Algebra.) (AND, OR, bzw. NOT) die
Suche eingeschränkt werden. Mit
eichiner AND volksmusik
findet Alta Vista alle WWW-Seiten, die sowohl den Namen Eichiner als auch
den Begriff Volksmusik enthalten, und somit auch den Volksmusikexperten
unserer Universität, Herrn Dr. Eichiner.
Mit der Verknüpfung NEAR findet man WWW-Seiten,
in denen beide Suchbegriffe nahe
nebeneinanderstehen, wobei die Reihenfolge keine Rolle spielt.
Mit NOT sucht man WWW-Seiten, die den einen aber nicht den
anderen Suchbegriff enthalten.
Mit OR findet man WWW-Seiten, die einen der beiden Suchbegriffe enthalten.
Im Gegensatz zum AND-Befehl ist diese Bindung nicht so stark.
2. Themenlisten
Themenlisten sind alphabetisch geordnete Listen zu allen nur
erdenklichen Themen. Zuvorderst steht meist eine grobe thematische Gliederung,
darunter beginnt oftmals in mehreren Ebenen
die feinere Struktur. Auf diese Art und Weise
muss man sich durchhangeln, um zum gewünschten Suchergebnis
zu gelangen. Das klingt zwar kompliziert, aber die Erfahrung zeigt,
dass selbst Anfänger sehr schnell mit solchen Suchdiensten erfolgreich
das Gesuchte finden. Deshalb ist die Suche mit Hilfe von Themenlisten
durchaus empfehlenswert.
Themenlisten werden auch als Kataloge,
virtual libraries oder Indizes bezeichnet.
Ein solcher Suchdienst wird dann als
"indexbasiert" charakterisiert. Die Praxis zeigte jedoch, dass niemand
im Suchdienstzusammenhang mit dem Begriff "Index" etwas
anfangen konnte. Was soll das sein, der DAX, der Dow Jones oder NASDAQ ?
Der Vorteil der Themenlisten liegt darin, dass sie von Menschen und nicht
automatisch durch Roboter- und Spinnenprogramme erstellt werden.
Menschen stellen die Themenlisten zusammen, wählen die zum Thema gehörigen
Seiten nach Überprüfung ihres Inhalts aus und präsentieren sie in einer
alphabetisch geordneten, intuitiv zu erschließenden Art und Weise. Wenn dort
auf einer Seite Pater Rupert Mayer daraufsteht, dann ist auch Pater
Rupert Mayer darin und nicht etwa dieser Artikel über Suchdienste.
Dies ist der Vorteil der Themenlisten.
Der Nachteil ist jedoch der, dass es Menschen völlig
unmöglich ist, alle Internetseiten zu erfassen. Daher
beschränken sich einige der Themenlisten sowieso von vorne herein darauf,
nur die besten,
inhaltsreichsten und fundiertesten
Seiten zu den jeweiligen Themen anzubieten. Sie vergeben Sterne, Punkte,
und Sonstiges für die nach ihrer Meinung besten Seiten.
Eine der bekanntesten und meistbenutzten Themenlisten ist YAHOO,
genau gesagt Yet Another Hierarchial Officious
Oracle. David Filo und Jerry Yang haben mit diesem Suchdienst
ein weltweites Unternehmen
begründet, dessen Aktien an der schon oben erwähnten Spezialbörse für
Technologiewerte, der NASDAQ, in New York, gehandelt
werden (National Association of Securities
Dealers Automated Quotation System (http://www.nasdaq.com/).).
Die ursprüngliche amerikanische Version ist zu finden unter
www.yahoo.com,
aber es gibt darüber hinaus viele länderspezifische Yahoos. Auch
in Deutschland haben David Filo und Jerry Yang
über ein Dutzend Arbeitsplätze geschaffen,
indem sie die deutschsprachige Version
dieses Suchdienstes in München aufmachten.
Man kann z.B. von der zentralen Suchdienstseite unserer Universität
http://www.ku-eichstaett.de/WWF/Suche/sdi.htm
über die Hierarchie der Links
Thematisch geordnete Listen
Deutschsprachige Themenlisten
Yahoo! Deutschland
Gesellschaft und Soziales- Stichwort: Religion
Theologie
Adressen für den suchenden Theologen
Bibliographische Nachforschungen
zur
gelangen.
Mit dem deutschsprachigen Yahoo (www.yahoo.de)
können Sie übrigens nicht nur deutschsprachige
sondern auch internationale WWW-Seiten finden.
Es ist sicherlich sinnvoll, sich schon weit im Vorfeld einer möglicherweise
unter Termindruck zu erstellenden Arbeit die Themenlisten auszusuchen, die
für das eigene Fachgebiet nützlich und reichhaltig sind.
Eine Themenliste, die beispielsweise zur Kunstgeschichte nur zwei
Einträge liefert, muss deswegen nicht schlecht sein. Ihr Schwerpunkt liegt
vielleicht statt dessen auf den Naturwissenschaften oder den
Wirtschaftswissenschaften.
Es gibt auch spezielle Themenlisten zu einzelnen Wissenschaften.
Einige Beispiele dazu sind unter
http://www.ku-eichstaett.de/WWF/Suche/Wissa/wissa.htm
zu finden.
Weitere Spezialsuchdienste kann man auch auf den Internet-Seiten
der einzelnen Institute und Lehrstühle unserer oder anderer
Universitäten finden.
3. Parallelsuchdienste
Parallelsuchdienste sind Zusammenstellungen von Suchmaschinen,
die nicht nur die Links zu den einzelnen Suchdiensten aufführen,
sondern darüber hinaus eine Schnittstelle zu jeder Suchmaschine
in Form eines Fensters für die Suchbegriffeingabe anbieten.
Aufwendig gestaltete Parallelsuchdienste verfügen zudem über
weitere Fenster, um die jeweiligen Suchoptionen der einzelnen
Suchmaschinen einstellen zu können.
In der Suchdienstgattung der simultanen Parallelsuche
steht nur ein Fenster für die
Suchbegriffeingabe zur Verfügung.
Der Suchdienst sucht dann zugleich in mehreren der wichtigsten
Suchmaschinen und liefert deren Suchergebnisse auf einer Seite.
Finden verschiedene Suchmaschinen ein WWW-Dokument gleichzeitig,
wird eine Mehrfachanzeige unterdrückt.
Bei manchen der simultanen Parallelsuchdiensten können über
Eingabefelder die einzelnen Suchmaschinen,
mit denen gesucht werden soll, ausgesucht und
manuell ein- oder abgestellt werden.
4. Fazit
Wer im World Wide Web fündig werden will, kann auf vielfältige Art und Weise
suchen, je nach Geschmack des Benutzers.
Man kann z.B. zuerst in den Themenlisten suchen, dann in den Suchmaschinen
und zuletzt, um die Suche wasserdicht zu machen, in den simultanen
Parallelsuchdiensten.
Alle hier erwähnten Suchdienste kann man unter der URL
http://www.ku-eichstaett.de/WWF/Suche/sdi.htm
finden, die man von der Homepage unserer Universität über "WWW-Angebote
außerhalb unserer Universität" und dort unter
"Übersichtsseiten und Suchdienste" erreicht.
Die Suchdiensthauptseite ist wie folgt gegliedert:
- Alphabetische Liste von Suchdiensten
- Anordnung der Suchdienste nach Suchdienstarten
- 2.1 Suche im World Wide Web
- Suchlisten:
- geographisch geordnete Listen
- thematisch geordnete Listen
- Suchmaschinen
- Suchdienstzentralen:
- Suchdienstlisten
- Parallelsuchdienste
- 2.2 Suche in anderen Internetdiensten
- Archie
- E-Mail
- FTP
- Gopher
- News
In das Suchdienstsystem ist weiterhin
ein europäisches Suchdienstsystem mit Links zu allen 45 europäischen Ländern
integriert. Das an unserer Universität angebotene Suchdienstsystem ist
sehr weitläufig und groß, man sollte es ganz einfach besuchen und
die dort gebotenen Suchdienste (über 800 sind es) ausprobieren.
Die letzte Auswertung des WWW-Servers der Kath. Universität Eichstätt
(siehe INKUERZE 2/97) zeigte,
wie beliebt die "Suchdienste im Internet" sind.
Unter den Seiten, die nicht direkt Hauptseiten der Fakultäten und
Verwaltungseinrichtungen der Universität sind, lagen an Position 1 und 3
aller aufgerufenen WWW-Seiten der Katholischen Universität Eichstätt
die Themenliste Aktien- und Devisenkurse
/WWF/Suche/Firmen/aktien.htm
und die Suchdiensthauptseite unserer Universität
/WWF/Suche/sdi.htm
Schauen Sie doch mal vorbei!
Ansprechpartner im URZ: | Zimmer: | Telefon: | PMail: |
Ralph-Ingo Stempfle | IN: | | ralph-ingo.stempfle |
Bernhard Brandel | IN: AS-201 | -1888 | bernhard.brandel |
Dr. Bernward Tewes | EI: eO-106 | -1667 | bernward.tewes |