Wer suchet der findet - Suchdienste im Internet

R.-I. Stempfle / B. Brandel


Die Fülle der Informationen im Internet nimmt Tag für Tag zu. Die Pessimisten verzweifeln an der unübersichtlichen, ungeordneten, chaotischen Menge von Informationen, greifen kraftvoll in die Jammerharfe und bringen sie dahingehend zum Erklingen, dass zuviel Information eigentlich schon wieder Nicht-Information sei. Die Optimisten hingegen freuen sich über dieses riesige Informationsangebot, da es mit dem Internet möglich ist, die neuesten und aktuellsten Fakten in wissenschaftliche Arbeiten, Seminararbeiten und Referate einbringen zu können. Mit dem zunehmenden Informationsangebot im Internet wächst auch die Notwendigkeit, für ein zu bearbeitendes Thema neben der gewohnten Recherche in der Bibliothek auch eine Recherche im Internet durchzuführen. So sind beispielsweise die neuesten Firmendaten für Wirtschaftswissenschaftler oder die aktuellsten Ergebnisse einer Grabungskampagne für Archäologen nicht in einem längst gedruckten Buch sondern eben im Internet zu finden.
Kein erfahrener Benutzer einer großen Bibliothek fühlt sich durch den Anblick der zigtausendfachen Masse von Büchern erschlagen, nein, es gibt und gab immer Suchinstrumentarien, um die gewünschte Literatur zu finden: Früher die Karteikästen, dann den Microfiche, heute den Online Public Access Catalogue, kurz OPAC. Bibliotheken benutzen wir schon seit vielen Generationen, wir sind es gewohnt, mit ihnen umzugehen. Mit dem neuen Medium Internet ist erst unsere Generation konfrontiert. Doch auch dafür stehen Suchinstrumentarien zur Verfügung, nämlich die Suchdienste im Internet. Von diesen Suchdiensten gibt es verschiedene Arten, die wir hier kurz vorstellen möchten.

1. Suchmaschinen

Als "Suchmaschinen" werden alle diejenigen Suchdienste bezeichnet, die auf ihrer Hauptseite ein Eingabefeld bieten, in das der Suchende einen Suchbegriff eingeben kann, danach klickt er mit der Maus auf ein ebenfalls auf dieser Seite befindliches Startknöpfchen: Daraufhin rappelt es, je nachdem, wie gut das Internet gerade läuft, mehr oder weniger lang in der Kiste und der Suchende wird mit 100.000 oder mehr Suchresultaten beglückt.
Das Wort "Suchmaschinen" steht im obigen Satz deswegen in Anführungsstrichen, da der Endanwender mit einer Maschine gar nicht konfrontiert wird. Die sogenannte Maschine ist in Wirklichkeit ein von den Betreibern eines derartigen Suchdienstes entwickeltes Computerprogramm, das diese über die gesamte Welt hinweg zum Einsatz bringen. Ziel dieses Programms ist es, die World-Wide-Web-Server nach dort angebotenen Internetseiten zu überprüfen, sie zu scannen, vergleichbar, wie ein Antivirenprogramm die Dateien eines Computers nach Viren scannt. Nach Auffindung der Internet-Seiten, genauer gesagt der HTML-Seiten - derjenigen Dateien, die in der HyperText Markup Language abgefasst sind, der Sprache für Dokumente im Internet - staubsaugern diese Progamme Informationen daraus auf, schicken die so gewonnenen Informationen zum Suchdienstbetreiber zurück und füttern dessen Datenbank mit diesen Informationen. Je nach Suchdienst sind diese Informationen reichhaltig oder weniger reichhaltig. Dies ist von der Programmierung des Suchprogramms und der entsprechend gestalteten Datenbank abhängig. Die Suchprogramme laden die Seiten, stellen ihre Internet-Adresse, genannt Uniform Resource Locator oder kurz URL (Ein URL-Beispiel ist http://www.ku-eichstaett.de/ für die Katholische Universität Eichstätt.), fest, prüfen die Seiten und extrahieren Informationen daraus, um die Seiten beschreiben zu können. Einige arbeiten einfacher und listen alle auf einer Seite vorkommenden Wörter auf, andere aufwendiger, indem sie ganze Wortgruppen zusammenfassen.
Wieder andere versuchen "sogar anhand von Konzepten die Dokumente Themenkreisen zuzuordnen", weswegen bei der Abfrage auch Seiten gefunden werden, "in denen der Suchbegriff nicht vorkommt" (Lynch, Clifford : Weltbibliothek Internet?, in : Spektrum der Wissenschaft, Mai 1997, 90 - 94.), wie der Suchdienst Excite (Excite : http://www.excite.com/ Auch mit einstellbarer deutscher Version.). Die Namen dieser Suchprogramme lauten robots und - jetzt kommt die Suchdienst-Zoologie - spider (Spinne) und crawler (Kriechtier). Manche Suchdienste haben sich ihren Namen nach diesen Tieren gegeben: So zum Beipiel der Suchdienst Lycos ( Lycos : http://www.lycos.com/ für die amerikanische Fassung, http://www.lycos.de/ für die deutsche Fassung, das "de" steht für Deutschland.. Lycos kommt von der lateinischen Bezeichnung der Spinnengattung der Lycosidae (abgeleitet aus dem griechischen Wort für Wolf), den Wolfsspinnen, die ihre Beute nicht in Netzen fangen, sondern aus Höhlen heraus, schnell, wie ein schwarzer Blitz, zu Fuß erjagen. Der Suchdienst will damit signalisieren, dass er einen Suchroboter einsetzt, also "roboterbasiert" ist und den Anspruch erhebt, sehr schnell zu sein. Andere Beispiele - um nur einige zu nennen - sind der italienische Suchdienst Il Ragno Italiano ( Il Ragno Italiano : http://ragno.ats.it/ in italienischer Sprache; http://ragno.ats.it/indexuk.html in englischer Sprache (Italian Spider). Weitere Suchdienste zu Italien sind zu finden unter http://ku-eichstaett.de/WWF/Suche/Europa/it.htm ., die italienische Spinne, und der WebCrawler (WebCrawler : http://webcrawler.com/ .), ein amerikanischer Suchdienst.
Die Recherche bei einer sogenannten Suchmaschine startet nicht eine Suche im gesamten Internet, sondern ist letzten Endes nichts anderes als eine Datenbank-Abfrage in der Datenbank eines Suchdienstbetreibers, die durch Suchroboter erstellt wurde. Die so entstandene Datenbank ist maschinell entstanden und daher unintelligent. Fragt man beispielsweise nach Pater Rupert Mayer, so erhält man nicht nur die Seiten zu der Biographie des Pater Rupert Mayer, sondern darüber hinaus auch Seiten ganz anderen Inhalts, wenn nur jemand im Internet seine Adresse angibt und in einer Pater-Rupert-Mayer-Straße wohnt. Wenn diese Seite wie übrigens alle Beiträge der Zeitschrift INKUERZE des Rechenzentrums der Katholischen Universität Eichstätt im Internet erscheint, wird bei einer Abfrage zu Pater Rupert Mayer in einer Suchmaschine auch diese Seite erscheinen, möglicherweise sogar ganz vorne, denn Pater Rupert Mayer ist hier bis jetzt fünfmal erwähnt. Je häufiger ein Suchbegriff auf einer Seite erscheint, desto einschlägiger gilt diese Seite für eine Suchmaschine und dann wird sie ganz vorne platziert. Die besten Resultate einer Datenbankabfrage stehen nämlich immer ganz vorne. Dabei ist es aber vollkommen egal, ob sich eine solche Seite nun wirklich mit Pater Rupert Mayer beschäftigt, oder ob sie eigentlich, wie hier in einem Text zu Suchdiensten, einen ganz anderen Inhalt hat und der Selige Rupert Mayer S.J. nur als Beispiel gewählt wurde. (Jetzt ist Rupert Mayer schon achtmal erwähnt.)
Man kann mehrere Suchbegriffe, durch Leerzeichen getrennt, eingeben, z.B. Pater Rupert Mayer. Die Suchmaschinen schaufeln dann kritiklos alles heran: Gute, mittelmäßige und schlechte WWW-Seiten, und dies in Hülle und Fülle, nämlich alle Patres, alle Ruperts und alle Mayers. Es gibt allerdings ein Remedium, um diese Flut etwas eindämmen zu können. Zum Beispiel gibt es in der Suchmaschine Alta Vista (http://altavista.digital.com/ Der amerikanische Suchdienst hat zur Zeit einen Prozess einer gleichnamigen europäischen Firma wegen des Namens am Hals.) die Möglichkeit der erweiterten Suche. Dort kann mit Hilfe von logischen Operatoren der Booleschen Algebra (George Boole, englischer Mathematiker, 2.11.1815 - 8.12.1864. Er entwickelte 1854 die nach ihm benannnte Boolesche Algebra.) (AND, OR, bzw. NOT) die Suche eingeschränkt werden. Mit eichiner AND volksmusik findet Alta Vista alle WWW-Seiten, die sowohl den Namen Eichiner als auch den Begriff Volksmusik enthalten, und somit auch den Volksmusikexperten unserer Universität, Herrn Dr. Eichiner. Mit der Verknüpfung NEAR findet man WWW-Seiten, in denen beide Suchbegriffe nahe nebeneinanderstehen, wobei die Reihenfolge keine Rolle spielt. Mit NOT sucht man WWW-Seiten, die den einen aber nicht den anderen Suchbegriff enthalten. Mit OR findet man WWW-Seiten, die einen der beiden Suchbegriffe enthalten. Im Gegensatz zum AND-Befehl ist diese Bindung nicht so stark.

2. Themenlisten

Themenlisten sind alphabetisch geordnete Listen zu allen nur erdenklichen Themen. Zuvorderst steht meist eine grobe thematische Gliederung, darunter beginnt oftmals in mehreren Ebenen die feinere Struktur. Auf diese Art und Weise muss man sich durchhangeln, um zum gewünschten Suchergebnis zu gelangen. Das klingt zwar kompliziert, aber die Erfahrung zeigt, dass selbst Anfänger sehr schnell mit solchen Suchdiensten erfolgreich das Gesuchte finden. Deshalb ist die Suche mit Hilfe von Themenlisten durchaus empfehlenswert.

Themenlisten werden auch als Kataloge, virtual libraries oder Indizes bezeichnet. Ein solcher Suchdienst wird dann als "indexbasiert" charakterisiert. Die Praxis zeigte jedoch, dass niemand im Suchdienstzusammenhang mit dem Begriff "Index" etwas anfangen konnte. Was soll das sein, der DAX, der Dow Jones oder NASDAQ ?

Der Vorteil der Themenlisten liegt darin, dass sie von Menschen und nicht automatisch durch Roboter- und Spinnenprogramme erstellt werden. Menschen stellen die Themenlisten zusammen, wählen die zum Thema gehörigen Seiten nach Überprüfung ihres Inhalts aus und präsentieren sie in einer alphabetisch geordneten, intuitiv zu erschließenden Art und Weise. Wenn dort auf einer Seite Pater Rupert Mayer daraufsteht, dann ist auch Pater Rupert Mayer darin und nicht etwa dieser Artikel über Suchdienste. Dies ist der Vorteil der Themenlisten. Der Nachteil ist jedoch der, dass es Menschen völlig unmöglich ist, alle Internetseiten zu erfassen. Daher beschränken sich einige der Themenlisten sowieso von vorne herein darauf, nur die besten, inhaltsreichsten und fundiertesten Seiten zu den jeweiligen Themen anzubieten. Sie vergeben Sterne, Punkte, und Sonstiges für die nach ihrer Meinung besten Seiten.

Eine der bekanntesten und meistbenutzten Themenlisten ist YAHOO, genau gesagt Yet Another Hierarchial Officious Oracle. David Filo und Jerry Yang haben mit diesem Suchdienst ein weltweites Unternehmen begründet, dessen Aktien an der schon oben erwähnten Spezialbörse für Technologiewerte, der NASDAQ, in New York, gehandelt werden (National Association of Securities Dealers Automated Quotation System (http://www.nasdaq.com/).). Die ursprüngliche amerikanische Version ist zu finden unter www.yahoo.com, aber es gibt darüber hinaus viele länderspezifische Yahoos. Auch in Deutschland haben David Filo und Jerry Yang über ein Dutzend Arbeitsplätze geschaffen, indem sie die deutschsprachige Version dieses Suchdienstes in München aufmachten.

Man kann z.B. von der zentralen Suchdienstseite unserer Universität

http://www.ku-eichstaett.de/WWF/Suche/sdi.htm
über die Hierarchie der Links

Thematisch geordnete Listen
Deutschsprachige Themenlisten
Yahoo! Deutschland
Gesellschaft und Soziales- Stichwort: Religion
Theologie
Adressen für den suchenden Theologen
Bibliographische Nachforschungen

zur

gelangen.

Mit dem deutschsprachigen Yahoo (www.yahoo.de) können Sie übrigens nicht nur deutschsprachige sondern auch internationale WWW-Seiten finden.

Es ist sicherlich sinnvoll, sich schon weit im Vorfeld einer möglicherweise unter Termindruck zu erstellenden Arbeit die Themenlisten auszusuchen, die für das eigene Fachgebiet nützlich und reichhaltig sind. Eine Themenliste, die beispielsweise zur Kunstgeschichte nur zwei Einträge liefert, muss deswegen nicht schlecht sein. Ihr Schwerpunkt liegt vielleicht statt dessen auf den Naturwissenschaften oder den Wirtschaftswissenschaften.
Es gibt auch spezielle Themenlisten zu einzelnen Wissenschaften. Einige Beispiele dazu sind unter

http://www.ku-eichstaett.de/WWF/Suche/Wissa/wissa.htm
zu finden. Weitere Spezialsuchdienste kann man auch auf den Internet-Seiten der einzelnen Institute und Lehrstühle unserer oder anderer Universitäten finden.

3. Parallelsuchdienste

Parallelsuchdienste sind Zusammenstellungen von Suchmaschinen, die nicht nur die Links zu den einzelnen Suchdiensten aufführen, sondern darüber hinaus eine Schnittstelle zu jeder Suchmaschine in Form eines Fensters für die Suchbegriffeingabe anbieten. Aufwendig gestaltete Parallelsuchdienste verfügen zudem über weitere Fenster, um die jeweiligen Suchoptionen der einzelnen Suchmaschinen einstellen zu können.

In der Suchdienstgattung der simultanen Parallelsuche steht nur ein Fenster für die Suchbegriffeingabe zur Verfügung. Der Suchdienst sucht dann zugleich in mehreren der wichtigsten Suchmaschinen und liefert deren Suchergebnisse auf einer Seite. Finden verschiedene Suchmaschinen ein WWW-Dokument gleichzeitig, wird eine Mehrfachanzeige unterdrückt. Bei manchen der simultanen Parallelsuchdiensten können über Eingabefelder die einzelnen Suchmaschinen, mit denen gesucht werden soll, ausgesucht und manuell ein- oder abgestellt werden.

4. Fazit

Wer im World Wide Web fündig werden will, kann auf vielfältige Art und Weise suchen, je nach Geschmack des Benutzers. Man kann z.B. zuerst in den Themenlisten suchen, dann in den Suchmaschinen und zuletzt, um die Suche wasserdicht zu machen, in den simultanen Parallelsuchdiensten.

Alle hier erwähnten Suchdienste kann man unter der URL

http://www.ku-eichstaett.de/WWF/Suche/sdi.htm
finden, die man von der Homepage unserer Universität über "WWW-Angebote außerhalb unserer Universität" und dort unter "Übersichtsseiten und Suchdienste" erreicht. Die Suchdiensthauptseite ist wie folgt gegliedert:

  1. Alphabetische Liste von Suchdiensten

  2. Anordnung der Suchdienste nach Suchdienstarten

    2.1 Suche im World Wide Web
    • Suchlisten:
      • geographisch geordnete Listen
      • thematisch geordnete Listen
      • Suchmaschinen
    • Suchdienstzentralen:
      • Suchdienstlisten
      • Parallelsuchdienste

    2.2 Suche in anderen Internetdiensten
    • Archie
    • E-Mail
    • FTP
    • Gopher
    • News

In das Suchdienstsystem ist weiterhin ein europäisches Suchdienstsystem mit Links zu allen 45 europäischen Ländern integriert. Das an unserer Universität angebotene Suchdienstsystem ist sehr weitläufig und groß, man sollte es ganz einfach besuchen und die dort gebotenen Suchdienste (über 800 sind es) ausprobieren.

Die letzte Auswertung des WWW-Servers der Kath. Universität Eichstätt (siehe INKUERZE 2/97) zeigte, wie beliebt die "Suchdienste im Internet" sind. Unter den Seiten, die nicht direkt Hauptseiten der Fakultäten und Verwaltungseinrichtungen der Universität sind, lagen an Position 1 und 3 aller aufgerufenen WWW-Seiten der Katholischen Universität Eichstätt die Themenliste Aktien- und Devisenkurse

/WWF/Suche/Firmen/aktien.htm

und die Suchdiensthauptseite unserer Universität

/WWF/Suche/sdi.htm

Schauen Sie doch mal vorbei!

Ansprechpartner im URZ:Zimmer: Telefon: PMail:
Ralph-Ingo Stempfle IN:   ralph-ingo.stempfle
Bernhard Brandel IN: AS-201-1888 bernhard.brandel
Dr. Bernward Tewes EI: eO-106-1667 bernward.tewes