Wirtschaft

Was eine neue Suchmaschine aus Hagen Google voraus hat

Prof. Herwig Unger (links) und Privatdozent Mario Kubek umgeben von Servern, die riesige Datenmengen speichern können.

Prof. Herwig Unger (links) und Privatdozent Mario Kubek umgeben von Servern, die riesige Datenmengen speichern können.

Foto: Volker Wiciok

Hagen.   Wissenschaftler der Fernuniversität Hagen haben eine Alternative zu Google & Co. entwickelt, die gleich zwei Probleme auf einmal lösen soll.

Es gibt derzeit rund 1,7 Milliarden Internetseiten. Das würde es recht schwer machen, darunter die zu finden, die gerade weiterhelfen, wenn es keine Suchmaschinen gäbe. Doch, es gibt immer noch mehrere, auch nach dem gigantischen, weltweiten Siegeszug von Google. Und nun existiert sogar noch eine neue. Eine ganz andere. Eine in Hagen an der Fernuni entwickelte. Sie heißt WebEngine. Aber wie sie funktioniert, ist für Nicht-Informatiker nicht ganz so leicht zu verstehen.

Der Informatik-Professor Herwig Unger, Leiter des Lehrgebiets Kommunikationsnetze, und Privatdozent Dr. Mario Kubek versuchen es trotzdem. Dazu sollte man zunächst wissen, wie herkömmliche Suchmaschinen arbeiten: Wenn ich vier Suchworte eingebe, um beispielsweise etwas über die Wasserqualität der Stauseen im Sauerland zu erfahren, dann findet Google (oder Bing oder Yahoo) für jedes Wort mehrere Millionen Ergebnisse. Die werden übereinandergelegt, d.h. miteinander kombiniert. Und die, in denen alle Worte auftauchen, bekomme ich präsentiert. Es werden also gewaltige Datenmengen durchwühlt, und beim Suchmaschinenbetreiber bleiben gewaltige Datenmengen hängen: Informationen über die Suchenden und die Suche selbst.

Der Erfolg von Google erklärt sich aus deren Popularität und aus dem der Qualität des sogenannten PageRank-Algorithmus, der die Reihenfolge der Suchergebnisse festlegt und entscheidet, was wird für den Suchenden wohl interessant sein.

Ganz so schlecht funktioniert das nicht. Aber Herwig Unger und Mario Kubek stört daran allerlei: Alle Infos landen zentral bei großen Firmen, die viele sogar als Datenkraken bezeichnen. Viele Ergebnisse sind nicht mehr aktuell. Der Stromverbrauch – allein Google betreibt knapp eine Million Server und benötigt dafür 0,015 Prozent des Weltenergie – ist gewaltig.

Small Data statt Big Data

Das ist der Preis für Big Data, ca. 1,2 Cent pro Suche. Die Hagener Wissenschaftler dagegen setzen auf Small Data und eine dezentrale Organisation. Auf ein „natürliches“ Suchverhalten, wie man es aus dem täglichen Leben unter Freunden kennt. Unger erklärt, was er damit meint: „Wenn wir früher in eine Bibliothek gegangen sind, haben wir z.B. etwas über Differenzialgleichungen im mathematischen Sachkatalog und dann in einer Spezialsektion derselben gesucht und dort unsere Stichworte gefunden. Aber derartige Hierarchien oder auch Wegweiser gibt es im Internet nicht. Jede Information ist an einem Ort gespeichert, der mit ihrem Inhalt nichts zu tun hat.“ Das macht die Suche so aufwendig.

Unger und Kubek fragten sich nun, wie sie Informationen kategorisieren könnten, ohne dass Menschen ordnend eingreifen müssten. Sie hatten eine Idee: So wie man für einen physikalischen Körper einen Massenschwerpunkt als Repräsentant berechnen kann, müsste sich für einen Textinhalt auch ein Schlüsselwort errechnen lassen, ein Bedeutungsschwerpunkt. Der muss gar nicht in den Suchwörtern vorkommen. Für „Vogel“, „Grippe“ und „Virus“ könnte das etwa „H5N1“ sein. Für „Stadt“ und „Analyse“ etwa „Verkehr“. Die Maschine soll reagieren wie ein Mensch: Wenn einer von Palmen, Strand und Wasser erzählt und ein anderer von Bergen, Seen und Wäldern, ist unsereinem klar, dass beide vom Urlaub sprechen. Das wäre das Schlüsselwort.

Eine kleine Auswahl mit Bezug

Auf diese Weise findet sich eine eher kleine Auswahl von Dokumenten, die einen wirklichen Bezug zum Thema haben. Dazu werden die Suchwörter bewertet: Sind sie geeignet, relevante Ergebnisse zu liefern, liegen sie zu nah beisammen oder weisen gar keinen Zusammenhang auf? Dann wird der Nutzer aufgefordert, neue einzugeben. „Wir haben Wegweiser ins Internet eingeführt“, sagt Herwig Unger. Das beschleunigt die Suche.

Aber das ist nur die eine Hälfte der Web-Engine-Idee. Für die war vor allem Mario Kubek verantwortlich, ein Spezialist für die Verarbeitung natürlicher Sprache. Unger dagegen arbeitet bereits seit den 1990er Jahren an dezentralen Systemlösungen. Er hat eine spezielle Struktur eines sich selbst anpassenden Speichers entwickelt, die sich wie von alleine zwischen den Servern entfaltet und die auch zum Patent angemeldet wird. Damit kann die gesamte Verwaltung ähnlich, aber viel effizienter als in Filesharing-Systeme erfolgen, die als Vorgänger der heutigen dezentralen Systeme lediglich den Tausch von Dateien erlaubten. Bei der Web-Engine ermöglicht dieser sich selbst organisierende Speicher den Aufbau eines Wegweisersystems zwischen einem Teil der Anbieter von Informationen (d.h. den Webservern) selbst. Von diesem kann im Unterscheid zu den Datenbänken großer Suchmaschinen keiner sagen, wie groß er ist und wo er bzw. seine Einträge sich gerade befinden. Diese Entscheidungen trifft das System selber.

Alle Daten und Inhalte werden dort belassen, wo sie sind. Die Informationen werden verarbeitet, wo sie entstehen. Und wenn sie gelöscht werden, sind sie weg. Das mindert Risiken und baut soziale Kommunikationsstrukturen nach: „Sie würden auch zuerst Ihre Freunde fragen“, sagt Herwig Unger. „Wir führen hier wieder ein Nachbarschaftssystem ein.“

Ergänzung statt Konkurrenz zu Google

Das ist keine Konkurrenz zu Google. Aber vielleicht irgendwann eine Ergänzung. Die Web-Engine läuft derzeit auf 20 Servern, vor allem von Hochschulen und kleineren Technologie-Unternehmen. Das war der Ursprung der Entwicklung: Forschern die Suche nach weiteren relevanten Dokumenten zu erleichtern. Das Prinzip funktioniert. „Darum geht es mir als Wissenschaftler“, sagt Unger. Aber gegen eine Weiterverbreitung, gegen Wachstum, gegen ein innovatives System aus Deutschland, bei dem die Nutzer ihre eigenen Daten in der eigenen Hand behalten, hätten die Hagener Forscher natürlich nichts. Sie bleiben dran.

Leserkommentare (0) Kommentar schreiben