WER SUCHET, DER FINDET: Besser als Google?

Beiträge: 2
Zugriffe: 253 / Heute: 1
Happy End:

WER SUCHET, DER FINDET: Besser als Google?

 
15.03.02 19:26
Wer im Internet sucht, könnte bald tatsächlich auch finden: Ein neuer Algorithmus soll Suchmaschinen auf die Sprünge helfen. Der Trick: Er kümmert sich um Links - und ignoriert Textinhalte. Das, sagen die Entwickler, sei besser als Google.

WER SUCHET, DER FINDET: Besser als Google? 610028
Mühselig: Wer in der überbordenden Vielfalt des Webs fündig werden will, braucht ein Werkzeug, das Müll automatisch ignoriert
 
Warum versuchen, das Internet zu organisieren, wenn es das von ganz alleine schafft? Das zumindest dachten sich Techniker des NEC Research Institute, bevor sie sich an die Arbeit machten. Die Gruppe um Gary Flake ging von der weithin bekannten Tatsache aus, dass sich das Internet von allein in thematische Bereiche gegliedert hat, die von entsprechenden Communities gepflegt und gefüttert werden. "Jede Seite könnte theoretisch überall hin verlinken", sagt Flake. "Aber das tut sie nicht." Stattdessen fänden sich Webseiten zu "sozialen Gruppen" zusammen, die, was die Links betrifft, weitgehend unter sich blieben.
Webverzeichnisse wie Yahoo oder Web.de, die redaktionell erstellt und gepflegt werden, tragen dieser Tatsache zum Teil Rechnung, verlangen aber nach einem immensen Aufwand an menschlicher Bearbeitung. Denn von vollständiger Erkennung von Sprache, merkt das NEC-Team an, ist die derzeitige Technik noch weit entfernt.

Doch selbst wenn ein Computer hinter den Sinn von Texten kommen könnte, wäre eine Katalogisierung des Internets gespickt mit Fußangeln - wie jeder Netz-Nutzer aus eigener leidvoller Erfahrung weiß. Denn hinter so mancher suchmaschineller Text-Versprechung verbirgt sich etwas ganz anderes, meist aber Schlüpfrigeres als das Gewünschte.

Google war die erste Suchmaschine, die Links auf Webseiten auswertete - allerdings nicht, um Informationen über den Inhalt der Seiten zu bekommen, sondern um ihre Beliebtheit herauszufinden: Die so genannte PageRank-Technologie zählt einen Link von einer Seite zu einer anderen als "Wahlstimme" für die verlinkte Seite. Je mehr Links auf eine Seite verweisen, desto höher taucht sie in den Suchergebnissen auf.

Links aber, meinen Flake und Co., sagen manchmal mehr als tausend Worte

Für Web-Communities, wie sie die Forscher definieren, gilt eine simple Regel: Sie bestehen aus Websites, deren Links jeweils zu mehr als der Hälfte auf Seiten derselben Community verweisen. Auf diese Art, so Flake, findet der Nutzer zielsicher die kleinen Inseln der Sinns in einem Meer von Sinnlosigkeit.

WER SUCHET, DER FINDET: Besser als Google? 610028
Larry Page und Sergey Brin: Ihre Suchmaschine "Google" gilt als derzeit bestes Suchwerkzeug fürs Internet

In einem Testlauf benutzte das Team die Homepages dreier berühmter Wissenschaftler - Francis Crick, Ronald Rivest und Stephen Hawking - als Startpunkte einer Suche mit dem neuen Algorithmus. Am Ende habe der Rechner jeweils rund 200 Seiten ausgespuckt, die in der Tat thematisch eng mit der "Mutterseite" verbunden gewesen seien. Auf dem Weg dorthin, so Flake, fielen Zehntausende Seiten durchs Raster, da sie als Nicht-Mitglieder der Community erkannt wurden. Ein angenehmer Effekt im Vergleich zu den rund 58.000 Treffern, die etwa Google bei der Suche nach "Stephen Hawking" anzeigt.

Das Team wandte auf die Homepages der drei Wissenschaftler auch eine einfache Crawler-Suche an, die allen Links bis in die Unendlichkeit folgte. Schon auf der zweiten Ebene hätten nur noch zehn Prozent der Seiten thematisch etwas mit der Ausgangsseite zu tun gehabt. Der Community-Algorithmus habe dagegen noch fünf Links von der Ausgangsseite entfernt verwertbare Resultate gefunden. An diesem Punkt wirkte die Crawler-Suche etwa so sicher wie Günther Jauchs Quiz-Kandidaten: fast nur Fehlschüsse, dafür aber in gewaltiger Zahl.

Gruß
Happy End
spiegel.de
Spitfire33:

@Happy unerreicht

 
15.03.02 19:34
Noch 4 Postings und Du gehst in die Arivageschichte ein. Gib Gas.
Es gibt keine neuen Beiträge.


Börsen-Forum - Gesamtforum - Antwort einfügen - zum ersten Beitrag springen
--button_text--