Ich freue mich ja jedes Mal, wenn in einer Pressemitteilung von einem neuen Stern am Suchmaschinenhimmel die Rede ist. Wenn es sich dann noch um eine deutsche Suchmaschine handelt, steigert sich diese Freude gar ins unermessliche. Jetzt war es wieder mal so weit, WeFind („die neue Web 2.0 Suchmaschine“) ist gestartet. Um es kurz zu machen, die Qualität der Ergebnisse hat mich nicht direkt dazu veranlasst, den WeFind-Hintergrund runterzuladen und auf allen Computern einzurichten. Deswegen möchte ich jetzt gar nicht so sehr etwas zu WeFind selber, sondern zu grundsätzlichen Problemen von Metasuchmaschinen schreiben.
Metasuchmaschinen arbeiten so, dass sie die Suchanfrage an eine Reihe von Suchmaschinen weitergeben, die Ergebnisse sammeln und möglichst sinnvoll aufarbeiten. In den Anfängen der Suchmaschinentechnologie waren Metasuchmaschinen recht beliebt, da jede einzelne der zahlreichen kleinen Suchmaschinen nur einen sehr geringen Teil des Webs durchsuchte und man so immerhin zu halbwegs treffenden Ergebnissen kam. Heute haben Metasuchmaschinen nahezu keine Relevanz mehr – zum einen ist der Index von Google oder Yahoo groß genug und lässt in der Regel keine wichtigen Seiten aus, zum anderen kann die Qualität der Metasuchmaschinen nicht mehr mithalten.
Das liegt im Wesentlichen daran, dass während Google beispielsweise über 200 unterschiedliche Signale hat, um ein schönes Ranking zu bauen, Metasuchmaschinen mit deutlich weniger auskommen müssen. Auch WeFind schreibt, dass zur Einbindung von „Suchpartnern“ normalerweise eine OpenSearch-Schnittstelle verwendet wird – und über diese kommen nicht mehr Informationen, als man üblicherweise auch im Browser sieht. Wie schwierig es ist, Ergebnisse aus mehr als einer Quelle sinnvoll zu gewichten, kann man manchmal bei Google selber sehen. Für Universal-Search wird auch mehr als ein Index abgefragt (Web, Bilder, News, Videos, usw) und Google steht vor der Problem, wie die unterschiedlichen Rankings zusammengefügt werden – und das geht häufig genug schief, obwohl Google Zugriff auf die kompletten Ranking-Faktoren jedes einzelnen Indexes hat.