Google-Stemming immer besser

Seit einigen Tagen kann ich beobachten, dass Google anscheinend eine neue Evolutionsstufe der Stemming-Algorithmus für den deutschen Index aktiviert hat. Während Google ganz am Anfang allenfalls Singular/Pluralformen erkannte und bei Suchen auch Seiten, die nicht exakt den gesuchten Begriff enthielten anzeigte, wurden anscheinend laufend Veränderungen vorgenommen. Jetzt scheint Google recht gut mit Abkürzungen umgehen zu können. Die Suche nach CTR findet so neben Seiten, die „CTR“ enthalten auch solche, die Click-Through-Rate ausgeschrieben haben und das ebenfalls mit CTR abgekürzte „Center for Turbulence Research“ der Stanford-Universität. Ein interessanter Schritt, der zwar kein Meilenstein der Suchgeschichte ist aber gut zeigt, dass sich Suchmaschinen von Programmen, die genau das finden, was der Nutzer eingibt hin zu intelligenteren Modellen, bei denen die Absicht, die hinter der Suchanfrage steckt, erkannt wird, wandeln.

Ähnliche Beiträge