Hintergrundinformationen zum Supplemental Index

Diese Woche wurde Google ein bereits 2003 eingereichtes Patent, das offensichtlich die Funktionsweise des Supplemental-Indexes beschreibt, gewährt. Das Patent geht darauf ein, wie ein Index sinnvoll in einzelne Partitionen unterteilt werden kann um die Geschwindigkeit und Effizienz des gesamten Systems zu erhöhen. Im Detail geht das Patent auf die konkreten technischen Abläufe ein – welche Seiten gehören in welchen Index, wie werden bei Suchen die Indexe zusammengeführt, wie Snippets erzeugt werden und weitere Informationen. Interessant in dem Zusammenhang ist, dass für die Entscheidung, in welchen Index eine Seite geschoben wird, der PageRank herangezogen wird. Als Begründung wird genannt, dass der PageRank einen guten und query-unabhängigen Anhaltspunkt für die Wichtigkeit einer einzelnen Seite darstelle; eine Aussage, die Cutts so in seinem Blog bereits getätigt, ihm aber nicht wirklich jemand abgenommen hat. Allerdings muss man auch bedenken, dass dieses Patent bereits 4 Jahre alt ist. Im letzten Jahr wurde die Technik hinter dem Supplemental Index generalüberholt und vermutlich deutlich verändert. Wer also Interesse an etwas Hintergrundinformationen hat und beispielsweise das Anatomy of a Large-Scale Hypertextual Web Search Engine von Page und Brin gerne gelesen hat, sollte sich auch das oben genannte Patent mal ansehen. Übrigens scheint derzeit die Abfrage „-site:domain.tld* +site:domain.tld“ zum Auffinden von Resultaten im Supplemental Index für recht viele Domains zu funktionieren, das Rattenrennen geht weiter …

Ähnliche Beiträge