Wie Google mit Flash umgeht

Flash und Google sind Gegensätze wie Wasser und Feuer. Suchmaschinen wie Google beschränken sich auf die Textsuche und können Flashdatein so eigentlich nicht lesen. Trotzdem gibt es seit langem Versuche, auch andere Dokumentenarten sinnvoll indexieren zu können. Für PDFs ist das bereits recht gut gelungen – natürlich auch, weil diese in den meisten Fällen hauptsächlich aus Textelementen bestehen und die Schnittstellen zum PDF-Format ausreichend dokumentiert sind. In den letzten Tagen sind einige Artikel zum Umgang von Google mit Flashdateien erschienen. Da dieses Thema ein „Dauerbrenner“ im SEO-Bereich ist, will ich den aktuellen Stand mal zusammenfassen.

Dass Google generell gewillt ist, auch Flashdateien in den Index aufzunehmen, zeigt sich daran, dass derzeit rund 23 Millionen davon gefunden werden können. Im April 2004 habe ich zur Einführung dieses Features in diesem Blog einen kurzen Hinweis dazu geschrieben, es funktioniert offenbar also schon recht lange. Wie schon erwähnt, ist der Googleindex nur Text gewöhnt. Man kann dort also nicht einfach Binärcode, wie ihn Flash generiert, reinwerfen. Dem üblichen Ablauf eines Crawlvorgangs muss also noch ein Filter zwischengeschaltet werden, der die gecrawlte Datei in normalen Text und somit in ein für Google verständliches Format wandelt.

Währung diese Umwandlung bei Google früher eine Eigenentwicklung vorgenommen hat, setzt Google jetzt, so hat es Cutts unlängst in einem Interview bestätigt, auf das frei verfügbare Entwicklerkit von Adobe für Suchmaschinen. Dort ist ein Programm mit dem treffenden Namen „swf2html“ enthalten, das die Konvertierung von Binär- in Textdaten vornimmt. Ich habe diese Umwandlungsroutine gerade mit einem Webfrontend versehen und online gestellt: Flash2Html. Damit kann man Flashdateien, noch bevor sie von online gestellt und von Google indexiert werden, daraufhin überprüfen, ob sie seinen eigenen Erwartungen und Vorstellung an die Suchmaschinentauglichkeit entsprechen.

Ähnliche Beiträge