Google produziert 404-Fehler

Johannes Beus
Johannes Beus
Johannes Beus ist Gründer und Geschäftsführer von SISTRIX.

Beim Durchsehen von Logfiles ist mir heute aufgefallen, dass Google – wie Yahoo schon seit einiger Zeit – offenbar absichtlich 404-Fehler produziert um somit den Inhalt der 404-Fehlerseite zu erhalten. Ziel ist es vermutlich, Seiten bei denen für Fehlerseiten der Standardheader 200 gesendet wird zu entdecken und entsprechend zu behandeln. In den Logs sieht das dann so aus:

66.249.65.145 - - [01/Jan/2007:15:09:36 +0100] "GET /mppwafdgqpulx.html HTTP/1.1" 404 216 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

Die Zugriffe erfolgen immer auf Zufallsdateien im Rootverzeichnis und bestehen aus einigen Kleinbuchstaben sowie der Dateiendung .html

Ähnliche Beiträge
Kommentare
Avatar Ralph   
3. Januar 2007, 21:53

Wenn Google also einen Standardheader 2oo zurück gesendet bekommt, wie geht es damit um? Diese Seiten haben somit einen „richtigen“ Inhalt. Werden diese Website per Mensch analysiert? Werden diese besser oder schlechter eingestuft, wenn Google (allg. Suchmaschinen) statt dem Fehlercode 4o4 die 2oo als Antwort erhalten?

Aus Dresden grüssend

RALPH

Avatar Johannes   
3. Januar 2007, 22:00

Fehlerseiten mit einem 200er Header werden von Google wie normale Seiten behandelt. Abgesehen davon, dass dies für den Seitenbetreiber wegen Duplicate Content zu Problemen führen kann, hat natürlich auch Google kein Interesse, diese Seiten in den Index aufzunehmen. Also werden absichtlich Fehlerseiten produziert, in dem URLs, die sehr wahrscheinlich nicht existieren aufgerufen werden und die dabei zurückgegebene Fehlerseite mit anderen Seiten der Webpräsenz verglichen wird.

Avatar Ralph   
4. Januar 2007, 10:35

„Abgesehen davon, dass dies für den Seitenbetreiber wegen Duplicate Content zu Problemen führen kann, hat natürlich auch Google kein Interesse, diese Seiten in den Index aufzunehmen.“ Dies würde aber bedeuten, dass der Seiteninhaber mit Absicht den sog. Duplicate Content einsetzen würde!

Aus Usability-Gründen ist es aber für Seiteninhabern notwendig, die 4o4-Fehlerseite korrekt zu gestalten (Anmerkung: Leider noch nicht hier umgesetzt 😉 ). Der folgende Satz „Also werden absichtlich Fehlerseiten produziert, in dem URLs, die sehr wahrscheinlich nicht existieren aufgerufen werden und die dabei zurückgegebene Fehlerseite mit anderen Seiten der Webpräsenz verglichen wird.“ beruhigt mich dann wieder, vor allem der zweite Teil des Satzes. Denn eine gestaltete 4o4-Fehlerseite ist aus Sicht der Suchmaschinen ähnlich in der Struktur wie die anderen Webseiten, aber der Unterschied liegt im Text, der einen Bezug zu diesem Fehler hat.

Danke für die Info aus Dresden

RALPH

Avatar Johannes   
4. Januar 2007, 10:38

Gestaltete Fehlerseiten sind kein Problem. Das Problem existiert erst dann, wenn diese Fehlerseite als Header „200“ – also alles in Ordnung“ – zurückgeben und Suchmaschinen nicht mehr zwischen nicht existenten Fehlerseiten und richtigen Seiten unterscheiden können.

Avatar SEO Blogger   
10. Januar 2007, 13:48

Momentan kursiert das Gerücht das man eine 404 Fehlerseite unbedingt benötigt und Google damit vorgaugelt mindestens eine 404 Seite zu besitzen. Sinnvoll wenn Google absichtlich ein paar 404 Seiten abfragt.

Ich habe die Erfahrung gemacht das sich 404

Die Kommentarfunktion wird 30 Tage nach der Veröffentlichung des Beitrags deaktiviert.