Internationalisierung von Webseiten aus SEO-Sicht

Johannes Beus
Johannes Beus
Johannes Beus ist Gründer und Geschäftsführer von SISTRIX.

Auch, wenn das Internet global ist, so muss doch auf die Bedürfnisse regionaler Zielgruppen eingegangen werden. Am wichtigsten ist dabei vermutlich die Übersetzung der Inhalte in die jeweiligen Sprachen. Bei der Umsetzung gibt es allerdings einige Fallstricke, auf die ich im Folgenden kurz hinweisen möchte:

Pro Sprache eine ccTLD
Jeder Länderwebseite bekommt die der Sprache zugehörige ccTLD (Country-Code-Top-Level-Domain), Deutschland also example.de, Frankreich example.fr und so weiter. Für englischsprachige Inhalte bietet sich eine .com-Domain an. Experimente mit „Exoten-Domains“ aber auch Endungen wie .info oder .biz würde ich unterlassen. Sollte dieses Vorgehen nicht möglich sein, da die (fiktive) Poker Investments Limited aus Paraguay vielleicht noch die eigene ccTLD hält, aber realistisch betrachtet keine Chancen auf die weiteren Domains hat, so können auch Subdomains wie de.example.org und fr.example.org genutzt werden. Absehen würde ich davon, Verzeichnisse für die lokalisierten Versionen der Webseite zu verwenden.

Unmissverständliche Header
In der Theorie ist alles ganz einfach: Der Webserver sendet den Content-Language-HTTP-Header und in der dort angegeben Sprache ist das folgende HTML-Dokument. In der Praxis sieht das dann so aus, das die meisten Webmaster von diesem Header noch nie gehört haben, ihre Provider falsche oder keine Voreinstellungen gemacht haben und zusätzlich noch Meta-Header zur Sprachangabe, die dem HTTP-Header womöglich noch wiedersprechen, gesetzt werden. Suchmaschinen mussten also dazu übergehen, die Sprache einer Seite aus einer Reihe von Merkmalen selber zu erkennen und man sollte versuchen, es ihnen dabei nicht zu schwer zu machen. Es ist also mit einem HTTP-Header-Viewer zu überprüfen, ob und welche Language-Header gesendet werden, ob diese mit der realen Sprache des Dokumentes übereinstimmen und, ob die Meta-Header stimmen. Auch versuchen Suchmaschinen die Sprache anhand des Textes zu erkennen. Das Vorkommen bestimmter Wörter wie „und“ oder „neben“ kann als Anhaltspunkt dienen – deswegen ist es extrem wichtig, dass pro URI nur eine Sprache verwendet wird.

Links von gleichsprachigen Seiten
Ein weiterer Anhaltspunkt für Google, welche Sprache die Seite hat, sind – wie so häufig – eingehende Links. Normalerweise gibt es damit keine Probleme aber, wenn das Verhältnis zwischen englischsprachigen und deutschen Seiten, welche auf die eigene Seite verlinken zu ungünstig wird, so kann es passieren, dass diese Seite in den englischsprachigen Index rutscht – zu erkennen dadurch, dass bei deutschen Suchanfragen [ Diese Seite übersetzen] neben dem Resultat steht.

Lokale IP-Adressen
Suchmaschinen wie Google versuchen nicht nur die Sprache sondern auch die Herkunft einer Seite zu bestimmen. Dies äußert sich dann darin, dass man nicht nur in „Seiten auf Deutsch“ sondern auch in „Seiten aus Deutschland“ suchen kann. Ein wichtiger Punkt, an dem Google die Herkunft der Seite festmacht, ist die IP-Adresse, auf der das Projekt gehostet ist. Bei dieser Domain sieht es beispielswiese so aus:

hades:~# host www.sistrix.com
www.sistrix.com A 62.93.205.128
hades:~# whois 62.93.205.128
% This is the RIPE Whois query server #1.
[…] country: DE

Es sollte also bei Projekten mit entsprechendem Budget darauf geachtet werden, dass die Zuordnung der IP-Adresse dem jeweiligen Land entspricht. Umsetzungsmöglichkeiten dafür gibt es viele, ein Gespräch mit dem Provider ist häufig hilfreich.

Keine automatisierten Übersetzungen
Auch, wenn es keinen direkten Einfluß auf die Suchmaschinenoptimierung hat, so kann nur empfohlen werden, den Content durch fähige Muttersprachler übersetzen zu lassen. Maschinenübersetzter Text ist zwar also kurzweilige Unterhaltung ganz nett, wird allerdings von niemandem ernst genommen oder verstanden. Auch bringt noch so toller Content in der Ursprungssprache nichts, wenn er in der Zielsprache nicht verstanden – und damit kommt der SEO-Teil – verlinkt wird.

Ähnliche Beiträge
Kommentare
Avatar soeren onez   
14. Juni 2007, 23:13

ich bin so froh diesen Artikel in meinem feed auftauchen gesehen zu haben, denn es ist ein Problem, dass mich schon einige zeit umtreibt.

Ich habe für einen Freund eine org Domain geholt, weil er einen bestimmten Namen wollte und de war eben schon vergeben. Es sind absolut keine Besucher gekommen bis ich das nicht W3C Konforme metatag language eingebaut habe, seit dem bringt Google de und at Besucher auf die Seite. Wenn ich die Seite in deinem Oben genannten HeaderViewer eingebe, kommt keine Sprachausgabe. Die Seite people-in-motion.org liegt auf einem deutschen allinkl-server. Wie kann ich das goggle begreiflich machen ohne das unkonforme language tag zu nutzen.

Ein ähnliches Problem habe ich mit der seite meiner freundin, sie schreibt auf tschechisch und google schickt nicht, welches tag muss ich eingeben, auf die xml-sprachweitergabe meines blogscripts reagiert google nicht.

Ich bin dir wirklich dankbar für eine Antwort, ich habe mir nämlich schon einen Wolf gegoogelt.

Avatar Johannes   
14. Juni 2007, 23:21

Wie geschrieben mussten Suchmaschinen eigentlich schon lernen, die Sprache der Seite zu „raten“, da die eigentlich dafür vorgesehen Signale häufig unzuverlässig sind. Um den angesprochenen HTTP-Header zu setzen kannst du – soforn du einen Apache-Webserver nutzt – in die .htaccess folgendes schreiben „DefaultLanguage de-DE“. Den Metatag mit der gleichen Angabe würde ich allerdings drin lassen – je mehr Signale auf eine Sprache hindeuten, desto besser.

Avatar soeren onez   
14. Juni 2007, 23:35

Danke dir vielmals, weißt du auch wo ich alle Sprachenkürzel finde, denn für Tschechisch habe ich zwei Varianten bisher gefunden cz und cs und ich kann leider die Zuverlässigkeit der Seiten nicht prüfen, auch bei Selfhtml bin ich nicht fündig geworden.

Momentan läuft die Seite meiner Freundin noch über so eine ms.info Domain, ich würde aber gerne eine richtige holen, denn sie schreibt doch Recht viel und ich würde einfach gerne mal testen, wie viel von googl.cz zu holen ist. Aber eine CZ Domain kostet 60 Euro im Jahr, da hole ich doch lieber eine de Adresse, weil es eher Interesse ist, als Nutzen.

Aber schon jetzt nochmal Danke! da ich wirklich schon etliche Lösungen hatte und fast zum Verzweifeln gekommen bin, die org Adresse hat immerhin einen PR4 und nichts von google, das konnte ich mir nicht erklären. Ich weiß, das der PR nur Indikator ist, aber nichts ist doch zu wenig von PR4 dachte ich mir.

Avatar Pelle Boese   
15. Juni 2007, 13:02

Soeren: Für Tschechisch sollte es „DefaultLanguage cs-CZ“ oder einfach nur „DefaultLanguage cs“ sein. Eine vollständige Liste gibt’s auf http://en.wikipedia.org/wiki/List_of_ISO_639-2_codes – hier ist die Spalte „Alpha-2“ die interessante.

Avatar Aixxia   
16. Juni 2007, 10:58

Wie sieht das denn eigentlich mit den Namensservern aus?
Wenn ich eine Domain in USA hoste, die IP ist in den USA, aber der Namensserver steht weiterhin in DE?

Avatar Johannes   
16. Juni 2007, 19:43

Nameserver sind sicherlich ein interessantes Thema, um Domainnetzwerke von großen Spammer zu sehen, für die Zuordnung der Sprache kann ich mir das ehrlich gesagt nicht vorstellen. Der Gedanke bei Nameservern ist ja, dass diese möglichst weitflächig (sowohl geographisch als auch unter networksicht) verteilt werden sollten, damit ein Ausfall keine Auswirkungen hat. Es ist also gerade bei großen Provider/Seiten normal, dass ein Nameserver in Deutschland, einer in den USA und noch einer in Asien steht.

Avatar Pelle Boese   
18. Juni 2007, 00:00

Dass der Standort der Nameserver eine Rolle spielt kann ich mir ebenfalls nicht vorstellen, bzw. behaupte ich einfach mal ganz frech, dass dem nicht so ist. Es macht aus der Sicht der Suchmaschinenbetreiber absolut keinen Sinn.

Avatar Ulli Storck   
26. Juni 2007, 10:37

Hallo,

wenn man das Thema Mehrsprachigkeit mal weglässt, kann es vorkommen, dass unter zwei Länderdomains weitgehend die gleichen Seiten liegen (z. b. im Falle von testdomain.de, testdomain.at). Evtl. gibt es länderspezifische Einstiegsseiten (alle auf deutsch) aber identische Unterseiten.

Alle Seiten der at-Domain sollen natürlich unter ‚testdomain.at/seite‘ erscheinen. alle Seiten der de-Domain entsprechend unter der de-Domain (auch bei identischem Inhalt).

Wie würde man dies SEO-konform umsetzen, insbesondere um doppelten Content zu vermeiden?

Danke und Grüße
Ulli Storck

Avatar Johannes   
26. Juni 2007, 10:41

Theorie: Pro Stück Content eine, einzigartige URL. In diesem Fall wird man nicht drumherumkommen, die Texte für die .at-Domain hinreichend zu verändern. In der Realität wird das Thema dann doch nicht so heiss gegessen, wie es gekocht wird und ich würde mir, wenn nicht direkt um einige hunderte oder tausende Seiten geht, deswegen erstmal keine großen Gedanken machen.

Avatar Ulli Storck   
26. Juni 2007, 11:02

Hauptsächlich würde es sich um ca. 2000 Seiten mit Beschreibungen zu Unterkünften u. ä. handeln. Somit möglicherweise doch eine relevante Menge an Seiten?
Aufgrund der Seitenanzahl scheidet eine Veränderung der Inhalte für die jeweilige Domain auch aus, es sei denn man würde dies automatiert hinkriegen (was ich aber bezweifele).
Sollte die Gefahr von doppeltem Content bei dieser Anzahl gegeben sein, fiele mir eigentlich nur noch die Lösung eine, die Seiten auf beide Domains aufzuteilen. Dann würde aber der Portalbesucher damit konfrontiert, auf mehreren Domains unterwegs zu sein. Ausserdem frage ich mich, was das für das Auffinden in den Suchmaschinen bedeutet, z. B. bei einer Suche über google.de nach einer Seite, die nur unter der at-Domain abgelegt ist?

Avatar Johannes   
26. Juni 2007, 11:08

Bei 2000 Beschreibungen von Hotels/Unterkünften ist das dann ein klassisches Beispiel von Duplicate Content. Die stärkere Domain der beiden wird „gewinnen“, die andere hat Pech gehabt. Mit etwas Pech und wenn Google sich nicht zwischen den beiden Domains entscheiden kann oder vielleicht noch irgendwo anders diese Texte liegen, habt ihr das richtige Chaos. Eine automatisierte Umschreibung ist, je nach Typ der Daten, manchmal machbar, schön aber in den wenigsten Fällen.

Wenn ihr den Content auf zwei Domains aufteilt, so müsst ihr beide Domains durch entsprechendes Linkbuildung stärken, also erstmal doppelte Arbeit. Dafür habt ihr im Nachhinein 2 starke Domains und sollte es bei einer mal Probleme geben, fallen nur ~50% des Traffics weg. Alles gar nicht so einfach und ohne Kenntnis über das konkrete Projekt schwer, da Ratschläge zu geben.

Avatar Ulli Storck   
26. Juni 2007, 13:50

Könnten wir zu diesem Thema Consulting bekommen, z. B. einen gemeinsamen Workshop?

Die Kommentarfunktion wird 30 Tage nach der Veröffentlichung des Beitrags deaktiviert.