Twitter die zweitgrößte Suchmaschine?
Seit einiger Zeit wiederholt sich das Spiel jeden Monat: Twitter verkündet, wie viele Suchanfragen im letzten Monat bearbeitet wurden und irgendwelche Qualitätsjournalisten setzen diese Zahlen in Relation zu Daten von Google, Yahoo und Bing. Danach wird Twitter als Google-Killer gekürt. Irgendwas stimmt da doch nicht, oder?Das erste Problem ist, dass die Daten aus völlig unterschiedlichen Quellen stammen. So wird für die Anzahl der Suchanfragen der großen Suchmaschinen üblicherweise auf die Auswertung von comScore oder vergleichbaren, externen Dienstleister zurückgegriffen. Die messen über ein hoffentlich aussagekräftiges eigenes Panel und ermitteln damit Daten, die untereinander vergleichbar sind - nicht aber mit externen Zahlen.
Das zweite Problem ist die komplett unterschiedliche Definition von „Suchanfrage“: bei den Suchmaschinen ist es recht klar - der Nutzer gibt ein Keyword ein, findet was er sucht und fertig ist die Suchanfrage. Twitter zählt da leider komplett anders. Wenn Spiegel Online bei einem Deutschland-WM-Spiel links in der Navigation eine Box mit dem Twitter-Stream einbindet, so zählt Twitter jeden Aufruf der Spiegel-Seite als Suchanfrage. Das gleiche gilt für die unzähligen API-Clients: mein Tweetdeck „sucht“ alle 5 Minuten nach „sistrix“, führt also jeden Tag rund 250 Suchanfragen aus, jeden Monat über 8.000. Und diese Zahlen soll man jetzt vergleichen können?
IndexWatch 06/2010
Schon sind wir im Juli, es ist also an der Zeit für die frischen IndexWatch-Zahlen aus dem vergangenen Monat. Wie üblich, präsentieren wir hier auf Basis der Veränderungen im SISTRIX Sichtbarkeitsindex die Auf- und Absteiger im Google-Index des letzten Monats. Los geht es mit den Gewinnern:Gewinner
| # | Domain | Veränderung | |
|---|---|---|---|
| 1 | travel3.de | +4.898% | |
| 2 | celeb.ag | +1.576% | |
| 3 | pornoblog.at | +607% | |
| 4 | familien-wegweiser.de | +430% | |
| 5 | fertighaus.de | +283% | |
| 6 | factory-outlets.org | +230% | |
| 7 | dasverzeichnis.info | +199% | |
| 8 | poenix.de | +190% | |
| 9 | songtexte.com | +158% | |
| 10 | unternehmen-db.de | +149% | |
| 11 | kostenlose-singleboersen.de | +132% | |
| 12 | supportnet.de | +124% | |
| 13 | cylex-review.com | +120% | |
| 14 | onlinestreet.de | +120% | |
| 15 | sportschau.de | +86% |
Große Überraschungen gibt es in dieser Liste nicht. Wie üblich sind einige Domains dabei, die aus einer Penalty entlassen wurden und nun wieder halbwegs ordentlich ranken. Dazu zählen zum Bespiel travel3.de und celeb.ag. Auch pornoblog.at ist wieder in den Ergebnislisten der Suchmaschine vertreten – hier hat anscheinend der „Pornofilter“ zugeschlagen und einen Großteil der Keywords zeitweise aus dem Ranking genommen, wie man an diesem Screenshot schön sieht.
Ansonsten sind überraschend viele eher Inhaltsschwache Seiten dabei: obskure Branchen- und Firmenverzeichnisse und Ähnliches. Ich möchte bei dieser Gelegenheit ausdrücklich darauf hinweisen, dass ich damit nicht die Domain „cylex-review.com“ meine. Die haben mir nach der letzten Äußerung in dieser Richtung direkt eine Abmahnung geschickt. Supportnet.de ist übrigens nur in der Liste, weil es zum Stichtag vor einem Monat zu einem deutlichen „Durchsacken“ des Sichtbarkeitswertes kam – insgesamt ist die Domain seit Anfang der Messungen auf dem absteigenden Ast. Sportschau.de wechselt sich (Duplicate Content sei Dank) in den Rankings immer fröhlich mit sport.ard.de ab, aber das habe ich glaube bereits mal geschrieben.
Verlierer
| # | Domain | Veränderung | |
|---|---|---|---|
| 1 | exika.de | -99% | |
| 2 | surcentro.com | -99% | |
| 3 | ineedfile.com | -99% | |
| 4 | bizinformation.org | -99% | |
| 5 | alleworte.de | -97% | |
| 6 | mister-wong.de | -97% | |
| 7 | pixel-partisan.de | -97% | |
| 8 | 123-schuhe.de | -95% | |
| 9 | expertenworte.de | -94% | |
| 10 | rezeptsuche.info | -94% | |
| 11 | infopirat.com | -93% | |
| 12 | misterinfo.de | -93% | |
| 13 | artikel-online.de | -93% | |
| 14 | neww.org | -92% | |
| 15 | zuio.de | -91% |
Die Absteiger des Monats werden dominiert von den Domains, die der bereits besprochenen Säuberungsaktions von Google zum Opfer gefallen sind. Auch hier sieht man wieder, dass es zwar gewisse Parallelen gibt, eine eindeutige Ursache aber nicht ausgemacht werden kann. Es ist aber davon auszugehen, dass es sich nicht nur um eine einmalige Aktion gehandelt hat, sondern Google in Zukunft regelmäßig Projekte entfernt, die über gewisse Grenzen schlagen.
Skoda.de - mit Vollgas aus dem Ranking
Auch wenn mein Jetta fast täglich ein Quell neuer Freude ist und die 1.6 Liter Maschine schnurrt, als sei sie gerade erst gebaut worden, so schaue ich doch ab und an auf die praktischen Autos der VW-Tochtermarke aus Tschechien. Jetzt hat man sich offensichtlich dazu durchgerungen, den reichlich antiquierten Webauftritt zu relaunchen. Mag die neue Seite optisch noch recht gefällig wirken, hat man bei der SEO-Umsetzung eine Reihe von Fehlern gemacht, die ich in diesem Posting gerne beleuchten möchte, auf dass sie nicht von anderen wiederholt werden. Zuerst ein Blick auf den Verlauf des Sichtbarkeitsindexes für die Domain:
Seit Anfang 2008 gab es keine großen Veränderungen, mal ging es etwas nach oben, dann wieder nach unten. Bis letzte Woche: da hat Skoda.de 60% verloren - von knapp 6 auf 2,3 Punkte. Sieht man sich die Ursachen für den Absturz an, so wird schnell klar, dass der Relaunch die komplette Webseite getroffen hat. Neben den wenigen generischen Suchanfragen, für die skoda.de vormals in den Top-10 rankte („gebrauchtwagenbörse“ von 9 auf 19) sind hauptsächlich die trafficstarken Brand-Begriffe betroffen. Mit „skoda octavia“ fiel die Domain von Position 1 auf 11. Wenn man sich die tagesaktuellen Ergebnisse für das Keyword ansieht, so geht es noch weiter runter: Platz 90. Der Sichtbarkeitsindex wird also alles Voraussicht nach beim kommenden Update abermals stark abfallen. Dass die Betreiber der Seite sich auch bislang nicht um die Anforderungen von Suchmaschinen gekümmert haben, sieht man recht gut an dem Wechsel zwischen „skoda.de“ und „www.skoda.de“. Allerdings hat man mit dem Relaunch ein paar Hürden eingebaut, die es auch wohlwollenden Crawlern schwer machen, die Inhalte zu erfassen.
Session-IDs
Ich habe es zuerst auch nicht geglaubt, aber bei Skoda ist man offenbar der Meinung, für die Präsentation von Autos nicht auf Session-IDs verzichten zu können. Auch für Suchmaschinencrawler wird keine Ausnahme gemacht und so hat Google zahlreiche Seiten mit dem Parameter indexiert:

Für Suchmaschinen ergeben sich daraus verschiedene Probleme: da mit jeder neuen Session-ID, die der Crawler vorgesetzt bekommt alle Seiten auf der Domain neue URLs haben, kommt es zu Duplicate Content-Problemen. Auch die Berechnung der internen Verlinkung ist davon betroffen, da ständig neue Links auftauchen, die alten aber nicht mehr bestehen.
Seitentitel, Wortwahl
Wenn man ein Produkt hat, das landläufig als „Skoda Octavia“ bekannt ist, wie würdet ihr den Title der Seite, auf der dieses Produkt vorgestellt ist gestalten? Tja, bei Skoda geht man etwas unkonventionelle Wege: der Titel jeder Seite auf der Domain fängt erst mal mit „Skoda Auto Deutschland GmbH“ an, erst danach wird es variabel. Auf der Autoebene angekommen führt das dann zu einem Titel, in dem „Skoda Octavia“ leider nicht in dieser Schreibweise vorkommt - auf der kompletten Domain nicht:

Als wäre das nicht genug, hat man auch im eigentlichen Text der Seite Probleme damit, den Produktnamen einmal korrekt auszuschreiben. Vermutlich aus Rücksichtnahme auf irgendwelche Corporate-Design-Richtlinien steht dort: „ŠkodaOctavia Limousine“ - Ja, genau, ohne Leerzeichen. Folglich kann auch Google das nicht richtig zuordnen wie man im Cache der Seite gut erkennen kann.
JavaScript, Flash, 404-Status-Code
Während die beiden ersten Punkte sicherlich ursächlich für den Absturz im Sichtbarkeitsindex waren, gibt es noch eine Reihe weiterer Probleme auf der Seite, die es Suchmaschinen schwer machen, die Inhalte zu erfassen. So ist die Sitemap, die für Crawler häufig ein sehr guter Ansatzpunkt zur Erkundung der kompletten Seite ist in JavaScript gehalten, für die Suchmaschinen also unsichtbar. Weite Teil der Webseite werden durch eine Flash-Fläche beherrscht - den dort liegenden Text können Suchmaschinen in der Regel nicht lesen und somit auch nicht in die Wertung einfließen lassen. Ein weiteres Problem für Suchmaschinen ist, dass jede URL auf der Domain den Statuscode „200“, also „alles in Ordnung“ zurückgibt. Das fällt besonders bei der (nicht vorhandenen) robots.txt auf, verleitet aber natürlich auch dazu, nicht existente Seiten in den Googleindex zu drücken ;-)
Interessant ist nun, wie Google mit der Seite in den kommenden Wochen umgeht. Da Google nicht erst seit gestern crawled und dabei gelernt hat, dass jeder nur denkbare Fehler auch gemacht wird, kommt der Googlecrawler mit den häufigsten Fehlern ganz gut zurecht und denkt sich schon, was der Seitenbetreiber eigentlichen machen wollte. Ich könnte mir auch gut vorstellen, dass es bei Skoda dazu kommt - die Domain ist einfach zu gut verlinkt, als dass Google sie dauerhaft ignorieren kann.
E-Commerce im Google-Visier
In den letzten Wochen und Monaten hat Google seine Aktivitäten im Bereich Shopping und E-Commerce weiter ausgebaut. Es scheint, als gebe man sich nicht länger mit der Rolle des reinen Vermittlers zwischen den Suchenden und Onlineshops zurecht, sondern wolle ein größeres Stück vom Kuchen abhaben. So wurde zum Beispiel die Google Commerce Search neu aufgelegt. Version 2.0 der internen Suche speziell für Onlineshops bringt einige Neuerungen und kostet nur noch die Hälfte, dürfte sich deswegen schneller verbreiten und Google wertvolle Daten liefern. Spannendere Veränderungen finden auch bei Google Products, dem früheren Froogle statt: zwar steigt der Anteil der Suchanfragen mit einer Google Shopping-Integration nur leicht, wie an diesem Diagramm zu sehen ist. Die Art der Integration wird allerdings zunehmend geändert: waren es früher Direktlinks zu den Shops, gehen mittlerweile viele der Links als Deeplink auf die Detailseite von Google Products. Dort hat Google in den letzten Monaten einen kompletten Preisvergleich mit Produktüberblick, zusammengecrapten Meinungen und Preisen der teilnehmenden Shops aufgebaut und geht jetzt dazu über, bei fast allen trafficstarken Keywords diese Verweise der Universal-Search-Integrationen auf diese Seiten umzubiegen. In den USA sind die Ergebnisse bereits zu bestaunen.Nicht nett? Wenn man den Aussagen von Sameer Samat (Produktmanager) in einem aktuellen Artikel auf CNET folgt, ist das nur der Anfang. So habe man mit Hilfe von über 100.000 Shopbetreibern, die tägliche ihre aktuellen Produktbeschreibungen und Preise übermitteln nun zwar den weltweit größten und umfassendsten Katalog an Produkten aufgebaut. Dieser helfe aber bislang nur, wenn der Nutzer bereits wisse, was er kaufen wolle. Derzeit überlegt man bei Google, wie man den Einkauf von der Aufgabe zum Erlebnis wandeln kann und damit die Kunden enger an sich bindet. Aktuell gibt es zum Beispiel schon eine Android App, mit der Nutzer den Barcode von Produkten scannen können und weitere Informationen zu dem Produkt erhalten. Auch bietet Google für Handys eine Umkreissuche, um Läden, die ein bestimmtes Produkt führen, zu finden. Für die Zukunft plant Google die Personalisierung: Google will im Shopping-Bereich von der reinen Suche zu einer Umsetzung finden, bei denen dem Nutzer neue, passende Produkte vorgeschlagen werden. Ich bin auf das neue Google Products und die lebhaften Diskussionen mit Datenschützern danach jedenfalls gespannt.
Meistgenutzte IP-Adressen
Regelmäßig gibt es die Diskussion, ob es negative Auswirkungen auf das Ranking einer Domain haben könne, wenn eine andere Domain, die auf der gleichen IP-Adresse liegt, irgendwelchen Unsinn anstellt. Ich vertrete dabei seit langem die Ansicht, dass Google die IP-Adresse nicht als negativen Faktor in den Algorithmus einfließen lassen kann, da Shared-Hosting-Installationen mit einer sehr großen Anzahl von Domains/Hostnamen auf nur einer IP-Adresse weit verbreitet sind. Bereits 2006 und 2007 habe ich mir das mal angeschaut und da ich derzeit wieder aktuelle Daten dazu haben, möchte ich die Top-Liste mit den meistgenutzen IP-Adressen teilen:IP-Adressen mit den meisten Domains
| # | IP-Adresse | Betreiber | Domains |
|---|---|---|---|
| 1 | 80.150.6.143 | T-Online Hosting | 82.157 |
| 2 | 74.125.43.121 | Blogger.com | 81.686 |
| 3 | 81.169.145.70 | Strato | 60.050 |
| 4 | 81.169.145.68 | Strato | 59.563 |
| 5 | 81.169.145.75 | Strato | 59.541 |
| 6 | 81.169.145.72 | Strato | 59.472 |
| 7 | 81.169.145.67 | Strato | 59.320 |
| 8 | 81.169.145.73 | Strato | 59.281 |
| 9 | 81.169.145.65 | Strato | 59.159 |
| 10 | 81.169.145.74 | Strato | 59.125 |
| 11 | 81.169.145.71 | Strato | 59.124 |
| 12 | 81.169.145.69 | Strato | 58.753 |
| 13 | 81.169.145.66 | Strato | 58.718 |
| 14 | 64.202.189.170 | GoDaddy.com | 56.957 |
| 15 | 208.73.210.28 | Oversee.net | 53.577 |
| 16 | 216.8.179.23 | NameDrive | 47.947 |
| 17 | 205.178.145.65 | Network Solutions | 44.028 |
| 18 | 188.40.70.45 | de.vu und Vergleichbares | 35.647 |
| 19 | 68.178.232.99 | GoDaddy.com | 27.676 |
| 20 | 68.178.232.100 | GoDaddy.com | 26.133 |
| 21 | 89.31.143.1 | United Domains | 21.816 |
| 22 | 207.217.125.50 | EarthLink | 20.087 |
| 23 | 64.95.64.198 | NameMedia | 17.729 |
| 24 | 85.237.85.69 | Powerweb | 17.254 |
| 25 | 216.240.187.175 | Domainsponsor | 17.129 |
| 26 | 209.157.71.50 | Homestead | 16.587 |
| 27 | 216.240.187.145 | Domainsponsor | 16.158 |
| 28 | 64.29.151.221 | Carrierzone.com | 15.849 |
| 29 | 213.186.33.2 | OVH | 15.079 |
| 30 | 89.31.143.101 | United Domains | 15.068 |
| 31 | 213.186.33.19 | OVH | 14.535 |
| 32 | 81.91.170.22 | Denic | 14.286 |
| 33 | 62.116.163.221 | InterNetX GmbH | 13.929 |
| 34 | 82.98.86.163 | Sedo | 13.578 |
| 35 | 68.142.205.137 | Yahoo | 13.094 |
| 36 | 89.31.143.12 | United Domains | 11.622 |
| 37 | 82.98.86.171 | Sedo | 11.516 |
| 38 | 216.39.57.104 | Yahoo | 11.426 |
| 39 | 216.34.131.135 | fabulous.com | 11.179 |
| 40 | 81.169.145.87 | Strato | 11.130 |
| 41 | 216.39.57.107 | Yahoo | 11.067 |
| 42 | 81.169.145.82 | Strato | 10.963 |
| 43 | 81.169.145.85 | Strato | 10.793 |
| 44 | 81.169.145.88 | Strato | 10.792 |
| 45 | 89.31.143.2 | United Domains | 10.773 |
| 46 | 81.169.145.83 | Strato | 10.767 |
| 47 | 81.169.145.84 | Strato | 10.751 |
| 48 | 81.169.145.81 | Strato | 10.727 |
| 49 | 81.169.145.91 | Strato | 10.718 |
| 50 | 81.169.145.86 | Strato | 10.671 |
Lustigerweise ist Google mit Blogger.com und allen dort gehosteten Blogs bereits auf Platz zwei; geschlagen nur vom Hosting von T-Online. Danach folgen GoDaddy und danach die Massen-Server von Strato. Allein diese sind ein gutes Beispiel, dass Google nicht alle der 55.000 Domains eines Server in Sippenhaft für die Fehltritte einzelner Domains nehmen kann und wird. Das soll natürlich nicht heißen, dass es ausgeschlossen ist, dass die IP-Adresse bei einer manuellen Überprüfung herangezogen wird - aber auch da glaube ich, dass es bessere Merkmale gibt, auf die Google setzt.
Wohin entwickelt sich der Linkgraph?
Vor über zehn Jahren hat Google die Verlinkung zum zentralen Rankingkriterium gemacht hat – seitdem hat sich viel getan: der PageRank hat an Relevanz im Signalmix verloren, andere Faktoren wie „Vertrauen“ oder „Link-Diversität“ haben vermutlich gewonnen. Allerdings sind das alles Maßnahmen, die eher als Finetuning zu bezeichnen sind – grundlegende Veränderungen gab es in dieser Zeit nicht. Dabei würde dem Suchmarkt etwas frischer Wind bestimmt gut tun und die Marktanteile wieder etwas zugunsten eines fairen Wettbewerbs verschieben. Derzeit sehe ich drei mögliche Richtungen, in welche die Entwicklung gehen könnte:Verlinkungen bleiben Haupt-Rankingkriterium – alles bleibt, wie gehabt. Der Linkgraph bleibt weiterhin das primäre Signal, Veränderungen gibt es lediglich in der Gewichtung und Teilaspekten. Dafür spricht, dass Google in den letzten Jahren seinen deutlichen qualitativen Vorsprung vor der Konkurrenz gehalten und teilweise sogar noch ausbauen konnte. Ein Ende der Entwicklung scheint also nicht in Sicht und auch zahlreiche neue Patente aus Mountain View deuten in diese Richtung.
Der Semantik gelingt der Durchbruch – seit Jahren wird der große Durchbruch regelmäßig angekündigt, so richtig tut sich allerdings nicht. Wolfram|Alpha hat kein neues Zeitalter eingeleitet, Powerset ist in Bing auf- und offenbar untergegangen. Sollte es in dem Bereich allerdings eine Wende geben, so könnte ich mir schon vorstellen, dass eine semantische Analyse von Webseiten qualitativ hochwertige Ranking-Signale hervorbringt und die derzeitige Rolle der Links (zumindest teilweise) ablöst.
Socialgraph als Gegenentwurf – als Facebook vor einigen Wochen den Link-Button in die freie Wildbahn entlassen hat, so hat das zwar in anderen Branchen für Aufsehen gesorgt, das Wissen um möglichen Auswirkungen auf die Suchmaschinenbranche scheint allerdings nicht so richtig in Deutschland angekommen. Im Prinzip geht es – wie bei Links – auch hier um Empfehlungen: Person A empfiehlt URL B. Zusätzlich hat der Socialgraph noch einige Vorteile: so scheint es durch niedrigere „Teilnahme-Hürden“ mehr Daten zu geben (ein Blogposting hier erhält bestimmt 50 Likes, aber nur 2 bis 3 Links) und die Empfehlungen können in Abhängigkeit zur Beziehung mit der fragenden Person gewichtet werden.
Persönlich glaube ich, dass wir noch einige Zeit mit dem Linkgraphen als primäres Ranking-Kriterium leben werden. Die Qualität der Ergebnisse hat sich über die letzten Jahre gesteigert und ist weiter in Entwicklung. Spannend finde ich den Socialgraph, allerdings wird noch etwas Zeit vergehen, bis wir dort erste Anwendungen und Ergebnisse sehen.
Google mistet die SERPs aus
Es hatte sich die Woche über schon angedeutet, mit den neuen Daten der SISTRIX Toolbox gibt es nun mehr nachvollziehbare Fakten: Google hat einer Reihe von Seitentypen dem Kampf angesagt und verjagt sie konsequent aus den SERPs. Schaut man sich die Absteiger der Woche an, so stehen dort
Waren die Schwankungen in den vergangenen Jahren noch recht organisch, geht es diese Woche so deutlich runter, wie es sonst nur bei Google Penalties auftritt. Während Mister-Wong.de sicherlich das bekannteste Opfer ist, so gibt es noch zahlreiche weitere Domains, die vergangene Woche massiv an Sichtbarkeit in den Google-SERPs verloren haben und die in ein gewisses Schema passen. Hier einige Beispiele mit den prozentualen Verlusten zur Vorwoche, um einen Eindruck davon zu erhalten:
| # | Domain | Veränderung | |
|---|---|---|---|
| 1 | bizinformation.org | -98% | |
| 2 | exika.de | -98% | |
| 3 | englischlehrer.de | -98% | |
| 4 | alleworte.de | -97% | |
| 5 | mister-wong.de | -96% | |
| 6 | allrecipes.de | -96% | |
| 7 | rezeptsuche.info | -93% | |
| 8 | artikel-online.de | -89% | |
| 9 | vorlagen.de | -89% | |
| 10 | experten-tricks.de | -83% |
Auch, wenn man jetzt leicht zu dem Schluss kommen könnte, dass Google hier einfach Domains mit wenig nützlichen Inhalten ausfiltert, so scheint mir das etwas zu einfach. Denn auch Domains wie bankenverband.de sind von dem Filter offenbar betroffen – vielleicht hat hier die Anhäufung von zahlreichen „Money-Keywords“ den Ausschlag gegeben.
Google Caffeine ist live
Es hat doch deutlich länger gedauert, als ursprünglich angekündigt: Google hat laut eigener Angaben nun seine neue Infrastruktur fertiggestellt und auf die auslieferndes Datencenter überspielt. Unter dem Namen „Caffeine“ sorgt die neue Basis in Zukunft dafür, dass neue Inhalte schneller gecrawled, indexiert und so auch gefunden werden können.Vor einigen Monaten habe ich auf der Campixx einen Vortrag zu dem Thema gehalten und geraten, in welche Richtung die Reise mit Caffeine geht. Rückblickend lag‘ ich mit meinen Annahmen nicht komplett daneben – mit Caffeine rückt Google vom Konzept der statischen Indexe ab, die in regelmäßigen Intervallen erneuert wurden. Der ein oder andere wird sich noch daran erinnern, dass es bei Google lange sogar in den SERPs einen Hinweis darauf gab, dass die gefundenen Seiten aus dem „Supplemental Index“ kommen, also nicht unbedingt brandaktuell sind. Mit Caffeine kann Google neue Inhalte nun direkt in den Index einspielen.
Auch, wenn Google betont, dass sich am Ranking (vorerst) nichts ändert, kann ich mir doch einige Auswirkungen vorstellen: dadurch, dass der neue Index mal wieder gewachsen ist, werde zahlreiche Signale neue Werte ergeben. Das kann in einigen Fällen dazu führen, dass es für einzelne Domains und Seiten zu Verschiebungen kommt. Ebenfalls glaube ich nicht, dass Google die zahlreichen neuen Möglichkeiten von aktuelleren Signalen für das Ranking auf Dauer ungenutzt lassen wird – schauen wir mal, was die Zukunft bringt.
IndexWatch 05/2010
Der Monat ist rum und zeitgleich mit dem guten Wetter kommen auch die aktuellen IndexWatch-Zahlen für Mai 2010. Wie immer zeigen wir hier auf Basis des SISTRIX Sichtbarkeitsindexes die Auf- und Absteiger im Googleindex. Los geht es wie üblich mit den Gewinnern:Gewinner
| # | Domain | Veränderung | |
|---|---|---|---|
| 1 | sport.de | +100.000% | |
| 2 | edelight.de | +1.186% | |
| 3 | flyamo.de | +1.148% | |
| 4 | gegen-hartz.de | +790% | |
| 5 | pdfgeni.com | +286% | |
| 6 | branchenbuchdeutschland.de | +277% | |
| 7 | bpb.de | +263% | |
| 8 | elternimnetz.de | +259% | |
| 9 | heine.de | +248% | |
| 10 | iphone-ticker.de | +144% | |
| 11 | barmer-gek.de | +141% | |
| 12 | cluburlaub.de | +121% | |
| 13 | billiger.de | +115% | |
| 14 | paperball.de | +102% | |
| 15 | indymedia.org | +97% |
Bei den Gewinnern sind diesen Monat hauptsächlich zwei Typen von Domains dabei: Umzüge bestehender Seiten auf neue Domains und Entlassungen aus unterschiedlichen Penalties. Zur ersten Gruppe zählen zum Beispiel sport.de und barmer-gak.de. Bei Sport.de wurden die Inhalte von sport.rtl.de auf die neue Domain transferiert und die Rankings scheinen mitumzuziehen, die Inhalte (und Rankings) von barmer-gak.de waren vorher unter barmer.de zu finden. Scheint in beiden Fällen sauber funktioniert zu haben, die alten Domains sind folglich auch bei den Verlierern dabei.
Bei den Penalties sind unterschiedliche Ausprägungen dabei: selbstverschuldete wie bei bpb.de (vermutlich „versehentlich“ eine falsche robots.txt eingespielt) und elternimnetz.de sowie durch Google (vorübergehend) fallengelassene Rankingstrafen wie bei edelight.de und heine.de. Interessant ist bei der Liste noch das starke Wachstum von flyamo.de - dort scheint man den
Verlierer
| # | Domain | Veränderung | |
|---|---|---|---|
| 1 | hotmail.com | -100% | |
| 2 | travel3.de | -99% | |
| 3 | hamburg-frage.de | -98% | |
| 4 | finanzinform.de | -97% | |
| 5 | barmer.de | -97% | |
| 6 | frauenzimmer.de | -96% | |
| 7 | celeb.ag | -94% | |
| 8 | adpedia.de | -93% | |
| 9 | jobcenter.info | -93% | |
| 10 | seneque.com | -92% | |
| 11 | pdfqueen.com | -91% | |
| 12 | semager.de | -89% | |
| 13 | lastminutestern.de | -83% | |
| 14 | softliste.de | -79% | |
| 15 | rezepterang.de | -79% |
Die Gründe unterscheiden sich nicht groß von denen der Gewinner - nur mit umgekehrtem Vorzeichen: Hotmail.com ist mittlerweile komplett in Live aufgegangen, die Domain deswegen weitestgehend aus dem Index raus. Barmer.de ist ja bereits bei den Gewinnern besprochen worden.
Bei einigen der Verlierer würde ich fehlgeleitetes Linkbuilding als Ursache sehen. Wenn ich mir die am häufigsten genutzten Linktexte für die Domains so ansehe, so hat das nicht viel mit einer natürlichen Verteilung zu tun. Google erkennt solche Abweichungen vom Standard recht zuverlässig - und wenn es keine ausreichend gute Erklärung dafür gibt, wird die Seite in den SERPs nach hinten durchgereicht.
SEO-Tool: Starke Unterseiten finden
Frisch aus dem SISTRIX Labor möchte ich euch ein kleines Tool vorstellen und gleichzeitig um Feedback bitten. Das Tool soll die 25 stärksten Unterseiten einer Domain ermitteln. Dazu schaut es sich die Backlinks einer Domain mit der jeweiligen, konkreten Ziel-URL an und wertet sie nach Anzahl und Qualität aus. Das Ergebnis wird dann nach Stärke der URLs sortiert ausgegeben.Recht gut funktioniert das bereits bei großen und mittelgroßen Domains. Bei eher selten verlinkten sind häufig nicht ausreichend Daten vorhanden, um sinnvolle Ergebnisse zu ermitteln. Mögliche Anwendungsfälle für die Auswertung sind vielfältig: so kann man beispielsweise nachsehen, von welcher Unterseite man am liebsten einen Link hätte oder Fehler in der (selber gesteuerten) Verlinkung erkennen. Bei seo-united.de zeigen recht viele Links auf „seo-united.de/blog“ – dies ist aber eine 301-Weiterleitung auf „/blog/“. Da man wohl davon ausgehen kann, dass durch die Weiterleitung etwas Linkjuice verloren geht, wäre es für die Zukunft besser, die Links einheitlich auf die korrekte URL zu setzen.
Das Tool ist bis auf weiteres kostenlos nutzbar, also schaut es euch an, gebt ein paar Domains ein und wenn die Resultate groß von den Erwartungen abweichen, würde ich mich über Feedback (entweder hier in den Kommentaren oder per E-Mail) freuen.