Neu registrieren / Login

Rückblick auf Google Mayday

Dieses Jahr gab es bei Google zwei größere Veränderungen, die Auswirkungen auf das Ranking hatten: Google Caffeine und das Mayday-Update. Bei ersterem hat Google die Infrastruktur erneuert, um den geänderten Anforderungen an Größe und Geschwindigkeit gerecht zu werden; eine Änderung des Ranking-Algorithmus ist dabei nicht erfolgt. Bei dem Mayday-Update (das seinen Namen wegen der Einspielung um den 1. Mai hat) sieht es anders aus: hier hat Google den Algorithmus angepasst, um bessere andere Suchergebnisse zu präsentieren. Die Änderungen hatten hauptsächlich Auswirkungen auf den Longtail, also jene Keywords, die einzeln zwar eher selten gesucht werden, in ihrer Summe aber bei vielen Seitentypen einen Großteil des Traffics ausmachen können. In der Toolbox haben wir neben den wöchentlich aktualisierten Daten auch eine Datenbasis, um diesen Longtail abzubilden. Sie besteht aus über 10 Millionen Keywords und wird monatlich auf den aktuellen Stand gebracht. Die folgenden Daten beziehen sich auf eben jene Quelle.

Wenn Google in den letzten Jahren größere Änderungen am Algorithmus vorgenommen hat, so ging das häufig in die Richtung, dass der Domain-Trust, als das Vertrauen, das Google in die Qualität dieser Domain hat stärker gewichtet wurde. Das erhöht zwar nicht unbedingt die Qualität der einzelnen Treffer in den Top-10, verringert aber die Wahrscheinlichkeit, dass grobe Ausfälle dabei sind. Um das zu testen, habe ich in der ersten Tabelle die Anzahl der unterschiedlichen Domains in den Top-3, Top-10 und Top-100 vor und nach dem Update ausgewertet:

Anzahl unterschiedlicher Domains
Vor MaydayNach MaydayVeränderung
Top-31.787.0591.776.188-0.7%
Top-103.523.3323.677.257+4,3%
Top-10012.489.20511.712.946-7,3%

Leider ergibt sich kein klares Bild: in den Top-3 gab es fast keine Änderung, in den Top-10 sind nach dem Update sogar mehr unterschiedliche Domains vertreten. Nur in den Top-100 sind nach Mayday deutlich weniger Domains zu finden, als zuvor. Vielleicht hat Google also bei diesem Update an der Trust-Schraube gedreht, allerdings hatte das eher auf den hinteren Plätzen Auswirkungen - auf den relevanten Positionen der ersten Seite scheint man andere Signale zu nutzen.

Die nächste Auswertung zeigt die Gewinner des Mayday-Updates in absoluten Keyword-Zahlen. Dabei habe ich versucht, die Liste auf diejenigen Domains zu beschränken, bei denen die Verschiebungen recht wahrscheinlich auf Mayday zurückzuführen sind und nicht ein allgemeines Wachstum der Domain zeigen:

Gewinner
#DomainVorherNachherGewinn
1facebook.com896.2422.067.1891.170.947Domaininfo
2youtube.com2.491.5563.067.692576.136Domaininfo
3wikipedia.org4.095.1984.560.067464.869Domaininfo
4gutefrage.net1.976.2372.349.367373.130Domaininfo
5yahoo.com2.707.4983.025.174317.676Domaininfo
6wordpress.com1.696.2461.941.639245.393Domaininfo
7markt.de312.879508.875195.996Domaininfo
8apple.com427.187619.440192.253Domaininfo
9amazon.com901.8841.080.874178.990Domaininfo
10yopi.de823.524997.778174.254Domaininfo
11stern.de398.104543.696145.592Domaininfo
12zeit.de403.154530.112126.958Domaininfo
13suchen.de372.214473.450101.236Domaininfo
14faz.net473.143574.302101.159Domaininfo
15meinestadt.de902.981983.84980.868Domaininfo

Und direkt noch die gleiche Liste, dieses Mal aber mit den Verlierer-Domains aus dem Mayday-Update:

Verlierer
#DomainVorherNachherVerlust
1ebay.de3.635.8512.645.512990.339Domaininfo
2preisvergleich.de933.573321.894611.679Domaininfo
3germanblogs.de684.718155.053529.665Domaininfo
4wikio.de944.819454.452490.367Domaininfo
5folkd.com666.508183.144483.364Domaininfo
6oneview.de813.825346.051467.774Domaininfo
7websitewiki.de641.226220.494420.732Domaininfo
8yatego.com1.249.758855.726394.032Domaininfo
9shopping.com1.248.120915.624332.496Domaininfo
10yigg.de320.9923.882317.110Domaininfo
11berlinonline.de586.298269.459316.839Domaininfo
12quoka.de964.070662.460301.610Domaininfo
13hotfrog.de1.258.9691.016.121242.848Domaininfo
14libri.de577.631344.868232.763Domaininfo
15linkarena.com256.48926.748229.741Domaininfo

Wenn ich die Listen mit meiner „gefühlten“ Qualität der Inhalte auf den jeweiligen Domains abgleiche, so scheint Google mit diesem Update erfolgreich gewesen zu sein. Projekte mit eigenem Content sind nun im Longtail stärker vertreten, solche mit eher dünnen Inhalten, die häufig auch nicht einzigartig sind, zählen zu den großen Verlierern. An welchen Stellschrauben aber konkret gedreht wurde, ist weiter unklar. Ich könnte mir vorstellen, dass Google im Longtail wieder etwas stärker auf die Bewertung von Onpage-Faktoren setzt, aber auch die Einbeziehung (seitenweiter) Faktoren wie die Bouncerate oder Verweildauer auf der Domain ist nicht ausgeschlossen.
Johannes Beus - 25.08.2010 12:22 - Kommentare 23 Kommentare

TRG OBS, Irgendwie und SEO, Dmexco & SEOktoberfest

Wie der Blick aus dem Fenster untrüglich verrät, geht der Sommer so langsam dem Ende entgegen und damit nimmt die Frequenz seo-relevanter Veranstaltungen auch wieder sprunghaft zu. Los ging es vergangene Woche bereits mit dem TRG Online Business Summit. In entspannter Atmosphäre haben rund 100 geladene Teilnehmer über Entwicklungen und Chancen im Internet diskutiert. Hat mit gut gefallen und ich hoffe auf eine Weiterführung im kommenden Jahr (Full Disclosure: ich bin bei TRG Gesellschafter).

Stefan wird 10 und mit Unterstützung von Bing will er seinen runden Geburtstag in München feiern. Unter dem Namen Irgendwie und SEO gibt es am 10. September eine kurzweilige Kombination von kleiner Konferenz mit großer, anschließender Party. Ich freue mich schon auf die Zeit in München, suchmaschinentricks.de war einer meiner ersten Anlaufpunkte zum Thema SEO. Die Karten sind mittlerweile leider ausverkauft, aber das 20-jährige Jubiläum kommt bestimmt.

Ich bin kein großer Freund der OMD Dmexco und war im letzten Jahr gar nicht so traurig, dass das SEOktoberfest zeitgleich stattgefunden hat. Dieses Jahr überschneiden sich die Termine nicht mehr und da ich noch keine passende Ausrede gefunden habe, werde also vermutlich auch nach Köln fahren. Für Unterhaltung wird jedenfalls gesorgt sein: am Vorabend geht es mit dem Affiliate Stammtisch der metaapes los, danach kann man sich zwischen dem TRG Online Stammtisch Köln und dem OMClub von Randolf entscheiden.

Die Woche danach geht es wieder nach München zum Abschluss und Höhepunkt: zum dritten SEOktoberfest. Ich bin auf neue Gesichter gespannt und wie Marcus die Veranstaltung des letzten Jahres noch toppen will - es ist ja immerhin das 200. Oktoberfest. Am zweiten Tag wird wieder das Friends & Family Dinner stattfinden und wer Interesse hat, kann noch ein Ticket ersteigern. Der Gewinn kommt komplett einem guten Zweck zugute, es gibt also keine Ausrede.
Johannes Beus - 18.08.2010 11:14 - Kommentare Beitrag kommentieren

Auswirkungen von Google Caffeine

Es ist jetzt bereits etwas her, dass Google offiziell verkündet hat, dass eine neue Suchinfrastruktur mit dem Namen „Caffeine“ künftig die Grundlage für viele Google-Anwendungen stellen wird. Diese Infrastruktur ist mittlerweile in Betrieb und ich habe zwei Auswertungen erstellt, die einen Einblick in die Veränderungen geben. Das erste Diagramm zeigt den Anteil der Keywords, bei denen mindestens ein Treffer unter den ersten 10 Ergebnissen ein sogenannter „aktueller Treffer“ ist. Das sind die Ergebnisse, bei denen Google zusätzlich angibt, vor wie viel Minuten die Seite gefunden/aktualisiert wurde:


Schön zu sehen, dass die Quote seit Ende 2008 bis Ende 2009 recht konstant geblieben ist, mit dem Jahreswechsel auf 2010 dann allerdings sprunghaft anstieg. Mittlerweile haben zwischen 20 und 35 Prozent der Suchergebnisse mindestens einen aktuellen Treffer auf der ersten SERP. Das zweite Diagramm zeigt eine ähnliche Auswertung, bezieht sich allerdings auf Integrationen der Realtime-Suche, dieser Box, die sich selbständig aktualisiert und immer die aktuellen Twitter-Meldungen und Facebook-Statusmeldungen zu einem Keyword zeigt. Da Google damit erst 2010 angefangen hat, geht die Zeitachse auch nur auf dieses Jahr ein:


Anfangs noch zögerlich, macht Google zunehmend stärkeren Gebrauch von dieser Möglichkeit. Die Wellenbewegung lässt vermuten, dass in der Zwischenzeit ausgewertet wird, wie gut das Feature bei den Nutzern ankam. Die Ergebnisse scheinen zufriedenstellend, Google setzt die Box jedenfalls immer häufiger ein und wir werden uns wohl auch in Zukunft an den Anblick gewöhnen müssen. Interessant wird bei steigender Wichtigkeit, wie Google das Spamproblem in den Griff bekommt – die Anzahl und Qualität von Rankingsignalen ist bei so neuen Daten jedenfalls sehr eingeschränkt.
Johannes Beus - 17.08.2010 22:21 - Kommentare 13 Kommentare

IndexWatch 07/2010

Ein produktiver Monat ist rum und es ist allerhöchste Zeit, auf die Gewinner und Verlierer im Google-Index zu schauen. Wie üblich liste ich auf Basis des SISTRIX Sichtbarkeitsindex jeweils 15 Domains der beiden Kategorien auf und erläutere zu den interessanten Fällen die Hintergründe. Los geht es mit den Gewinnern des letzten Monats:


Neben Domains, die sich von einer Penalty erholt haben (zum Beispiel monstersandcritics.de und spruechetante.de), sind diesen Monat auch einige dabei, die überraschend stark an Sichtbarkeit in den deutschen SERPs gewonnen haben. So hat cyberport.de es beispielsweise geschafft, den Sichtbarkeitsindex in den letzten zwei Wochen zu verdoppeln. Auch afterbuy.de hat einen sprunghaften Anstieg erlebt. Schaut man sich bei dieser Domain die Aufteilung auf die Hostnamen an, so ist klar, dass Google seit rund zwei Wochen offenbar der ganzen Domain mehr Vertrauen entgegenbringt und alle vorhandenen Seiten durch die Bank deswegen besser ranken. Das wird auch bei einem Blick auf die Rankingverteilung klar: seit dem 26.07. sind deutlich mehr Keywords auf den Seiten 1 bis 3 vertreten.

Die Privatkundenseite der Commerzbank hat davon profitiert, dass die Seite der Dresdner-Bank weitergeleitet wurde, Google.at hat (mal wieder) den Duplicate-Content-Kampf im Themenbereich „Übersetzungen“ gegen die Google.de und Google.ch gewonnen. Herzlichen Glückwunsch.


Bei den Verlierern zeigt sich ein gemischtes Bild von Penalties, Domainumzügen und anderen Problemen. Die Wedding.de wurde auf ein neues Portal umgeleitet, man konnte Google aber wohl nicht davon überzeugen, dass die neue Domain gleich wertvoll ist - rund 50% Sichtbarkeit fehlen bislang. Bei Flyamo.de hat es dieses Mal, nachdem es vor einigen Wochen bereits einen Warnschuss gab, wohl zu einer richtigen Penalty gereicht: kaum ein Keyword wird noch vor Position 90 gefunden.

Die FHM hat sich entschieden, keine eigene Webseite mehr zu betreiben, sondern nur noch die Fanpage bei Facebook zu nutzen. Das zeigt sich jetzt natürlich auch in der Sichtbarkeit der alten Domain - innerhalb kurzer Zeit ging es von einem Wert zwischen 3 und 4 auf 0 zurück. Schaut man sich im Gegenzug die Fanpage bei Facebook an, so wird deutlich, dass der Schritt - zumindest aus SEO-Sicht - nicht sonderlich glücklich war. Der Sichtbarkeitswert liegt dort bei rund 1,3.
Johannes Beus - 06.08.2010 11:04 - Kommentare 17 Kommentare

Twitter die zweitgrößte Suchmaschine?

Seit einiger Zeit wiederholt sich das Spiel jeden Monat: Twitter verkündet, wie viele Suchanfragen im letzten Monat bearbeitet wurden und irgendwelche Qualitätsjournalisten setzen diese Zahlen in Relation zu Daten von Google, Yahoo und Bing. Danach wird Twitter als Google-Killer gekürt. Irgendwas stimmt da doch nicht, oder?

Das erste Problem ist, dass die Daten aus völlig unterschiedlichen Quellen stammen. So wird für die Anzahl der Suchanfragen der großen Suchmaschinen üblicherweise auf die Auswertung von comScore oder vergleichbaren, externen Dienstleister zurückgegriffen. Die messen über ein hoffentlich aussagekräftiges eigenes Panel und ermitteln damit Daten, die untereinander vergleichbar sind - nicht aber mit externen Zahlen.

Das zweite Problem ist die komplett unterschiedliche Definition von „Suchanfrage“: bei den Suchmaschinen ist es recht klar - der Nutzer gibt ein Keyword ein, findet was er sucht und fertig ist die Suchanfrage. Twitter zählt da leider komplett anders. Wenn Spiegel Online bei einem Deutschland-WM-Spiel links in der Navigation eine Box mit dem Twitter-Stream einbindet, so zählt Twitter jeden Aufruf der Spiegel-Seite als Suchanfrage. Das gleiche gilt für die unzähligen API-Clients: mein Tweetdeck „sucht“ alle 5 Minuten nach „sistrix“, führt also jeden Tag rund 250 Suchanfragen aus, jeden Monat über 8.000. Und diese Zahlen soll man jetzt vergleichen können?
Johannes Beus - 09.07.2010 11:02 - Kommentare 15 Kommentare

IndexWatch 06/2010

Schon sind wir im Juli, es ist also an der Zeit für die frischen IndexWatch-Zahlen aus dem vergangenen Monat. Wie üblich, präsentieren wir hier auf Basis der Veränderungen im SISTRIX Sichtbarkeitsindex die Auf- und Absteiger im Google-Index des letzten Monats. Los geht es mit den Gewinnern:


Große Überraschungen gibt es in dieser Liste nicht. Wie üblich sind einige Domains dabei, die aus einer Penalty entlassen wurden und nun wieder halbwegs ordentlich ranken. Dazu zählen zum Bespiel travel3.de und celeb.ag. Auch pornoblog.at ist wieder in den Ergebnislisten der Suchmaschine vertreten – hier hat anscheinend der „Pornofilter“ zugeschlagen und einen Großteil der Keywords zeitweise aus dem Ranking genommen, wie man an diesem Screenshot schön sieht.

Ansonsten sind überraschend viele eher Inhaltsschwache Seiten dabei: obskure Branchen- und Firmenverzeichnisse und Ähnliches. Ich möchte bei dieser Gelegenheit ausdrücklich darauf hinweisen, dass ich damit nicht die Domain „cylex-review.com“ meine. Die haben mir nach der letzten Äußerung in dieser Richtung direkt eine Abmahnung geschickt. Supportnet.de ist übrigens nur in der Liste, weil es zum Stichtag vor einem Monat zu einem deutlichen „Durchsacken“ des Sichtbarkeitswertes kam – insgesamt ist die Domain seit Anfang der Messungen auf dem absteigenden Ast. Sportschau.de wechselt sich (Duplicate Content sei Dank) in den Rankings immer fröhlich mit sport.ard.de ab, aber das habe ich glaube bereits mal geschrieben.


Die Absteiger des Monats werden dominiert von den Domains, die der bereits besprochenen Säuberungsaktions von Google zum Opfer gefallen sind. Auch hier sieht man wieder, dass es zwar gewisse Parallelen gibt, eine eindeutige Ursache aber nicht ausgemacht werden kann. Es ist aber davon auszugehen, dass es sich nicht nur um eine einmalige Aktion gehandelt hat, sondern Google in Zukunft regelmäßig Projekte entfernt, die über gewisse Grenzen schlagen.
Johannes Beus - 01.07.2010 08:21 - Kommentare 19 Kommentare

Skoda.de - mit Vollgas aus dem Ranking

Auch wenn mein Jetta fast täglich ein Quell neuer Freude ist und die 1.6 Liter Maschine schnurrt, als sei sie gerade erst gebaut worden, so schaue ich doch ab und an auf die praktischen Autos der VW-Tochtermarke aus Tschechien. Jetzt hat man sich offensichtlich dazu durchgerungen, den reichlich antiquierten Webauftritt zu relaunchen. Mag die neue Seite optisch noch recht gefällig wirken, hat man bei der SEO-Umsetzung eine Reihe von Fehlern gemacht, die ich in diesem Posting gerne beleuchten möchte, auf dass sie nicht von anderen wiederholt werden. Zuerst ein Blick auf den Verlauf des Sichtbarkeitsindexes für die Domain:

Sichtbarkeitsindex Skoda.de

Seit Anfang 2008 gab es keine großen Veränderungen, mal ging es etwas nach oben, dann wieder nach unten. Bis letzte Woche: da hat Skoda.de 60% verloren - von knapp 6 auf 2,3 Punkte. Sieht man sich die Ursachen für den Absturz an, so wird schnell klar, dass der Relaunch die komplette Webseite getroffen hat. Neben den wenigen generischen Suchanfragen, für die skoda.de vormals in den Top-10 rankte („gebrauchtwagenbörse“ von 9 auf 19) sind hauptsächlich die trafficstarken Brand-Begriffe betroffen. Mit „skoda octavia“ fiel die Domain von Position 1 auf 11. Wenn man sich die tagesaktuellen Ergebnisse für das Keyword ansieht, so geht es noch weiter runter: Platz 90. Der Sichtbarkeitsindex wird also alles Voraussicht nach beim kommenden Update abermals stark abfallen. Dass die Betreiber der Seite sich auch bislang nicht um die Anforderungen von Suchmaschinen gekümmert haben, sieht man recht gut an dem Wechsel zwischen „skoda.de“ und „www.skoda.de“. Allerdings hat man mit dem Relaunch ein paar Hürden eingebaut, die es auch wohlwollenden Crawlern schwer machen, die Inhalte zu erfassen.

Session-IDs
Ich habe es zuerst auch nicht geglaubt, aber bei Skoda ist man offenbar der Meinung, für die Präsentation von Autos nicht auf Session-IDs verzichten zu können. Auch für Suchmaschinencrawler wird keine Ausnahme gemacht und so hat Google zahlreiche Seiten mit dem Parameter indexiert:

Session-IDs bei Skoda.de

Für Suchmaschinen ergeben sich daraus verschiedene Probleme: da mit jeder neuen Session-ID, die der Crawler vorgesetzt bekommt alle Seiten auf der Domain neue URLs haben, kommt es zu Duplicate Content-Problemen. Auch die Berechnung der internen Verlinkung ist davon betroffen, da ständig neue Links auftauchen, die alten aber nicht mehr bestehen.

Seitentitel, Wortwahl
Wenn man ein Produkt hat, das landläufig als „Skoda Octavia“ bekannt ist, wie würdet ihr den Title der Seite, auf der dieses Produkt vorgestellt ist gestalten? Tja, bei Skoda geht man etwas unkonventionelle Wege: der Titel jeder Seite auf der Domain fängt erst mal mit „Skoda Auto Deutschland GmbH“ an, erst danach wird es variabel. Auf der Autoebene angekommen führt das dann zu einem Titel, in dem „Skoda Octavia“ leider nicht in dieser Schreibweise vorkommt - auf der kompletten Domain nicht:

Komische Title-Tags

Als wäre das nicht genug, hat man auch im eigentlichen Text der Seite Probleme damit, den Produktnamen einmal korrekt auszuschreiben. Vermutlich aus Rücksichtnahme auf irgendwelche Corporate-Design-Richtlinien steht dort: „ŠkodaOctavia Limousine“ - Ja, genau, ohne Leerzeichen. Folglich kann auch Google das nicht richtig zuordnen wie man im Cache der Seite gut erkennen kann.

JavaScript, Flash, 404-Status-Code
Während die beiden ersten Punkte sicherlich ursächlich für den Absturz im Sichtbarkeitsindex waren, gibt es noch eine Reihe weiterer Probleme auf der Seite, die es Suchmaschinen schwer machen, die Inhalte zu erfassen. So ist die Sitemap, die für Crawler häufig ein sehr guter Ansatzpunkt zur Erkundung der kompletten Seite ist in JavaScript gehalten, für die Suchmaschinen also unsichtbar. Weite Teil der Webseite werden durch eine Flash-Fläche beherrscht - den dort liegenden Text können Suchmaschinen in der Regel nicht lesen und somit auch nicht in die Wertung einfließen lassen. Ein weiteres Problem für Suchmaschinen ist, dass jede URL auf der Domain den Statuscode „200“, also „alles in Ordnung“ zurückgibt. Das fällt besonders bei der (nicht vorhandenen) robots.txt auf, verleitet aber natürlich auch dazu, nicht existente Seiten in den Googleindex zu drücken ;-)

Interessant ist nun, wie Google mit der Seite in den kommenden Wochen umgeht. Da Google nicht erst seit gestern crawled und dabei gelernt hat, dass jeder nur denkbare Fehler auch gemacht wird, kommt der Googlecrawler mit den häufigsten Fehlern ganz gut zurecht und denkt sich schon, was der Seitenbetreiber eigentlichen machen wollte. Ich könnte mir auch gut vorstellen, dass es bei Skoda dazu kommt - die Domain ist einfach zu gut verlinkt, als dass Google sie dauerhaft ignorieren kann.
Johannes Beus - 25.06.2010 08:18 - Kommentare 47 Kommentare

E-Commerce im Google-Visier

In den letzten Wochen und Monaten hat Google seine Aktivitäten im Bereich Shopping und E-Commerce weiter ausgebaut. Es scheint, als gebe man sich nicht länger mit der Rolle des reinen Vermittlers zwischen den Suchenden und Onlineshops zurecht, sondern wolle ein größeres Stück vom Kuchen abhaben. So wurde zum Beispiel die Google Commerce Search neu aufgelegt. Version 2.0 der internen Suche speziell für Onlineshops bringt einige Neuerungen und kostet nur noch die Hälfte, dürfte sich deswegen schneller verbreiten und Google wertvolle Daten liefern. Spannendere Veränderungen finden auch bei Google Products, dem früheren Froogle statt: zwar steigt der Anteil der Suchanfragen mit einer Google Shopping-Integration nur leicht, wie an diesem Diagramm zu sehen ist. Die Art der Integration wird allerdings zunehmend geändert: waren es früher Direktlinks zu den Shops, gehen mittlerweile viele der Links als Deeplink auf die Detailseite von Google Products. Dort hat Google in den letzten Monaten einen kompletten Preisvergleich mit Produktüberblick, zusammengecrapten Meinungen und Preisen der teilnehmenden Shops aufgebaut und geht jetzt dazu über, bei fast allen trafficstarken Keywords diese Verweise der Universal-Search-Integrationen auf diese Seiten umzubiegen. In den USA sind die Ergebnisse bereits zu bestaunen.

Nicht nett? Wenn man den Aussagen von Sameer Samat (Produktmanager) in einem aktuellen Artikel auf CNET folgt, ist das nur der Anfang. So habe man mit Hilfe von über 100.000 Shopbetreibern, die tägliche ihre aktuellen Produktbeschreibungen und Preise übermitteln nun zwar den weltweit größten und umfassendsten Katalog an Produkten aufgebaut. Dieser helfe aber bislang nur, wenn der Nutzer bereits wisse, was er kaufen wolle. Derzeit überlegt man bei Google, wie man den Einkauf von der Aufgabe zum Erlebnis wandeln kann und damit die Kunden enger an sich bindet. Aktuell gibt es zum Beispiel schon eine Android App, mit der Nutzer den Barcode von Produkten scannen können und weitere Informationen zu dem Produkt erhalten. Auch bietet Google für Handys eine Umkreissuche, um Läden, die ein bestimmtes Produkt führen, zu finden. Für die Zukunft plant Google die Personalisierung: Google will im Shopping-Bereich von der reinen Suche zu einer Umsetzung finden, bei denen dem Nutzer neue, passende Produkte vorgeschlagen werden. Ich bin auf das neue Google Products und die lebhaften Diskussionen mit Datenschützern danach jedenfalls gespannt.
Johannes Beus - 23.06.2010 11:41 - Kommentare 14 Kommentare

Meistgenutzte IP-Adressen

Regelmäßig gibt es die Diskussion, ob es negative Auswirkungen auf das Ranking einer Domain haben könne, wenn eine andere Domain, die auf der gleichen IP-Adresse liegt, irgendwelchen Unsinn anstellt. Ich vertrete dabei seit langem die Ansicht, dass Google die IP-Adresse nicht als negativen Faktor in den Algorithmus einfließen lassen kann, da Shared-Hosting-Installationen mit einer sehr großen Anzahl von Domains/Hostnamen auf nur einer IP-Adresse weit verbreitet sind. Bereits 2006 und 2007 habe ich mir das mal angeschaut und da ich derzeit wieder aktuelle Daten dazu haben, möchte ich die Top-Liste mit den meistgenutzen IP-Adressen teilen:

IP-Adressen mit den meisten Domains
#IP-AdresseBetreiberDomains
180.150.6.143T-Online Hosting82.157
274.125.43.121Blogger.com81.686
381.169.145.70Strato60.050
481.169.145.68Strato59.563
581.169.145.75Strato59.541
681.169.145.72Strato59.472
781.169.145.67Strato59.320
881.169.145.73Strato59.281
981.169.145.65Strato59.159
1081.169.145.74Strato59.125
1181.169.145.71Strato59.124
1281.169.145.69Strato58.753
1381.169.145.66Strato58.718
1464.202.189.170GoDaddy.com56.957
15208.73.210.28Oversee.net53.577
16216.8.179.23NameDrive47.947
17205.178.145.65Network Solutions44.028
18188.40.70.45de.vu und Vergleichbares35.647
1968.178.232.99GoDaddy.com27.676
2068.178.232.100GoDaddy.com26.133
2189.31.143.1United Domains21.816
22207.217.125.50EarthLink20.087
2364.95.64.198NameMedia17.729
2485.237.85.69Powerweb17.254
25216.240.187.175Domainsponsor17.129
26209.157.71.50Homestead16.587
27216.240.187.145Domainsponsor16.158
2864.29.151.221Carrierzone.com15.849
29213.186.33.2OVH15.079
3089.31.143.101United Domains15.068
31213.186.33.19OVH14.535
3281.91.170.22Denic14.286
3362.116.163.221InterNetX GmbH13.929
3482.98.86.163Sedo13.578
3568.142.205.137Yahoo13.094
3689.31.143.12United Domains11.622
3782.98.86.171Sedo11.516
38216.39.57.104Yahoo11.426
39216.34.131.135fabulous.com11.179
4081.169.145.87Strato11.130
41216.39.57.107Yahoo11.067
4281.169.145.82Strato10.963
4381.169.145.85Strato10.793
4481.169.145.88Strato10.792
4589.31.143.2United Domains10.773
4681.169.145.83Strato10.767
4781.169.145.84Strato10.751
4881.169.145.81Strato10.727
4981.169.145.91Strato10.718
5081.169.145.86Strato10.671

Lustigerweise ist Google mit Blogger.com und allen dort gehosteten Blogs bereits auf Platz zwei; geschlagen nur vom Hosting von T-Online. Danach folgen GoDaddy und danach die Massen-Server von Strato. Allein diese sind ein gutes Beispiel, dass Google nicht alle der 55.000 Domains eines Server in Sippenhaft für die Fehltritte einzelner Domains nehmen kann und wird. Das soll natürlich nicht heißen, dass es ausgeschlossen ist, dass die IP-Adresse bei einer manuellen Überprüfung herangezogen wird - aber auch da glaube ich, dass es bessere Merkmale gibt, auf die Google setzt.
Johannes Beus - 22.06.2010 14:38 - Kommentare 23 Kommentare

Wohin entwickelt sich der Linkgraph?

Vor über zehn Jahren hat Google die Verlinkung zum zentralen Rankingkriterium gemacht hat – seitdem hat sich viel getan: der PageRank hat an Relevanz im Signalmix verloren, andere Faktoren wie „Vertrauen“ oder „Link-Diversität“ haben vermutlich gewonnen. Allerdings sind das alles Maßnahmen, die eher als Finetuning zu bezeichnen sind – grundlegende Veränderungen gab es in dieser Zeit nicht. Dabei würde dem Suchmarkt etwas frischer Wind bestimmt gut tun und die Marktanteile wieder etwas zugunsten eines fairen Wettbewerbs verschieben. Derzeit sehe ich drei mögliche Richtungen, in welche die Entwicklung gehen könnte:

Verlinkungen bleiben Haupt-Rankingkriterium – alles bleibt, wie gehabt. Der Linkgraph bleibt weiterhin das primäre Signal, Veränderungen gibt es lediglich in der Gewichtung und Teilaspekten. Dafür spricht, dass Google in den letzten Jahren seinen deutlichen qualitativen Vorsprung vor der Konkurrenz gehalten und teilweise sogar noch ausbauen konnte. Ein Ende der Entwicklung scheint also nicht in Sicht und auch zahlreiche neue Patente aus Mountain View deuten in diese Richtung.

Der Semantik gelingt der Durchbruch – seit Jahren wird der große Durchbruch regelmäßig angekündigt, so richtig tut sich allerdings nicht. Wolfram|Alpha hat kein neues Zeitalter eingeleitet, Powerset ist in Bing auf- und offenbar untergegangen. Sollte es in dem Bereich allerdings eine Wende geben, so könnte ich mir schon vorstellen, dass eine semantische Analyse von Webseiten qualitativ hochwertige Ranking-Signale hervorbringt und die derzeitige Rolle der Links (zumindest teilweise) ablöst.

Socialgraph als Gegenentwurf – als Facebook vor einigen Wochen den Link-Button in die freie Wildbahn entlassen hat, so hat das zwar in anderen Branchen für Aufsehen gesorgt, das Wissen um möglichen Auswirkungen auf die Suchmaschinenbranche scheint allerdings nicht so richtig in Deutschland angekommen. Im Prinzip geht es – wie bei Links – auch hier um Empfehlungen: Person A empfiehlt URL B. Zusätzlich hat der Socialgraph noch einige Vorteile: so scheint es durch niedrigere „Teilnahme-Hürden“ mehr Daten zu geben (ein Blogposting hier erhält bestimmt 50 Likes, aber nur 2 bis 3 Links) und die Empfehlungen können in Abhängigkeit zur Beziehung mit der fragenden Person gewichtet werden.

Persönlich glaube ich, dass wir noch einige Zeit mit dem Linkgraphen als primäres Ranking-Kriterium leben werden. Die Qualität der Ergebnisse hat sich über die letzten Jahre gesteigert und ist weiter in Entwicklung. Spannend finde ich den Socialgraph, allerdings wird noch etwas Zeit vergehen, bis wir dort erste Anwendungen und Ergebnisse sehen.
Johannes Beus - 18.06.2010 16:44 - Kommentare 34 Kommentare