Bewertet Google Links mit den Daten vom Chrome Browser?

6. August 2014, 09:31

Bewertung LinksAm 14. Februar 2012 wurde das Google Patent „Ranking documents based on user behavior and/or feature data“ veröffentlicht.

Vereinfacht ausgedrückt handelt die Patentschrift davon, dass Links anhand des Nutzerverhaltens bewertet und gewichtet werden. Ein Link, der häufig von Nutzern geklickt wird, erhält mehr Gewicht als ein Link, der selten geklickt wird.

Das Patent stellt eine wichtige Weiterentwicklung des ursprünglichen PageRank-Algorithmus dar, der jeden Link auf einer Seite unabhängig vom tatsächlichen Klickverhalten noch gleich stark gewichtet hat. Aber wie kann man sich die Bewertung von Links aufgrund des Nutzerverhaltens konkret vorstellen und welche Daten kann Google dafür verwenden?

Auswertung des Nutzerverhaltens zur Bekämpfung von Link-Spam

Denkt man ein wenig über die Gewichtung von Links anhand des tatsächlichen Klickverhaltens nach, so ist das von Google eine sehr clevere Lösung, dem künstlichen Linkaufbau zur Manipulation der Suchergebnisse etwas entgegenzusetzen.

Gekaufte Links und Spamlinks werden tendenziell eher auf einer Seite versteckt. Sie stehen im Footer, in speziellen Boxen am Seitenrand oder sind sogar komplett unsichtbar gemacht worden. Doch wenn die Nutzer die Links kaum sehen und die Links auch in vielen Fällen nicht themenrelevant sind, werden sie diese Links auch nicht klicken. Entsprechend gering werden die Links dann nach den Ideen des Patents gewichtet.

Wenn gekaufte Links nicht versteckt werden, handelt es sich oft um künstliche Websites, die nur für den Linkverkauf erstellt wurden (z.B. Blogs auf Basis von Expired Domains). Wenn es dort keine echten Nutzer gibt, können diese auch keine verkauften Links klicken. Die dort verkauften Links sind dann praktisch wertlos.

Wie kann Google das Nutzerverhalten zur Beurteilung von Links messen?

Die große Frage ist, welche Daten Google für die Gewichtung von Links verwendet. Wie kann Google messen, welcher Link wie häufig von Nutzern einer Website geklickt wird? Im SEO-Bereich werden immer wieder zwei Google-Angebote als mögliche Daten-Quellen genannt. Zum einen Google Analytics und zum anderen der Google Chrome Browser.

Persönlich glaube ich aus zwei Gründen nicht, dass Google zu diesem Zweck die Daten von Google Analytics verwendet. Zum einen betont Google immer wieder, dass sie für einen solchen Zweck keine Analytics-Daten verwenden. Sollte das nicht der Wahrheit entsprechen, käme es irgendwann heraus. Warum sollten Google hier ohne Not seine Glaubwürdigkeit aufs Spiel setzen?

Der zweite Grund ist vielleicht noch wichtiger. Die Analytics-Daten sind nicht besonders gut geeignet, um das Klickverhalten von Links auf allen Domains zu messen. Nur ein gewisser Prozentsatz der Websites hat Google Analytics integriert. Laut builtwith.com nutzen aktuell 55,7 Prozent der Quantcast Top Million Websites Google Analytics. Zu diesen Websits hat Google alle Daten, zu den restlichen 44,3 Prozent jedoch überhaupt keine Daten. Das ist eine ungünstige Verteilung. Nimmt man die gesamte Stichprobe von builtwith.com mit aktuell über 289 Millionen Domains, dann haben sogar nur 9,2 Prozent Google Analytics integriert. Auf Basis von Analytics-Daten wäre das System mehr als nur halb blind. Durch den Verzicht auf Google Analytics könnte jede Website, die Links verkaufen möchte, das System ganz einfach austricksen und in den Stealth-Modus gehen.

Google Chrome Browser

Viel besser wären die Daten geeignet, die Google über den Chrome Browser gewinnen kann. Weltweit hat der Chrome Browser nach Zahlen von StatCounter bei Desktop-Computern inzwischen einen Marktanteil von rund 50 Prozent.

Marktanteile Desktop-Browser weltweit

Deutschland ist eines der wenigen Länder auf der Welt, in denen der Chrome Browser noch nicht zum Marktführer geworden ist. Aber auch hierzulande liegt der Desktop-Marktanteil schon bei 28 Prozent. Nur der Firefox-Browser wird in Deutschland häufiger genutzt.

Nutzung Browser weltweit August 2014

Mit dieser breiten Datenbasis könnte Google die tatsächliche Nutzung von praktisch jeder Website sehr präzise messen. Ebenso lassen sich die Besucherströme über Verlinkungen zwischen verschiedenen Websites ermitteln.

Mir fällt keine Datenquelle ein, mit denen man Links anhand des Nutzerverhaltens besser bewerten könnte. Keine Website kann sich vor den Chrome-Nutzern verstecken.

Aber übermittelt der Chrome Browser tatsächlich Daten an Google, welcher Link wie häufig geklickt wurde?

Chrome versucht zu erraten, welcher Link wie oft geklickt wird

Die Frage lässt sich sehr leicht beantworten. In den erweiterten Chrome-Einstellungen (Einstellungen > Erweiterte Einstellungen anzeigen) findet man im Bereich Datenschutz eine Funktion, die sich „Netzwerkaktionen voraussehen, um die Ladegeschwindigkeit zu verbessern“ nennt. Diese Funktion ist standardmäßig bei allen Nutzern aktiviert. Nur ein kleiner Prozentsatz dürfte sie deaktiviert haben.

Google Chrome Funktion Netzweraktionen voraussehen

Die erweiterte Einstellung „Netzwerkaktionen voraussehen, um die Ladegeschwindigkeit zu verbessern“ ist standardmäßig im Google Chrome Browser aktiviert.

Worum geht es bei dieser Funktion? Wenn ein Nutzer mit dem Chrome Browser eine URL aufruft, analysiert Google die Links auf der Seite und versucht zu erraten, welchen Link der Nutzer als nächstes anklicken wird. Die Zielseiten mit den höchsten Wahrscheinlichkeiten werden dann im Hintergrund bereits geladen. Klickt der Nutzer tatsächlich auf einen dieser Links, ist die Seite bereits vorab geladen. Auf diese Weise ermöglicht der Chrome Browser ein sehr schnelles Surf-Erlebnis.

Google beschreibt die Funktion in der Chrome-Hilfe wie folgt:

Über diese Funktion: Browser verwenden zum Laden einer Webseite die IP-Adresse. Wenn Sie eine Webseite besuchen, kann Chrome die IP-Adressen aller Links auf der Website suchen und Links, auf die Sie vermutlich als Nächstes klicken werden, bereits vorab abrufen. Mithilfe der Pre-Rendering- und Vorabruf-Technologie können Websites Links, die Sie möglicherweise als Nächstes aufrufen, schneller laden.

Mit anderen Worten bedeutet die Vorabruf-Technologie aber auch, dass Google bei jedem Seitenaufruf über den Chrome-Browser einen Algorithmus trainiert, der die Klickwahrscheinlichkeit von Links bewertet. Und das mit einem weltweiten Marktanteil von 50 Prozent bei den Desktop-Browsern. Wir sprechen hier also nicht nur von irgendeiner Stichprobe, sondern von einer „halben Vollerhebung“ über praktisch alle Domains. Wer braucht da noch Analytics-Daten, die für einen großen Prozentsatz der Domains fehlen, zur Bewertung von Links?

Fazit

Die Vorabruf-Technologie bei Chrome ist die perfekte Ergänzung und der ideale Datenlieferant für das Patent „Ranking documents based on user behavior and/or feature data“.

Sollte Google nach diesem Verfahren Links bewerten, dann ist ein Link für die Suchmaschinenoptimierung um so wertvoller, je häufiger er von echten Besuchern auch tatsächlich geklickt wird. Das ist bei echten Empfehlungen in Form von echten Links entsprechend stärker der Fall als bei den meisten unnatürlichen und gekauften Links.

Natürlich wissen wir nicht, ob Google das Patent in dieser Form auch tatsächlich anwendet und ob für die Umsetzung die Chrome-Daten herangezogen werden. Bei den deutlichen Fortschritten, die Google in den letzen Jahren bei der Bekämpfung von Spam-Links gemacht hat, ist diese Erklärung aber mein persönlicher Favorit.

Was denkt Ihr über die Funktion „Netzwerkaktionen voraussehen, um die Ladegeschwindigkeit zu verbessern“? Gibt es Gründe, warum Google diese wertvollen Daten nicht auch für seinen Ranking-Algorithmus nutzen würde?

Dieser Beitrag hat 23 Kommentare

 
  6. August 2014, 09:52

Das würde das Linkbuilding auf eine ganz neue Ebene bringen. Eben mal schnell Links aufbauen geht dann nicht mehr, bzw. würde nicht viel bringen. Ich frage mich grad nur, wie dann ältere Links bewertet werden. Bis jetzt sind diese ja meist aufgrund ihres Alters wertvoll, egal ob sie häufig geklickt werden oder nicht. Dies würde sich dann schlagartig ändern.

 
  6. August 2014, 10:01

Spannender Ansatz, der meiner Meinung nach bei der Chrome Beurteilung nicht passt. Das Prerendering findet ausschlisslich beim Client statt und ein erfolgreicher Klick hat keine Response an Google. Es erfolgt nur ein DNS Prefetching was gerade auf die Serps einen schnelleren Einfluss hat. Somit kann Google das Suchempfinden der Nutzer auf Google steigern, in dem die Domains in den Serps voraufgelöst werden. Ist ne nette Funktion die durchaus Sinnvoll eingesetzt werden kann auch von anderen Webseiten.

Weiterhin sendet der Chrome so gut wie keine Daten nachhause, die einzigen Ausnahmen sind Auto Complete auf URL und Keyword Basis und Safe-Browsing, bei Safe-Browsing findet nur alle 30 Minuten ein verschlüsselter Austausch einer Domaindatenbasis statt. Man könnte zwar über ein Prediction Algo versuchen die wahrscheinlichkeit eines Links berechnen, der Aufwand wäre riesig aber wahrscheinlich machbar, gerade wenn man Zeit, IP und Herkunftsdomain und Zieldomains als Matchindikatoren nimmt.

Eine weitere Alternative wären die DNS Dienste von Google hier werden mittlerweile knapp 70 Milliarden Abfragen täglich abgefrühstückt, hier könnte man mittels den gleichen Indikatoren und Predition ebenfalls gute Daten evaluieren.

Grundsätzlich glaub ich das hier ein erweitertes Reasonable Surfer Modell stattfindet.

Ich wäre mit solchen Spekulativen Aussagen sehr vorsichtig, da Sie meistens doch die Grundlage solcher Urban Legends werden, ala Chrome sendet permanent nach Hause etc… Hab selber viele Tests gemacht, aber bis auf Safe-Browsing und Suggest auf Keyword und URL Basis nie was abgefangen. Mit den älteren Versionen hat Google aber Daten nach Hause gesendet, vielleicht kommt daher auch immer noch die Legende das Chrome nach Hause sendet.

Ich überzeug mich aber auch gerne von anderen Tests…

Grüße aus Berlin

 
Hanns Kronenberg
  6. August 2014, 10:03

@Sabrina: Ist das so? Sind Links wegen ihres Alters wervoll? Wer sagt das? Es gibt durchaus die Meinung, dass Links mit der Zeit an Wert verlieren knnen und man daher ständig auch neue Links braucht. Das würde zu dem Klickverhalten passen, dass viele alte Beiträge im Zeitablauf immer weniger Leser finden und die Links entsprechen weniger Klicks erzeugen. Natürlich gibt es auch Inhalte, die über viele Jahre Gültigkeit haben oder laufend aktualisiert werden, so dass sie gleichbleibend viele Leser finden. Die Links auf solchen Seiten würden dann nicht im Zeitablauf an Stärke verlieren.

 
  6. August 2014, 10:05

Die Funktion gibt es auch im Firefox nennt sich prefetching. Könnte auch sein das IE die Funktion auch unterstützt.

 
  6. August 2014, 10:10
 
Hanns Kronenberg
  6. August 2014, 10:11

@Dominik: Ich habe nicht gemessen, welche Daten der Chrome Browser an Google sendet. Ich kann mir aber nur schwer vorstellen, dass Google seinen Algorithmus zur Bestimmung der Klickwahrscheinlichkeiten nicht optimiert, indem die Prognosen mit Ist-Daten abgeglichen werden.

 
Julian
  6. August 2014, 10:34

Ich würde Analytics hier nicht einfach so aus den Gedanken streichen. Auch wenn es nur auf ca. 10% aller Websites eingesetzt wird, hilft es doch ungemein Informationen zu sammeln. Diese können dann mit weiteren Datenquellen gemischt werden und ergeben am Ende eine gute Datengrundlage für Hochrechnungen.

ich habe vor kurzem begonnen eine kleine Liste zusammen zu stellen mit Diensten, über die Google Daten sammeln kann. Bisher eigentlich noch nicht sehr groß die Liste.. aber dennoch ist einiges zusammen gekommen.
http://www.juliancordes.de/201408/datensammeln-als-google/
Optisch muss ich da unbedingt auch nochmal ran 😉

 
  6. August 2014, 10:47

@Sabrina: Ich kann zwar nicht beweisen, dass alte Links (entgegen der weitverbreiteten Ansicht) nicht wertvoller werden, aber meine Gedanken zu dem Thema habe ich in http://www.trustagents.de/blog/linkwachstum-und-linkalter-als-rankingfaktoren dargelegt

 

[…] Sistrix-Blog: Bewertet Google Links mit den Daten vom Chrome Browser? […]

 
  6. August 2014, 11:08

Sehr interessante Überlegung. Die Daten in diesem Zuge so zu nutzen wäre sicherlich in den meisten Bereichen sinnvoll. Der Marktanteil vom Chrome ist allerdings je nach Branche sehr unterschiedlich. Ich kenne z.B. viele Programmierer / Technik-Fans die den Chrome nicht mal mit der Zange anfassen würden. So gehts auch im B2B Bereich. Die großen, alten Unternehmen verwenden ja kaum den Chrome. Vielleicht liege ich hier nicht zu 100% richtig – aber es wäre trotz der hohen Marktanteile eine Teilerhebung für bestimmte Interessenbereiche.

 
Tom
  6. August 2014, 11:27

Wäre für Google keine Lösung – da leider auch manipulierbar. (Klickbots)
Ich denke wenn, dann geht sowas in die eventuell in die Panda Bewertung ein, aber nicht in den Algo.

 
  6. August 2014, 12:01

Interessante Entwicklung, sollte sie wirklich so eintreten. Eigentlich ein logischer Schritt, dass viel geklickte Links mehr wert sind, als „nicht geklickte“ Links. Ist eine konsequente Weiterführung des Rankingfaktors „Nutzerverhalten auf einer Website“.
Allerdings könnte dadurch dann auch wieder ein ganz neues Geschäftsfeld entstehen. Bin gespannt ob bald jemand die Dienstleistung „Klicks für ihre Links“ anbietet 😉

 
Christian
  6. August 2014, 13:47

Tom sagt es….die Manipulation durch Klickbots oder wir haben in der Zukunft Agenturen, die Klicks verkaufen. Das läuft auf eine CPC-Lösung für Links hinaus.

 
  6. August 2014, 14:29

„Ein guter Link bringt Traffic“ man kann es nicht oft genug sagen. Wenn es dann irgendwann offiziell wird, dass Google die Klickraten für sein Ranking misst, habe ich ein bisschen Angst, dass auf einmal viel mehr Seiten mit riesigen Call-to-action Buttons im Text auftauchen.
Ich persönlich halte den Chrome auch für die bessere Datenquelle, da damit ja auch noch eine bessere Zuordnung möglich ist. So kann man nicht nur die Frage beantworten: welcher Link wird geklickt, sondern auch noch: von wem?

 
  6. August 2014, 15:23

Klickbots sind aus meiner Sicht hier keine nennenswerte Hürde für die Umsetzung. So einfach ist es nicht, einen Menschen zu simulieren. Für die effektive Klickbot-Abwehr bräuchte man allerdings auch immer den Google-Account dazu. Dann dürfte es aber ein leichtes sein Klickspam auszufiltern.

Das Hauptproblem in der Nutzung von Linkdaten, sehe ich darin, das externe Links doch relativ wenig geklickt werden. Zumindest abseits von Facebook und anderem Social Media-Seiten. Grade bei qualitativ hochwertigen Links von Uni-Seiten oder staatlichen Organisationen sind die von dort kommenden Besucher doch sehr überschaubar.

 
  6. August 2014, 16:09

Ich habe vor ein paar Tagen genau dazu gebloggt: http://theafh.net/how-is-google-spying-on-us/
Ich denke, das Google einfach alle Hits, die es mit seinen Services so „auffängt“, kombinieren kann… Da ist nicht die Frage ob sie Chrome ODER Analytics einsetzen, sie können bei ihrer extremen Verbreitung einfach ALLE während einer Session überlappenden Signale kombinieren um Trafic Ströme für sich nutzbar zu machen und ein verdammt vollständiges Bild vom Surfverhalten eines jeden normalen Users erzeugen! Zur Generierung durchschnittlicher Klickstatistiken dürfte dies – zumindes bei populären Themen / Webseiten – allemal oft reichen.

 
  6. August 2014, 18:34

@Jojo
Stupide Klickbots sind natürlich schnell herauszufinden. Es ist aber auch nicht sonderlich kompliziert, intelligente Bots einzusetzen, die mit jeweils unterschiedlichen Google-Accounts viel Aktivität verursachen. Google+ Postings, Shares, Likes, Following, automatisierte Suchen, Klicks, …

Zudem wären die Chrome-Daten zwar ein Hinweis, wenn es um große Seiten geht. In Nischen-Bereichen, wo ein hoher Prozentsatz mit einem anderen Browser surft (Firefox-Webseiten, Windows-Seiten, …), wäre die Auswertung nichts aussagekräftig.

Google kann theoretisch viel auswerten, praktisch machen Sie es aber (noch) nicht. Ich schätze, da gehen noch ein paar Jahre ins Land.

 

[…] ist ein sehr interessanter Beitrag auf dem Sisitrix-Blog erschienen. Grundlage ist ein Patent Googles, mit dem der Algorithmus erkennen kann, wie häufig […]

 
Arthur
  7. August 2014, 10:16

Google Crome sollte nicht benutzt werden, weil es einfach zu viele Nutzerdaten übemittelt. Hier besteht bei mir der Verdacht, dass die NSA Googles bester Geschäftspartner ist.
Ruft man eine Seite auf, kann man im Kasperky Netzmonitor sehen dass massig Verbindungen zu Google aufgebaut werden. Selbst im Stillstand bleiben 5 Verbindungen offen (2 über Port 80 und 3 über 443) die erst nach einer Weile auf 2 reduziert sind.
Alle die heute noch sagen, ich habe doch nichts zu verbergen, können sich noch nicht vorstellen, welchen Strick man ihnen daraus dreht.

 
  7. August 2014, 10:43

Interessanter Überlegungsansatz mit viel Raum für Spekulationen und „Legenden“ 😉

Ich denke auch, dass man Analytics hier nicht einfach bei Seite schieben sollte. Wozu sonst dient Google dieses Tool, wenn nicht für umfangreiche interne Auswertungen und entsprechende Konsequenzen für die Google-Suche. Die machen das doch nicht, damit wir uns einen Lustigen freuen, wieviel Besucher auf unserer Webseite sind…
Es gab doch mal bei installierter Google-Toolbar im Browser mal eine Funktion, mit der man mit Smiles eine Website bewerten konnte. Das ist natürlich auch wieder extrem manipulierbar.
Sollten von Google tatsächlich die Klicks im Chrome für’s Ranking ausgewertet werden, wäre dies ähnlich einer manuellen Bewertung (nur ohne Wissen des Dummy-Users), aber ebenfalls mit manipulativen Möglichkeiten für die SuMa-/Marketing-Nerds.
Ich denke auch, dass Google hier mit all seinen Diensten und Möglichkeiten übergreifend arbeitet.
Sorry Hanns, aber Deinem Argument, dass Google Analytics nicht zu diesem Zweck verwendet und sich (hübsch gesagt:) schämen müsste, wenn das öffentlich wird, kann ich mich nicht anschließen.
Mittlerweile wissen wir doch alle, dass bei der Datensammelwut die Grenzen immer weiter gesteckt werden.

Ein interessanter aktueller Roman dazu: „Zero“.

Sonnige Grüße von der Ostsee
m.e.

 
  8. August 2014, 19:36

Hallo, danke für den Artikel.

Ich könnte mir gut vorstellen das Google diese Daten in die Bewertung aufnimmt, allerdings sind Klicks auch manipulierbar. Mit einem Klickbot der diese Links anklickt und danach die IP wechselt und Cookies löscht, hmm.

Auf jeden fall interessantes Thema!

 
Benjamin
  8. August 2014, 21:28

Konzept hat Charme, aber nicht neu und auch so nicht umgesetzt.
In der Open Source Version Chromium findet sich .
https://code.google.com/p/chromium/issues/detail?id=13505
http://www.chromium.org/system/app/pages/search?scope=search-site&q=prefetch

Ursprünglich hat Mozilla im FF z.B. bei einer Websuche die nächsten Ergebnisse vorab geladen.
Soweit ich das sehe, wurde das Feature ein wenig weiterausgebaut mit DNS Prefetching und etwas die Prefetch Funktion verbessert und auf die Threads verteilt.

Man kann das die Prefetch Funktion mit
rel=“dns-prefetch“ und rel=“prerender“ auch beeinflussen und den Browser vorab zwingen die Seiten zu laden.

Wie oben erwähnt, müssen die Daten ja auch gesendet werden und nehmen wir mal an das nur ein kleiner Teil es erlaubt anonymsierte Daten an Google zu senden. Im Longtail mit wenig Daten ist das Konzept dann quasi wirkungslos.

Ich muss allerdings sagen, das ich ganz andere Ideen hätte, wenn ich Zugriff auf solch eine Masse an Browsern hätte.
Wie oben erwähnt von Dominik, kann man auch anders User Search Profile ermitteln…

 
nk
  9. August 2014, 18:03

Alte Links mögen nicht „wertvoller werden“, in jedem Fall trüge ein solches Verhalten aber zum Veralten von Indexdaten bei und somit zum neuen Run, möglichst neue Klickstrecken zu produzieren. Mit Betonung auf „neu“, nicht „wertvoll“, „inhaltlich neu“ oder kreativ.

 

Kommentare geschlossen

Die Kommentarfunktion wird 30 Tage nach der Veröffentlichung des Beitrags deaktiviert.