AOL-Daten – Eine kurze Auswertung

Johannes Beus
Johannes Beus
10. August 2006
Johannes Beus
Johannes Beus
Johannes Beus ist Gründer und Geschäftsführer von SISTRIX.

Wie durch alle Medien gegangen, hat AOL reSearch freundlicherweise einige Datensätze aus der internen AOL-Suchmaschine veröffentlicht. Da die Daten laut Nutzungsbedingungen ausschließlich für wissenschaftliche Zwecke genutzt werden dürfen, haben wir diese selbstverständlich nicht verwendet sondern nur generelle Auswertungen durchgeführt.

AOL hat sich mittlerweile für die Veröffentlichung der Suchanfragen öffentlich entschuldigt. Während bei AOL noch interne Untersuchungen laufen, wurde laut einem Bericht der New York Times die erste AOL-Nutzerin anhand ihrer Suchanfragen identifiziert. Die Daten sind nicht mehr länger über das Wiki von AOL reSearch downloadbar, Mirrors bieten sie allerdings weiterhin an.

Insgesamt wurde im Zeitraum vom 1. bis zum 31. Mai 2006 36.389.577 Suchanfragen us-amerikanischer Herkunft protokolliert. Dazu wurde eine anonymisierte Nutzer-ID, das Query, der Zeitpunkt der Suche, die geklickte URL sowie die Position der geklickten URL gespeichert. Die 657,426 unterschiedlichen Nutzer haben 21.011.340 unterschiedliche Suchanfragen gestellt und dabei auf 19.343.540 URLs geklickt. Entpackt haben die Daten eine Größe von 2175,76 Megabyte.

Klickrate nach Rankingpositionen

imagenotfound

 

Interessant zu sehen ist, dass die Klickrate für den letzten Treffer der ersten Seite (#10) noch etwas ansteigt und danach, ab der zweiten Seite, stark abfällt. Auch die großen Unterschiede zwischen Position 1 und 3 sind beachtlich.

Meistgeklickte URLs

imagenotfound

 

Auf Nachfrage hier noch die Auswertung der Wortanzahl je Suchanfrage. Bei AOL-Nutzern scheint der Trend zum 2.- oder 3.-Wort noch nicht angekommen zu sein.

Google führt mit großem Abstand vor MySpace. Erst danach folgen Yahoo, Wikipedia und Amazon. Dass die Bank of America auf Platz 10 steht, ist damit zu erklären, dass AOL-Nutzer häufig nach URLs suchen um dann den ersten Treffer anklicken. Die freie Übersetzung „Army Of Lamers“ scheint immer noch zuzutreffen …

Suchzeitpunkt

imagenotfound

 

Von Vormittags bis 21 Uhr ansteigend, danach während der Nacht wieder abfallend. Dürfte den meisten aus den Zugriffsstatistiken bekannt sein.

Meistgesuchte Keywords

imagenotfound

 

Unter den Top15 sind die Großen (Google, Yahoo, MySpace, Mapquest) vertreten. Auffällig ist, wie häufig nach Domainnamen gesucht wird – nach MySpace.com wird sogar noch häufiger als nach MySpace gesucht.

Worte pro Suche

imagenotfound

 

Auf Anfrage noch die Auswertung der Wörter je Suchanfrage. Der Trend zum 2.- oder 3.-Wort, wie vor ein paar Wochen berichtet, scheint beim gemeinen AOL-Nutzer noch nicht angekommen zu sein.

Ähnliche Beiträge
Kommentare
Sascha   
10. August 2006, 17:36

Hallo,

nette Statistik. Interessant wäre noch die Anzahl der Wörter pro Suchanfrage. (2-Wort Suche, 3-Wort, ect…).

Und noch rein interessehalber: Was für ein Rechner hat die Berechnung vorgenommen? Wie lange hat jede einzelne Statistik ungefähr gedauert?

Mfg
Sascha

Johannes   
10. August 2006, 18:46

Rechner war nen Dual Xeon 3,2 Ghz mit 4GB Ram und RAID10. Hat, nachdem die Indexe gesetzt waren pro Statistik unter 10 Minuten gedauert, das Setzen der Indexe hat aber die Nacht verschlungen. Mit den 2,3,4 Wort Querys guck ich mal.

Russianger   
11. August 2006, 00:00

Oh man ich hab in 30 Minuten einen sog. anonymen AOL Nutzer aus seinen Suchanfragen identifizieren können.
Ich schätze, dass ich nun mehr als sein Psychiater bzw. Beichtvater über ihn weis 🙁

Andreas   
11. August 2006, 12:31

Kleine Missinterpretation – die #10 der Suchergebnisse ist der letzte Eintrag auf Seite 1, nicht der erste auf Seite 2. Den leichten Anstieg gegenüber #9 würde ich damit erklären, dass er wegen seiner „Randposition“ stärker wahrgenommen wird.

Ansonsten danke für die Auswertung – sehr interessant!

bzgl. der Randposition   
11. August 2006, 13:21

bzgl. der Randposition: ich schätze eher dass der user nichts gefunden hat, und bevor er blättert oder aussteigt nimmt er lieber angebot 10 wahr.

Johannes   
11. August 2006, 19:10

Danke für den Hinweis, Andreas. Keine Ahnung, wie mir der Fehler passieren konnte 🙂

Christoph Paterok   
13. August 2006, 11:28

Hallo Vielen Dank für die Auswertung. Wirklich sehr interessant…

Sascha Riess   
14. August 2006, 19:10

Ich habe 36.389.577 Zeilen und davon 19.434.540 Klicks in meiner MySQL, d.h. fast die Hälfte aller User klickt nichts!
Auch die Abfragen dauern auf meiner betagten Suse-9.3-Kiste mit einem Sempron 2600+ nach der Indexierung nur Sekunden !?
Die Mißinterpretation von #10 kommt davon, auf webmasterworld zu lesen und ungeprüft zu übernehmen 😉

Pascal   
29. August 2006, 00:20

Hallo Johannes,

ich bin noch nicht dazugekommen, mich in die Daten einzuwühlen, aber ein paar Fragen bleiben:

1. Die Positionen sind organic oder mixed?
2. Die Prozent der Klickraten sind alle Klicks = 100% oder alle Suchen = 100% (denn die Mehrfachklicks wären ja auch interessant)
3. Wie hoch sind die Schwankungen der Klickraten bei den jeweiligen Positionen? z.B. Position 1: 23 % bis 100%, Durchschnitt: 42,92%

Wenn dir mal langweilig ist…

Viele Grüße,
pascal

Britta   
11. November 2006, 16:05

Hallo,
sehr freundlich diese Analyse zu veröffentlichen.
Die Ergebnisse helfen mir im Rahmen meiner Diplomarbeit ein gutes Stück weiter.

Eine Frage bleibt dennoch unbeantwortet. Ist aus den Datenfiles auch die Anzahl ALLER Klicks auf die angegebnen 36.389.577 Suchanfragen war? Die 19.343.540 ist die Anzahl der unterschiedlich aufgerufenen URLs oder?
vielen Dank und Grüsse aus Köln

Martin   
2. Februar 2007, 16:37

Oh, diese Statistik finde ich richtig klasse! Sie zeigt einmal mehr, was für ein Monopol letztendlich hinter Google steckt, und wa für ein Machtpotenzial google hat, um zum Beispiel das Netz in eine bestimmte Richtung zu lenken.

klima   
24. Juni 2007, 14:35

hat mich ein wenig erschrocken^^
mfg

FL4PJ4CK   
25. Juni 2007, 21:23

Hm, gute Statistik. Echt intzeressant!

Christian   
30. Juni 2007, 04:06

Schön ausbereitet, hatte es mir auch geladen aber war mir etwas zu viel Aufwand es damals aufzubereiten ;).

Horatiu Vasile   
26. Januar 2008, 10:00

Das ist eine wirklich gute Auswertung! Fazit: Nur jeder 20. Besucher schaut sich die 2. Suchergebnisseite an…

eShop24.info   
2. Februar 2008, 14:11

Tolle Statistik, d.h. ich muss die 3 ersten Positionen anstreben.

1a-geld-verdienen.de   
2. Februar 2008, 14:13

Sehr schön da habe ich ja gleich wieder was gelernt, danke.

Die Kommentarfunktion wird 30 Tage nach der Veröffentlichung des Beitrags deaktiviert.