AOL-Daten - Eine kurze Auswertung

Johannes Beus
Wie durch alle Medien gegangen, hat AOL reSearch freundlicherweise einige Datensätze aus der internen AOL-Suchmaschine veröffentlicht. Da die Daten laut Nutzungsbedingungen ausschließlich für wissenschaftliche Zwecke genutzt werden dürfen, haben wir diese selbstverständlich nicht verwendet sondern nur generelle Auswertungen durchgeführt.

AOL hat sich mittlerweile für die Veröffentlichung der Suchanfragen öffentlich entschuldigt. Während bei AOL noch interne Untersuchungen laufen, wurde laut einem Bericht der New York Times die erste AOL-Nutzerin anhand ihrer Suchanfragen identifiziert. Die Daten sind nicht mehr länger über das Wiki von AOL reSearch downloadbar, Mirrors bieten sie allerdings weiterhin an.

Insgesamt wurde im Zeitraum vom 1. bis zum 31. Mai 2006 36.389.577 Suchanfragen us-amerikanischer Herkunft protokolliert. Dazu wurde eine anonymisierte Nutzer-ID, das Query, der Zeitpunkt der Suche, die geklickte URL sowie die Position der geklickten URL gespeichert. Die 657,426 unterschiedlichen Nutzer haben 21.011.340 unterschiedliche Suchanfragen gestellt und dabei auf 19.343.540 URLs geklickt. Entpackt haben die Daten eine Größe von 2175,76 Megabyte.

Klickrate nach Rankingpositionen



Interessant zu sehen ist, dass die Klickrate für den letzten Treffer der ersten Seite (#10) noch etwas ansteigt und danach, ab der zweiten Seite, stark abfällt. Auch die großen Unterschiede zwischen Position 1 und 3 sind beachtlich.

Meistgeklickte URLs



Auf Nachfrage hier noch die Auswertung der Wortanzahl je Suchanfrage. Bei AOL-Nutzern scheint der Trend zum 2.- oder 3.-Wort noch nicht angekommen zu sein.

Google führt mit großem Abstand vor MySpace. Erst danach folgen Yahoo, Wikipedia und Amazon. Dass die Bank of America auf Platz 10 steht, ist damit zu erklären, dass AOL-Nutzer häufig nach URLs suchen um dann den ersten Treffer anklicken. Die freie Übersetzung "Army Of Lamers" scheint immer noch zuzutreffen …

Suchzeitpunkt



Von Vormittags bis 21 Uhr ansteigend, danach während der Nacht wieder abfallend. Dürfte den meisten aus den Zugriffsstatistiken bekannt sein.

Meistgesuchte Keywords



Unter den Top15 sind die Großen (Google, Yahoo, MySpace, Mapquest) vertreten. Auffällig ist, wie häufig nach Domainnamen gesucht wird - nach MySpace.com wird sogar noch häufiger als nach MySpace gesucht.

Worte pro Suche



Auf Anfrage noch die Auswertung der Wörter je Suchanfrage. Der Trend zum 2.- oder 3.-Wort, wie vor ein paar Wochen berichtet, scheint beim gemeinen AOL-Nutzer noch nicht angekommen zu sein.
Eintrag geschrieben am 10.08.2006 um 14:18 Uhr - Trackback setzen - Tags: Daten
Sascha
1
schrieb am 10.08.2006 um 17:36 Uhr
Hallo,

nette Statistik. Interessant wäre noch die Anzahl der Wörter pro Suchanfrage. (2-Wort Suche, 3-Wort, ect...).

Und noch rein interessehalber: Was für ein Rechner hat die Berechnung vorgenommen? Wie lange hat jede einzelne Statistik ungefähr gedauert?

Mfg
Sascha

sistrix
2
schrieb am 10.08.2006 um 18:46 Uhr
Rechner war nen Dual Xeon 3,2 Ghz mit 4GB Ram und RAID10. Hat, nachdem die Indexe gesetzt waren pro Statistik unter 10 Minuten gedauert, das Setzen der Indexe hat aber die Nacht verschlungen. Mit den 2,3,4 Wort Querys guck ich mal.

Russianger
3
Russianger
schrieb am 11.08.2006 um 00:00 Uhr
Oh man ich hab in 30 Minuten einen sog. anonymen AOL Nutzer aus seinen Suchanfragen identifizieren können.
Ich schätze, dass ich nun mehr als sein Psychiater bzw. Beichtvater über ihn weis :(

Andreas
4
Andreas
schrieb am 11.08.2006 um 12:31 Uhr
Kleine Missinterpretation - die #10 der Suchergebnisse ist der letzte Eintrag auf Seite 1, nicht der erste auf Seite 2. Den leichten Anstieg gegenüber #9 würde ich damit erklären, dass er wegen seiner "Randposition" stärker wahrgenommen wird.

Ansonsten danke für die Auswertung - sehr interessant!

bzgl. der Randposition
5
bzgl. der Randposition
schrieb am 11.08.2006 um 13:21 Uhr
bzgl. der Randposition: ich schätze eher dass der user nichts gefunden hat, und bevor er blättert oder aussteigt nimmt er lieber angebot 10 wahr.

sistrix
6
schrieb am 11.08.2006 um 19:10 Uhr
Danke für den Hinweis, Andreas. Keine Ahnung, wie mir der Fehler passieren konnte :)

Christoph Paterok
7
Christoph Paterok
schrieb am 13.08.2006 um 11:28 Uhr
Hallo Vielen Dank für die Auswertung. Wirklich sehr interessant...

Sascha Riess
8
Sascha Riess
schrieb am 14.08.2006 um 19:10 Uhr
Ich habe 36.389.577 Zeilen und davon 19.434.540 Klicks in meiner MySQL, d.h. fast die Hälfte aller User klickt nichts!
Auch die Abfragen dauern auf meiner betagten Suse-9.3-Kiste mit einem Sempron 2600+ nach der Indexierung nur Sekunden !?
Die Mißinterpretation von #10 kommt davon, auf webmasterworld zu lesen und ungeprüft zu übernehmen ;-)

Pascal
9
Pascal
schrieb am 29.08.2006 um 00:20 Uhr
Hallo Johannes,

ich bin noch nicht dazugekommen, mich in die Daten einzuwühlen, aber ein paar Fragen bleiben:

1. Die Positionen sind organic oder mixed?
2. Die Prozent der Klickraten sind alle Klicks = 100% oder alle Suchen = 100% (denn die Mehrfachklicks wären ja auch interessant)
3. Wie hoch sind die Schwankungen der Klickraten bei den jeweiligen Positionen? z.B. Position 1: 23 % bis 100%, Durchschnitt: 42,92%

Wenn dir mal langweilig ist...

Viele Grüße,
pascal

Britta
10
Britta
schrieb am 11.11.2006 um 16:05 Uhr
Hallo,
sehr freundlich diese Analyse zu veröffentlichen.
Die Ergebnisse helfen mir im Rahmen meiner Diplomarbeit ein gutes Stück weiter.

Eine Frage bleibt dennoch unbeantwortet. Ist aus den Datenfiles auch die Anzahl ALLER Klicks auf die angegebnen 36.389.577 Suchanfragen war? Die 19.343.540 ist die Anzahl der unterschiedlich aufgerufenen URLs oder?
vielen Dank und Grüsse aus Köln

Martin
11
schrieb am 02.02.2007 um 16:37 Uhr
Oh, diese Statistik finde ich richtig klasse! Sie zeigt einmal mehr, was für ein Monopol letztendlich hinter Google steckt, und wa für ein Machtpotenzial google hat, um zum Beispiel das Netz in eine bestimmte Richtung zu lenken.

klima
12
schrieb am 24.06.2007 um 14:35 Uhr
hat mich ein wenig erschrocken^^
mfg

FL4PJ4CK
13
schrieb am 25.06.2007 um 21:23 Uhr
Hm, gute Statistik. Echt intzeressant!

Christian
14
schrieb am 30.06.2007 um 04:06 Uhr
Schön ausbereitet, hatte es mir auch geladen aber war mir etwas zu viel Aufwand es damals aufzubereiten ;).

Horatiu Vasile
15
schrieb am 26.01.2008 um 10:00 Uhr
Das ist eine wirklich gute Auswertung! Fazit: Nur jeder 20. Besucher schaut sich die 2. Suchergebnisseite an...

eShop24.info
16
schrieb am 02.02.2008 um 14:11 Uhr
Tolle Statistik, d.h. ich muss die 3 ersten Positionen anstreben.

1a-geld-verdienen.de
17
schrieb am 02.02.2008 um 14:13 Uhr
Sehr schön da habe ich ja gleich wieder was gelernt, danke.


Kommentieren?

mehr
Die Kommentare für diesen Beitrag wurden geschlossen. Angemeldete Benutzer haben weiterhin die Möglichkeit, auch ältere Beiträge zu kommentieren. Jetzt kostenlos anmelden