Ask.com mit Google-Daten?

Johannes Beus
Johannes Beus
Johannes Beus ist Gründer und Geschäftsführer von SISTRIX.

Martin hat in einem Posting ein Thema aufgeworfen, zu dem ich zwar auch schon eine Menge Gerüchte und Vermutungen gehört habe, dem aber nie wirklich nachgegangen bin: Ask.com habe keinen eigenen Index mehr, sondern nutze von Google gecrawlte Daten und gewichte diese mit dem eigenen Algorithmus. Für Ask hätte das den Vorteil, dass der sehr kosten- und zeitintensive Arbeitsschritt der Auswahl geeigneter Seiten und das Crawlen dieser entfällt; Google hält dadurch einen ungefährlichen Konkurrenten am Leben und kann bei den Untersuchungen, die in den kommenden Jahren vermutlich anstehen werden auf den funktionieren Wettbewerb im Suchmarkt verweisen. Auch, dass Ask.com seit langem Arbitrage in einem Maßstab betreiben darf, den Google keinem anderen Werbetreibenden gestattet, spricht nicht gerade gegen die Theorie.

Durchsucht man den Index von Ask nach bestimmten Schlüsselworten (Stefan hat das in einem Kommentar zu Martins Posting angemerkt), so wird schnell deutlich, dass der Index in der Tat aus Google-Daten besteht. Hinweise darauf, dass auch der eigene Crawler Informationen beisteuert, gibt es nicht.

Interessant an der Sache ist nun der Hinweis, dass Google lediglich Seiten aus dem primären Index (wer schon etwas länger dabei ist, wird sich erinnern) an Ask weitergibt. Da die Möglichkeiten, die Anzahl dieser Seiten direkt bei Google abzufragen begrenzt und sehr unstabil sind, könnte sich für die nächste Zeit hier eine sinnvolle Anwendung ergeben. Um dies zu überprüfen, habe ich für 1.000 Domains sowohl bei Google als auch bei Ask.com die Zahl der indexierten Seiten ermittelt und verglichen:

Zwar gibt es eine Reihe von Domains, bei denen das Verhältnis zwischen Seiten aus Google und Ask.com-(Primary)-Index mit meinen Erwartungen übereinstimmt (ciao.de: 38%, kelkoo.de: 17%, mister-wong.de: 5%, shortnews.de: 2%), allerdings auch zahlreiche Domains, die so nicht stimmen können (wikipedia.org: 0,8%, yahoo.com: 0,03%). Hier kann ich mir vorstellen, dass die Zahlen von Google deutlich zu hoch „geraten“ sind, der Vergleich also keinen Sinn macht. Ich werde die Werte von Ask.com über die nächste Zeit regelmäßig beobachten, vielleicht ergibt sich so ein Wert aus den Zahlen.

Ähnliche Beiträge
Kommentare
Avatar Mobile SEO   
4. September 2009, 01:00

Hui, das finde ich mal interessant. Ich hab‘ mich zwar immer gewundert, wieso ich so viele ask.com AdWords sehe zu Muellsuchbegriffen und wieso die Ergebnisse so aehnlich sind… aber darauf waer ich offen gesagt nicht gekommen 🙂 <3

Avatar Roman   
4. September 2009, 09:46

hallo, Ask war mir noch nie sympathisch, aus deren Sicht jedoch, why not? lieber ein Arm am Kraken als arm dran ;o)

Avatar sbrinkmann   
4. September 2009, 10:58

Diese Adwords-Anzeigen von Ask.com haben mich auch schon oft gewundert. Bezahlt Ask auf diese Weise für die Index-Daten oder ist es ein verzweifelter Versuch, auf diese Weise Traffic auf die Suche zu locken?

Avatar Johannes   
4. September 2009, 11:16

Hmm, Zweitverwertung von Google Suchergebnissen + Adwords Anzeigen. Wo war jetzt gleich nochmal das Alleinstellungsmerkmal von ASK?

Dann doch lieber das Original…

Avatar Fabian   
5. September 2009, 10:30

Hi

nur zum Verständnis: Die Funktion phpinfo() gibt ja auch immer die Kennung des anfragenden Clients aus. Du suchst jetzt bei Ask nach „indexierten“ phpinfo() Skripten plus den jeweiligen Useragent des Bots, um festzustellen, welcher Bot für die Datensammlung zuständig war?

nice!

Könnte mir vorstellen, dass das dem ein oder anderen nicht ganz klar ist.

Avatar Christopher Kunz   
7. September 2009, 14:39

Die unter „Schlüsselworten“ verlinkte ASK-Ergebnisseite zeigt ein gecachtes phpinfo() für eine Domain 1000biokuechen.de – dort ist m.E. ziemlich deutlich der UA von Ask Jeeves zu sehen.

Mozilla/5.0 (compatible; Ask Jeeves/Teoma; +http://about.ask.com/en/docs/about/webmasters.shtml)

Die dort gespeicherte IP-Adresse gehört ebenfalls zu ASK.
Habe ich Fabian falsch oder nicht verstanden?

Avatar Ulf   
7. September 2009, 20:23

@Christoper – Vielleicht ist das etwas unglücklich verlinkt. Suche mal nach phpinfo.php in Anführungszeichen (http://de.ask.com/web?q=googlebot+%22phpinfo%28%29%22&qsrc=1&o=312&l=dir&s=&part=&dm=lang) – dort sind jeweils die Seiten mit Googlebot indiziert, leider keine gecachte Versionen zu sehen.

Avatar Whoopster   
8. September 2009, 12:40

Was heißt denn „sondern nutze von Google gecrawlte Daten“?

Kann man Crawlingdaten einfach hernehmen, und selber eine Suchmaschine bauen, oder müssen/können solche Daten wirklich von Google -für Geld- gekauft werden?

Sascha

Avatar Durrrr   
8. September 2009, 20:21

„Diese Browsererweitung fügt sich so tief in das System ein, dass eine normale Deinstallation nicht mehr möglich ist. Computerbenutzer mit wenig Erfahrungen sehen sich deshalb gezwungen, ihr Betriebssystem neu zu installieren.“

Deshalb meide ich Ask!

Avatar Johannes   
9. September 2009, 07:39

Lustig, die SERPs zu der „googlebot phpinfo()“-Abfrage sehen wirklich komplett anders aus als zu der Zeit, zu der ich das Posting geschrieben habe. Damals war anhand der Snippets klar zu erkennen, dass ein Client mit der Kennung „Googlebot“ und einer IP-Adresse (bzw. dem Reverse-DNS) von Google die Seiten gecrawled hat – hätt‘ ich mal nen Screenshot gemacht …

Avatar Kap's! Log   
13. September 2009, 12:08

Ich habe gerade noch ein bisschen mit Ask.com gespielt und festgestellt, dass bei jeder (exotischeren) Suchanfrage die SERP in den Sekunden nach der ersten Anfrage komplett umgestellt wird (Reihenfolge und Snippets).
Mit ein wenig Kreativität lassen sich aber immer noch Suchanfragen produzieren, die zeigen, dass ein Googlebot beteiligt war.
Längerfristig zu funktionieren scheint gerade http://de.ask.com/web?q=site:dnsstuff.ch&qsrc=1&o=312&l=dir&s=&part=&dm=lang

Avatar Zaylin   
18. Juli 2011, 11:19

I found just what I was needed, and it was entertiainng!

Die Kommentarfunktion wird 30 Tage nach der Veröffentlichung des Beitrags deaktiviert.