AOLs Keyword-Datenbank

Meine Güte. Da hat sich AOL aber einen Mega-Knaller geleistet. Auf der Seite Test-Collections hatte AOL-Research bis vor kurzem ein megafettes Datenfile zum Download angeboten, nach dem sich jeder Marketingler die Finger lecken, manch SEO seine Frau verkaufen und manch Spammer seine Schwiegermutter ermorden würde. Gelesen davon habe ich bei PlentyofFish-Macher Markus Frind und konnte es kaum glauben.

AOLResearch hat ein Datenfile ins Netz gelegt, in dem die Suchanfragen von 500.000 Usern, über einen Zeitraum von 3 Monaten zusammengefasst und leicht anonymisiert, angeboten wurden. Was für eine Fundgrube. Was für ein Leichtsinn. AOL gibt damit quasi Google-Daten an die Öffentlichkeit. So etwas habe ich mir zwar immer gewünscht, es aber nicht für möglich gehalten, dass es jemals passiert. Ein SEO-Traum. Und ein Alptraum für Google. Kein Wunder also, dass der Spuk nicht lange währte. Mittlerweile hat AOLResearch die Webseiten gecleant und den Downloadlink entfernt. Anbei noch ein Screenshot der belegt, dass es wirklich kein Traum war.

AOLResearch Testcollection

Das Korpus delikti: 500k User Queries, Sampled over 3 month

Welch ein Lapsus. Was man mit den Daten alles anfangen kann und wie wertvoll die Zusatzinformationen in den Logfiles waren zeigen einige Analysen von Markus Frind.

Update: Sehe gerade bei Thomas, dass die Meldung auch schon durch den Heise-Ticker gelaufen ist.

18 Gedanken zu „AOLs Keyword-Datenbank“

  1. Pingback: Reality on the Rocks
  2. Ja, das ist nen Knaller – aber leider haben die Amis 1. ganz andere Suchangewohnheiten wie wir Deutschen, 2. Sind die Keywords ja doch alle englisch – also wenn uns die Analyse etwas zu nutze ist, dann für die Optimierung von englischsprachigen internationalen Sites.

    Wer noch Interesse am File hat, hier ist eine Liste von Mirrors – denn pfiffige leute waren schnell ;) http://www.gregsadetsky.com/aol-data/

    Antworten
  3. Schade, daß dieser „Fehler“ nicht das deutsche AOL betraf – aus diesem hätte man, jedenfalls für uns, wichtigere Daten entziehen können.

    Dennoch wird dieser Datensatz eine interessante Bettlektüre werden. Ich habe schon 300 Titenpatronen bestellt um es dann auszudrucken. Nein Spass! :-)

    kind regards
    Jeanot Bruchmann

    Antworten

Schreibe einen Kommentar