Betrachtet die Daten ungeschminkt!

Der Internetdienst Alexa erfaßt Nutzungsstatistiken für einzelne Webseiten. Mit Hilfe der Alexa Toolbar werden Seitenaufrufe, Reichweite und Rang der Webseite geschätzt. Es gibt Diskussionen darüber, ob die Schätzungen zutreffend sind, was nicht verwunderlich sein sollte, da die Ergebnisse durch die Methode mitbestimmt und entsprechend optimiert werden können. Aber man bekommt immerhin jeden Tag neue Meßwerte.

Bei Alexa besteht für die populäreren Webseiten die Möglichkeit, den Verlauf der Nutzungsstatistiken in einem Schaubild zu betrachten. So kann man z.B. nachsehen, wie sich die Nutzung der Webseite von Apple über die Jahre entwickelt hat. Wenn man das Schaubild betrachtet, so kann man rechts unterhalb davon eine Art Regler sehen. Wenn man mit der Maus über den Regler fährt, so erscheint der Tooltip „Graph Smoothing“. Der Regler steht standardmäßig auf der höchsten von vier Stufen. Die Kurve, die man zunächst zu sehen bekommt, ist also stark geglättet.

Wenn man eine Kurve glättet, so hofft man, Trends besser erkennen zu können. Das ist zwar eine schöne Sache, trotzdem sollte man den Versuch unternehmen, den Regler nach links zu schieben und die Originaldaten zu betrachten. Auf diese Weise kann man erkennen, wie stark die täglichen Daten schwanken. Diese Schwankungen treten auch auf, ohne daß ein besonderes Ereignis oder eine Änderung im Durchschnittwert aufgetreten ist. In der Statistik spricht man von zwei Arten von Fehlern:

  • Wenn man den Schluß zieht, daß ein besonderes Ereignis eingetreten ist, obwohl das nicht der Fall ist.
  • Wenn man den Schluß zieht, daß nichts besonderes aufgetreten ist, obwohl das der Fall ist.

Da man gewöhnlich nicht beide Fehler vermeiden kann, muß man festlegen, ab wann man von ungewöhnlichen Werten sprechen kann. Um eine solche Festlegung durchführen zu können, muß man wissen, wie stark die Werte im Normalfall schwanken. Übertragen auf das Schaubild bedeutet das, daß man die ungeglättete Kurve benötigt, um zu sehen, wo Tage mit ungewöhnlicher Webseitennutzung sind oder sich die Werte tatsächlich verändert haben.

Wenn man also statistische Methoden, die für einzelne Werte in zeitlicher Reihenfolge bestimmt sind, auf geglättete Werte anwendet, so kommt man zu falschen Schlüssen.

Advertisements

Schlagwörter: , , ,

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s


%d Bloggern gefällt das: