Archive for Januar 2008

Betrachtet die Daten ungeschminkt!

Donnerstag, 31. Januar, 2008

Der Internetdienst Alexa erfaßt Nutzungsstatistiken für einzelne Webseiten. Mit Hilfe der Alexa Toolbar werden Seitenaufrufe, Reichweite und Rang der Webseite geschätzt. Es gibt Diskussionen darüber, ob die Schätzungen zutreffend sind, was nicht verwunderlich sein sollte, da die Ergebnisse durch die Methode mitbestimmt und entsprechend optimiert werden können. Aber man bekommt immerhin jeden Tag neue Meßwerte.

Bei Alexa besteht für die populäreren Webseiten die Möglichkeit, den Verlauf der Nutzungsstatistiken in einem Schaubild zu betrachten. So kann man z.B. nachsehen, wie sich die Nutzung der Webseite von Apple über die Jahre entwickelt hat. Wenn man das Schaubild betrachtet, so kann man rechts unterhalb davon eine Art Regler sehen. Wenn man mit der Maus über den Regler fährt, so erscheint der Tooltip „Graph Smoothing“. Der Regler steht standardmäßig auf der höchsten von vier Stufen. Die Kurve, die man zunächst zu sehen bekommt, ist also stark geglättet.

Wenn man eine Kurve glättet, so hofft man, Trends besser erkennen zu können. Das ist zwar eine schöne Sache, trotzdem sollte man den Versuch unternehmen, den Regler nach links zu schieben und die Originaldaten zu betrachten. Auf diese Weise kann man erkennen, wie stark die täglichen Daten schwanken. Diese Schwankungen treten auch auf, ohne daß ein besonderes Ereignis oder eine Änderung im Durchschnittwert aufgetreten ist. In der Statistik spricht man von zwei Arten von Fehlern:

  • Wenn man den Schluß zieht, daß ein besonderes Ereignis eingetreten ist, obwohl das nicht der Fall ist.
  • Wenn man den Schluß zieht, daß nichts besonderes aufgetreten ist, obwohl das der Fall ist.

Da man gewöhnlich nicht beide Fehler vermeiden kann, muß man festlegen, ab wann man von ungewöhnlichen Werten sprechen kann. Um eine solche Festlegung durchführen zu können, muß man wissen, wie stark die Werte im Normalfall schwanken. Übertragen auf das Schaubild bedeutet das, daß man die ungeglättete Kurve benötigt, um zu sehen, wo Tage mit ungewöhnlicher Webseitennutzung sind oder sich die Werte tatsächlich verändert haben.

Wenn man also statistische Methoden, die für einzelne Werte in zeitlicher Reihenfolge bestimmt sind, auf geglättete Werte anwendet, so kommt man zu falschen Schlüssen.

Statistiker-Schelte 1 – Wie reagiert man auf statistische Trugschlüsse?

Mittwoch, 30. Januar, 2008

Das Problem bei der Anwendung von Statistik ist, daß es zu Trugschlüssen kommen kann. Ein anschauliches Beispiel stammt von Franz Josef Strauß:

„Zwei Männer sitzen im Wirtshaus. Der eine verdrückt eine ganze Kalbshaxe, der andere trinkt zwei Maß Bier. Statistisch gesehen ist das für jeden ein Maß Bier und eine halbe Haxe – aber der eine hat sich überfressen, der andere ist besoffen.“

Anhand der Art, wie sie auf so ein Beispiel reagieren, kann man die Leute in zwei Gruppen einteilen:

  1. Die eine Gruppe sieht dieses Beispiel als einen Beleg dafür, daß Statistik zur Irreführung dient, überflüssig ist und nur von realitätsfremden Spinnern verfolgt wird.
  2. Die andere Gruppe zieht aus dem Beispiel den Schluß, daß der Durchschnitt offensichtlich nicht immer alles beschreiben kann und man sich einerseits dieses Umstandes bewußt sein sollte und andererseits versuchen sollte, die durch Statistik gewonnenen Schlüsse weiter zu vertiefen.

Der Leser kann sich selber ein Bild davon machen, welche Reaktion uns auf lange Sicht weiter bringen wird. Das Resultat der Wahl läßt sich übrigens auch auf andere Situationen übertragen, wo es bei Denkansätzen, Methoden und Produkten Unklarheiten oder Probleme gibt.

Wie erfolgreich ist die „Bild am Sonntag“?

Samstag, 26. Januar, 2008

Vor kurzem erschien bei Bild.de die Erfolgsmeldung, daß immer mehr Leser am Kiosk zu „Bild am Sonntag“ greifen. Anlaß für die Meldung war die jüngste „Media-Analyse“, wonach die Zeitung 11,25 Millionen Leser hat, was eine Steigerung von 640.000 Lesern gegenüber dem Vorjahr bedeutet. Grundlage war die halbjährliche Befragung von über 38.000 Bürgern nach ihren Lesegewohnheiten im Auftrag der Arbeitsgemeinschaft Media-Analyse. Der Zeitraum der Befragung erstreckte sich vom März bis September 2007.

Zu dieser Meldung gibt es einen Beitrag bei BILDblog.de, einer Webseite, die es sich zum Auftrag gemacht hat, die Berichterstattung der „Bild“-Zeitung und deren Ablegern durch wichtige Informationen zu ergänzen. Im Beitrag über die Erfolgsmeldung bringen sie die von der IVW ermittelte verkaufte Auflage der „Bild am Sonntag“ ein. Diese ist seit 1998 um 750.000 Exemplare zurückgegangen, was einem Rückgang von 30 Prozent entspricht. Das demonstiert deutlich, daß die in der Meldung von Bild.de verwendete Annahme, aus der Leserschaft auf die Verkäufe zu schließen zu können, offensichtlich falsch ist. Wenn sich eine Theorie als falsch erweist, muß sie bekanntlich geändert werden.

Daß am Kiosk immer mehr Leser zu „Bild am Sonntag“ greifen, stimmt also nicht. Ist zumindest die Meldung richtig, daß immer mehr Leser zu „Bild am Sonntag“ greifen?

Die Befragung hat wie gesagt ergeben, daß die Zahl der Leser der „Bild am Sonntag“ gegenüber dem Vorjahr um 640.000 zugenommen hat. Wenn man die Umfrageergebnisse der letzten 5 Jahre betrachtet, dann stellt sich heraus, daß erst seit ca. 1 Jahr immer mehr Leser der „BamS“ gibt, denn eine Steigerung gegenüber dem Vorjahr gab es nur in den letzten beiden Analysen. Wenn man die letzten 5 Jahre betrachtet, so kann man eher davon ausgehen, daß die Leserschaft gleich bleibt. Die 11,25 Millionen der letzten Analyse stellen zwar einen Höhepunkt dar, der Wert ist aber nicht ungewöhnlich. Einen Trend kann man ebenfalls nicht unbedingt feststellen. Die Steigerung im letzten Jahr weist nicht darauf hin, sondern läßt sich durch zufällige Schwankungen erklären.

Mit den vorliegenden Informationen kann man davon ausgehen, daß die Leserschaft der „Bild am Sonntag“ in den letzten Jahren gleich geblieben ist, die Zahl der Leute hingegen, die am Kiosk zu der Zeitung greifen, zurückgegangen ist. Es bleibt nur die Frage, warum aus der Meldung von Bild.de etwas anderes hervorgeht.

Kartografierte Kriminalität

Donnerstag, 24. Januar, 2008

Ein weiteres Beispiel für die Möglichkeiten des Internets ist die Misdaadkaart. Auf dieser Webseite werden die niederländischen Polizeiberichte ausgewertet und die Fälle auf einer Karte verzeichnet. Dabei werden die in den Berichten genannten Orte und Straßen zugrundegelegt. Der Besucher hat die Möglichkeit, nach Meldungen über bestimmte Delikte zu suchen und die Ergebnisse nach Ort bzw. Postleitzahl zu verfeinern. Da man davon ausgehen kann, daß die Berichtspraxis zumindest in einer Stadt konsistent ist, kann man sich auf diese Weise einen Überblick über die Sicherheit in einem bestimmten Gebiet verschaffen. Über ein auf der Karte verzeichnetes Delikt kann man auch die zugehörige Meldung aufrufen.

Der Erfolg der Webseite hat die Betreiber dazu ermutigt, das Prinzip auf weitere Projekte anzuwenden. Neben einer Karte für niederländische Lokalnachrichten wurde auch eine deutsche Variante der Misdaadkaart geschaffen. Auch in der Krimikarte werden Polizeiberichte ausgewertet und kann der Besucher nach Delikten in einer bestimmten Gegend suchen. Allerdings steckt diese Karte noch im Entwicklungsstadium. So fiel mir z.B. bei der Suche nach Polizeiberichten aus Aachen auf, daß in der Karte jeweils das Polizeipräsidium markiert wurde. Da das Konzept sehr unterstützenswert ist, schlage ich vor, an der Verbesserung der Krimikarte mitzuarbeiten. Ein Möglichkeit der Mitarbeit ist, die Meldungen durchzulesen und den Betreibern die richtigen Straßen mitzuteilen.

IENS – ein niederländischer Restaurantführer

Dienstag, 22. Januar, 2008

Wer essen gehen möchte und nicht weiß, wohin er gehen soll, der konsultiert einen Restaurantführer. Das Internet macht es möglich, daß die Suche auch online durchgeführt werden kann. So können im Guide Michelin oder im Gault Millau verzeichnete Restaurants aufgespürt werden. Allerdings sind dort nur eine begrenzte Anzahl von Restaurants verzeichnet.

In den Niederlanden gibt es mit IENS einen Restaurantführer, welcher durch die Meinungen und Beurteilungen der Restaurantbesucher zusammengestellt wird. Auf diese Weise kam ein Verzeichnis von 17.000 Restaurants zustande, über welche 70.000 Besucher ihre Meinung abgegeben haben. Besucher können an der Restaurantkritik teilnehmen, indem sie kurze Meinungen schreiben oder anhand eine Formulars eine Beurteilung abgeben, bei welchen Essen, Service und Dekor benotet werden. Auf der Webseite hat man die Möglichkeit, über den Ort und die Küche sowie eine Reihe weiterer Kriterien wie Zugänglichkeit oder Außengastronomie das passende Restaurant zu suchen. Durch die große Basis kann man sowohl Spitzenrestaurants als auch günstigere Formen wie Fast-Food-Restaurants, Eisdielen, Saftbars oder Pfannkuchenhäuser durchstöbern. Die Suchergebnisse können nach der Straße, dem Ort oder die Bewertung für das Essen sortiert werden.

Die bei IENS versammelten Kritiken liegen auch in Buchform vor. Zu jedem in den Büchern verzeichneten Restaurant gibt es Informationen und eine kurze Beschreibung, die sich aus den Berichten der Besucher ergibt.

Die große Breite an verzeichneten Restaurants führt manchmal zu überraschenden Ergebnissen. So erhielt das Beluga in Maastricht, welches zu den besten niederländischen Restaurants zählt, folgende Bewertungen:

  • Essen: 9.0
  • Service: 8.6
  • Dekor: 9.0

Die Eisdiele Lisone in Heerlen erhielt folgende Bewertungen:

  • Essen: 9.0
  • Service: 8.0
  • Dekor: 7.0

Das Essen des Spitzenrestaurants und der Eisdiele werden somit mit der gleichen Note bewertet. Das macht deutlich, daß man die Bewertungen im Zusammenhang mit der Küche und den Leistungen für die jeweiligen Kunden sehen muß. In einem ähnlichen Zusammenhang hat der amerikanische Filmkritiker Roger Ebert argumentiert, daß man, falls man einen Freund fragt, ob der Film Hellboy gut ist, nicht fragt, ober er verglichen mit Mystic River gut ist, sondern ob er verglichen mit The Punisher gut ist. Für unser Beispiel bedeutet das, daß man, falls man gepflegt in Südlimburg zu speisen wünscht, das Beluga in Erwägung ziehen kann. Möchte man Eis essen gehen und ist in der Nähe von Heerlen, kann man das Lisone aufsuchen. Wenn man davon absieht, daß über Restaurants wie das Beluga woanders eventuell mehr erfahren kann, hat der Besucher der IENS-Webseite die Möglichkeit, sich anhand der Kommentare der anderen Besucher ein Bild zu machen.

Cafés/Kneipen in den Niederlanden

Samstag, 19. Januar, 2008

In den Niederlanden stellen Cafés einen beliebten Treffpunkt dar (in diesem Fall werden auch Kneipen oder Bars zu den Cafés gezählt). Sie werden auch als „Wohnzimmer der Gesellschaft“ bezeichnet, welche sich durch Atmosphäre und Geselligkeit auszeichnen. Das typische Beispiel ist das „bruine café“. Das Braune bei diesem Café kommt durch jahrelanges Rauchen zustande (in der Gegenwart wird auch Farbe verwendet). Cafés sind in den südlichen Provinzen Nordbrabant und Limburg besonders verbreitet, aber auch im restlichen Land finden sich viele Orte, wo man einkehren kann.

Wer angesichts der großen Auswahl eine Referenz haben möchte, der kann die Café Top 100 konsultieren. Misset Horeca, eine Fachzeitschrift für das Hotel- und Gaststättengewerbe, begann 1994 mit einem Wettbewerb, um Kunden und Gewerbetreibende auf gute Cafés hinzuweisen. Dazu wurden jedes Jahr 10 Cafés aus einer Liste mit 40-50 Vorschlägen nominiert. Unter den Finalisten wurde das Café des Jahres ermittelt. Seit 2003 wird jährlich eine Liste der 100 besten Cafés veröffentlicht. Der Titel „Café van het Jaar“ geht an das erste Café auf der Liste. Über die Ergebnisse entscheidet jeweils eine Jury, welche die Cafés nach den folgenden Gesichtspunkten beurteilt:

  • Gastfreundschaft
  • Atmosphäre und Ausstrahlung
  • Hygiene
  • Umgang mit Produkten
  • Betreiber / Wirt

Die aktuelle Liste der 100 besten Cafés gibt es hier zu sehen. Um die Suche zu verfeinern, kann man auch eine bestimmte Provinz auswählen. Hinzu kommen erwähnenswerte Cafés, die es nicht ganz in die Top 100 geschaft haben. Ein Café, welches den Titel Café des Jahres errungen hat, wird für mindestens drei Jahre in die Ehrengallerie aufgenommen und in der Zeit aus der Rangliste genommen. Für jedes erwähnte Café kann man Informationen abrufen.

Diese Webseite dürfte für den beginnenden niederländischen Cafébesucher eine gute Ausgangsbasis darstellen, in der auch verschiedene Typen von Cafés enthalten sind. Die Urteile sind zwar subjektiv gefällt, aber man hat die Möglichkeit, diese bei einem Besuch zu überprüfen und eventuell neue Entdeckungen zu machen. Abschließend sollte man noch bedenken, daß es in den Niederlanden über 10.000 Cafés gibt.

Niederlande aus der Luft

Donnerstag, 17. Januar, 2008

Um einen sprichwörtlichen Überblick über die Niederlande zu bekommen, sind Bücher mit den Aufnahmen von Karel Tomeï zu empfehlen. Aktuelle Beispiele sind „Over Holland“ und „De Bovenkant van Nederland“ 1-3. Die Stärke der Aufnahmen liegt im Bildaufbau, woraus sich schöne und oftmals verblüffende Perspektiven ergeben. Beispiele dafür sind auf der Webseite des Fotografen zu bewundern, wo auch Bilder aus anderen Ländern zu sehen sind.

Anforderungen an einen Statistiker

Donnerstag, 17. Januar, 2008

Frage: Wenn jemand eine Laufbahn als Statistiker anstrebt, nach welchen Kriterien sollte in Schule bzw. Studium darüber entschieden werden, ob er eine entsprechende Ausbildung absolvieren darf?

Falls jemand mit „Turnen bzw. Wirtschaftspolitik“ antwortet, so dürfte er im Kultusministerium oder einer Universitätsverwaltung arbeiten. Das hört sich zwar seltsam an, folgt aber aus meinen Erfahrungen:

Als Schüler bin ich in Sport nicht besonders gut gewesen. Mit Sport meine ich das, wonach man im Fach „Sport“ beurteilt wird. Besonders mit Turnen kam ich nicht zurecht. Dies wurde so schlimm, daß ich in einer Klasse in Gefahr geriet, nicht versetzt zu werden. Es gab dann schließlich doch einen Ausweg, aber wenn dieser nicht bestanden hätte, wäre ich nicht dazu gekommen, mein Abitur zu machen bzw. zu studieren.

Im Studium hatte ich als Nebenfach erst VWL belegt, da ich meine Statistikkenntnisse irgendwo in der Wirtschaft anwenden wollte. An der Universität Dortmund gehörten zum Grundstudium die Fächer Mikroökonomie, Makroökonomie und Wirtschaftspolitik. Um das Vordiplom zu bekommen, mußte man in jedem dieser Fächer eine Klausur schreiben und bestehen. Die Durchfallquoten waren wie folgt:

  • Mikroökonomie: ca. 1 von 3,
  • Makroökonomie: ca. 1 von 3,
  • Wirtschaftspolitik: ca. 2 von 3.

Unter dem Gesichtspunkt, daß man jede Klausur bestehen muß, hat höchstens ein Drittel der Teilnehmer die Chance, am Hauptstudium teilzunehmen. Wenn man annimmt, daß die Klausurleistungen unabhängig voneinander sind, da hätte das sogar bedeutet, daß nur ca. 15 Prozent aller Studenten weitergekommen wären. Erschwerend kam noch hinzu, daß man nach dem dritten Versagen mit dem Studium nicht mehr weitermachen durfte. Das hätte nicht nur das Nebenfach betroffen, sondern das ganze Studium. Dort hatte ich übrigens die Prüfungen soweit bestanden. In VWL sah die Lage so aus, daß ich Mikro- und Makroökonomie bestand und in Wirtschaftspolitik zweimal durchgefallen bin. Nun stand ich vor der Wahl, mein Nebenfach zu wechseln oder einen dritten Versuch bei einer Klausur zu wagen, in der ich keinen Plan hatte, wie ich sie bestehen konnte. Es reicht, darauf hinzuweisen, daß ich kein Fan von russischem Roulette bin.

Zusammengefaßt stellt sich die Frage, ob jemand, der sich auf einem Gebiet Wissen aneignen will/soll, nicht bloß danach beurteilt werden sollte, ob er die Fähigkeit dazu besitzt und diese Person ihre Anstrengungen hauptsächlich auf das Erlernen dieses Gebietes richten sollte. In den beiden von mir beschriebenen Situationen war das jedenfalls nicht möglich.

Het nieuwe Europa, aber kein neues Europa

Mittwoch, 16. Januar, 2008

Als ich mich vor einigen Wochen im Selexyz-Buchladen von Maastricht umsah, erblickte ich das neue Buch von Michael Palin „Het nieuwe Europa“, in dem er über seine Reise durch Osteuropa berichtet. Michael Palin ist vielen als Mitglied der Komikertruppe Monty Python bekannt. Ab Ende der 80er begann er bei BBC eine Reihe von Reise-Dokumentationen zu präsentieren, zu denen jeweils auch ein Buch folgte. Die Berichte führten auch zu einem gesteigerten Interesse, die beschriebenen Orte zu besuchen.

Nachdem ich die niederländische Übersetzung des Buches gesehen habe, wollte ich bei Amazon nach der deutschen Übersetzung suchen. Wie sich herausstellte, gibt es keine. Damit meine ich nicht nur, daß es im Augenblick keine deutsche Ausgabe gibt, sondern auch in nächster Zeit, da man es sonst vorbestellen könnte. Das verstehe ich aus folgenden Gründen nicht:

  • Wie gesagt, hat sich Michael Palin mit seinen Reiseberichten einen Namen gemacht.
  • Osteuropa ist eine Region, die eine jahrhundertelange geschichtliche Beziehung zu Deutschland und Österreich hatte. Ein Buch, das einen nach dem Fall des eisernen Vorhangs Länder und Leute vor der eigenen Haustür näherbringt, sollte eigentlich auf Interesse stoßen (die neuen Bundesländer werden auch beschrieben).
  • Wenn man Deutschland und Österreich zusammenzählt, kommt man auf eine Bevölkerung von ca. 90 Millionen Menschen mit entsprechend großer potentieller Leserschaft.

Es verbleibt also die Frage, warum es von so einem Buch eine niederländische Ausgabe gibt, aber keine deutsche.

Interessierte, die des Englischen mächtig sind, brauchen sich nicht zu grämen. Neben der Möglichkeit, die Originalausgabe zu bestellen, kann man das Buch auch auf seiner Webseite lesen.

[NACHTRAG: Laut Amazon.de wird im März 2009 eine deutsche Ausgabe mit dem Titel „Europareise“ erscheinen.]

Deutsche Bahn achtet niederländische Tradition

Montag, 14. Januar, 2008

Die Stadt ’s-Hertogenbosch ist die Hauptstadt der Provinz Nordbrabant. Sie weist eines der ältesten und am vollständigsten erhaltenen mittelalterlichen Innenstädte in den Niederlanden auf. Als Beispiel soll an dieser Stelle nur die St.-Johannes-Kathedrale genannt werden. In der Innenstadt gibt es viel Gelegenheit zum Einkaufen und zum Ausgehen. Die Umgebung der Stadt ist ebenfalls einen Besuch wert. Auch vom wirtschaftlichen Standpunkt gehört ’s-Hertogenbosch zu den bedeutenden Zentren.

’s-Hertogenbosch ist in der Umgangssprache auch als Hertogenbosch oder Den Bosch bekannt. Der offizielle Ortsname wurde 1996 per Gesetz festgelegt. Um den Gebrauch des traditionellen Namens zu fördern, gibt es seit 1993 eine Vereinigung. Sie sorgt dafür, daß Karten, Telefonbücher oder Wegweiser den richtigen Namen benutzen. Ein ähnlicher Fall ist die Stadt ’s-Gravenhage, die international als Den Haag bzw. unter landestypischen Varianten bekannt ist (z.B. The Hague in England oder La Haye in Frankreich). Aus diesem Grund gebraucht die Stadt selber den verkürzten Ortsnamen.

Das interessante an der Geschichte ist, daß die Deutsche Bahn diese Tradition achtet. Zumindest tut sie das bei den Fahrkartenautomaten. Wenn man dort eine Fahrkarte kaufen oder eine Zugverbindung herausfinden möchte, muß man bekanntlich einen Start- und einen Zielbahnhof eingeben. Mißachtet man die Tradition und versucht man, „Den Bosch“ oder „Hertogenbosch“ einzugeben, so kann der Fahrkartenautomat nichts damit anfangen. Wenn man es mit einem „S“ probiert, erscheint unter den Vorschlägen auch ein Feld mit der Aufschrift „s Hertogenbosch“.

Des Rätsels Lösung liegt darin, daß die Ortsnamen im Automaten nur über die ersten Buchstaben erreichbar sind. Über den Teil eines Ortsnamens kann man nur etwas erreichen, wenn dieser Teil ganz am Anfang liegt. Den Haag ist übrigens über „Den Haag“ erreichbar, aber nicht über „s Gravenhage“. Somit folgt die Deutsche Bahn auch hier dem Gebrauch in den Niederlanden. Bleibt nur die Frage, was eine Kunde macht, der den offiziellen Namen von ’s-Hertogenbosch nicht kennt…