Loading...

Visualisierung von Massendaten

Blog

 
 

Ich freue mich immer wenn eine Visualisierung gelungen ist. Ob nun von jemanden aus unserem Team oder von Dritten. Hier ein Beispiel zu einem traurigen Thema: Die Anzahl der Verkehrsunfälle mit Personenschäden wegen Alkohols am Steuer, erstellt durch das Statistisches Bundesamt.

Das Ziel der Ersteller ist ein tagesbezogener Vergleich der Zahlen von 2004 bis 2014. Das heißt, mehr als 4000 Tage. Wie macht man das geschickt? Stellt man die Jahre direkt gegenüber, so dass der 01.01.2004 mit dem 01.01.2005 vergleichbar ist usw. hat man eine Verschiebung der Wochentage. Vermutlich ist es aber wichtig, die Wochentage zu erkennen.

Visualisierung mit Kalendergrafik

Dies ist mit einer Kalendergrafik möglich, die meines Wissens das erste Mal durch Rick Wicklin und Robert Allison von SAS im Jahr 2009 verwendet wurde. Ein Jahr wird als kompakter Block von 7 Zeilen angezeigt. Die 1. Zeile für Montage bis zur 7. Zeile für die Sonntage. In den Spalten werden also die Kalenderwochen aufgelistet. Die schwarzen Linien begrenzen die einzelnen Monate.

Die Zellen sind mit „Temperaturfarben“ wie in Choroplethenkarten (= Flächendichtekarte) gefüllt. Diese stehen von gelb bis dunkelrot für zunehmende Mengen. Gerne beginnt man bei solchen Farbskalen bei blau (= kalt) oder grün (= gut). Beides wäre bei diesem Thema ausschließlich bei 0 Unfällen an einem Tag angemessen. Das kam in den Jahren 2004 bis 2014 nicht einmal vor! Ein kleiner Kritikpunkt ist die Rasterung der Farbintervalle bei je 51 Unfällen. Vermutlich ist diese automatisch generiert worden. Naheliegend wären Intervallgrenzen je 50 Unfällen.

Die Realisierung der Grafik erfolgte mit D3 – auch das technische Fundament unseres chefreporters und damit in unserem Portfolio.

 

Was fällt auf?

Der 1. Januar und der 1. Mai stechen unmittelbar hervor. Daneben fällt jeweils ein weiterer Tag im Mai auf, der sich nach Anzeige der Tooltipps im Original als Christi Himmelfahrt bzw. Vatertag entpuppt. Weiter sind die Wochenenden deutlich stärker betroffen als die übrigen Wochentage. Und die Sommermonate stärker als die Wintermonate. Insgesamt wird aber ein Rückgang von 2004 auf 2014 deutlich.

Der Visualisierung liegen knapp 500.000 Datensätze ( = Unfälle) zugrunde. Ein gutes Beispiel dafür, wie mit Hilfe von geeigneter Visualisierung Muster in Massendaten erkennbar werden. Wenn solche erschreckenden Statistiken häufiger in dieser Form publiziert würden, gäbe es durch den Signaleffekt vielleicht ein Umdenken bei den Autofahrern.

Geschäftsführer
geschrieben von Manfred Merkelbach
kd_mm
WordPress Lightbox