Zahlenmensch, Grafikmensch

Wird Visualisierung diskutiert, ist schnell von zwei Unterarten der menschlichen Spezies die Rede. Der Zahlenmensch versteht und liebt Zahlen. Am ehesten, wenn sie ihm in Form einer Tabelle begegnen. Der Grafikmensch tut sich mit Zahlen schwer, versteht denselben Sachverhalt aber ebenso schnell, wenn er in Balken‑ und Säulenform daherkommt.

Der von dieser Art Visualisierungsdarwinismus Überzeugte begründet das gern wie folgt: „Stell Dir vor, Du sollst aus dieser Tabelle ableiten, wie stark das Konzernergebnis gestiegen ist.… weiter

Noch mehr schlaue Indikatoren

In der letzten Woche hat der Rechner für uns Ähnlichkeiten von Zeitreihen automatisch beurteilt. Heute definieren wir einen Indikator, mit dem wir Unterschiede analysieren, z.B. zwischen Gruppen. Eine Gruppe könnte z.B. anhand demografischer Merkmale beschrieben sein.

Als Indikatoren kommen hierfür nicht nur metrisch-skalierte Variablen wie z.B. monetäre Größen (Umsatz, Deckungsbeitrag, Kosten), Mengen, Volumina oder Gewichte in Frage sondern auch Einschätzungen und Wertungen, die z.B.… weiter

Schlaue Indikatoren selbst gebaut

Nehmen wir an, wir haben ein großes Spektrum von Analyseobjekten, mit denen wir regelmäßig Umsätze erzielen, im einfachsten Fall also unsere Produkte. Beim mittelständischen Bohrwerkzeugehersteller Gühring wären das immerhin mehr als 8000. Für die Frühwarnung ist es nun wichtig, rechtzeitig zu erkennen, ob etwas „aus dem Ruder läuft“. Das müssen wir erst einmal definieren.

Auffällig ist ein Umsatzverlauf,

  1. wenn er innerhalb der letzten 6 Monate stark schwankt
  2. wenn er stark steigt
  3. wenn er stark fällt
  4. wenn er stark steigt und dann stark fällt
  5. wenn er sich gegen den Gesamttrend verhält (z. B.
weiter

Was tun gegen das Gehampel mit der Ampel?

Entscheider, die eine Ampel als Entscheidungshilfe erhalten, haben eigentlich nichts mehr zu entscheiden. Die Wertung ist bereits vom Berichtsersteller vorweggenommen. Sie kann vom Entscheider gar nicht mehr nachvollzogen werden. Dabei braucht es gar nicht viel für eine Verbesserung der Situation.

Vor den Gefahren eines Ausnahmeberichtswesens, das sich an starren Schwellen orientiert und Abweichungen dann per Ampel visualisiert, wurde an dieser Stelle bereits gewarnt.… weiter

Statistisches Denken vs. statistische Rituale II

Was macht statistisches Denken aus? Es ist von der Anwendung des gesunden Menschenverstands nicht weit entfernt, wie man an der Fortsetzung des Supermarktbeispiels sieht.

Wenn Bella über Datenvisualisierung hirnt, dann kommt es ihr auf jedes Pixel an. Dabei praktiziert sie die Kunst des Weglassens. Erst wenn weiteres Weglassen Datenwerte zerstören würde, ist eine Grenze erreicht, die nicht überschritten werden darf. Ähnliche Fragen stellen sich für die Statistisierung unserer Darstellungen.… weiter

Vergleichsarten II – Vermeiden Sie visuelles Pathos

Kreative Datenanalyse setzt die Kenntnis verfügbarer Instrumente voraus. Die Grundtypen des Vergleichs, wie sie Zelazny beschreibt, hatte ich kürzlich vorgestellt. Daneben gibt es eine ganze Reihe weiterer Vergleichsarten.

Räumliche Vergleiche Sehr häufig begegnet man dem räumlichen Vergleich mithilfe von kartografischen Darstellungen. Der Aufmerksamkeitswert ist hoch, die Verwendung aber schwierig. Landkarten benötigen viel Raum, die Platzierung von Werten und Beschriftungen auf den zugehörigen Flächen ist häufig problematisch.… weiter

Vergleichsarten I

Das Meer der Daten ist stumm, heißt es recht poetisch. Wenn wir ihm dennoch seine Geheimnisse entlocken wollen, ist methodisches Geschick nötig. Noch davor kommt eine Vorstellung davon, welche Werkzeuge überhaupt zur Verfügung stehen.

Jede Analyse ist im Kern ein Vergleich. Die Vergleichsarten sind endlich. Zelazny* unterscheidet fünf Grundtypen: Struktur‑, Rangfolge‑, Zeitreihen‑, Häufigkeits‑ und Korrelationsvergleich.

Beim Strukturvergleich interessiert der Anteil einzelner Komponenten an einer oder mehrerer Gesamtheiten (Anteile der Marken F, G, H an den Regionen Nord und Süd).… weiter

Data Mining mit Rangfolgen II

In der Serie zur Rangfolge (iPod, PowerSearch) wurde bereits deutlich, dass in diesem so simpel erscheinenden Instrument weitaus mehr steckt, als man auf den ersten Blick vermuten würde. Nehmen wir uns nochmals die Formel-1-Daten vor. Diesmal bilden wir eine Rangfolge nicht über alle Dimensionen unserer Daten, sondern fragen gleichzeitig nach auffälligen Kombinationen der Merkmale. Immerhin ist die Formel 1 ein Sport, in dem der Sieg von mehr Faktoren bestimmt wird, als in vielen anderen Sportarten.… weiter

Data Mining mit Rangfolgen I

Vor kurzem habe ich gezeigt, wie viel analytische Kraft in simplen Rangfolgen steckt, und sie als iPod des Datenanalysten bezeichnet. Die Verständlichkeit einer einfachen sortierten Liste kommt uns auch bei komplexeren Analysen zugute. Nehmen wir dazu nochmals die Formel-1-Daten zur Hand. Nach Weltmeistern hatten wir sie schon geordnet und uns gefreut, dass sie von einem Landsmann angeführt wird. Nach Ländern sieht die Sache anders aus.… weiter

Wieso 2.0? Business Intelligence 7.0!

Wie jeder paarweise gebundene Mensch weiß, leben Diskussionen vom richtigen sprachlichen Einstieg („Genau wie Deine Mutter“). Das ist in der IT-Industrie nicht anders. Dort allerdings muss die Sache neu oder vermeintlich neu sein. Ebenso wichtig ist der richtige Begriff. Übersetzungen ins Deutsche sind dabei zu meiden. Nicht jeder scheitert dabei so kläglich wie ich: Google findet 1.310.000 deutsche Seiten für „Data Mining“ und 846 für meinen Favoriten „Datenmustererkennung“*.… weiter