Vergleichsarten I

Das Meer der Daten ist stumm, heißt es recht poetisch. Wenn wir ihm dennoch seine Geheimnisse entlocken wollen, ist methodisches Geschick nötig. Noch davor kommt eine Vorstellung davon, welche Werkzeuge überhaupt zur Verfügung stehen.

Jede Analyse ist im Kern ein Vergleich. Die Vergleichsarten sind endlich. Zelazny* unterscheidet fünf Grundtypen: Struktur‑, Rangfolge‑, Zeitreihen‑, Häufigkeits‑ und Korrelationsvergleich.

Beim Strukturvergleich interessiert der Anteil einzelner Komponenten an einer oder mehrerer Gesamtheiten (Anteile der Marken F, G, H an den Regionen Nord und Süd).

Der Rangfolgevergleich stellt beliebige Objekte bewertend gegenüber: Sind sie alle gleich oder ist eines größer, kleiner, besser oder schlechter als das andere?

Beim Zeitreihenvergleich zeigt man zeitliche Veränderungen von Objekten: Wachstum, Stagnation oder Rückgang im Wochen‑, Monats‑ oder Jahresverlauf.

Der Häufigkeitsvergleich weist aus, wie häufig bestimmte Objekte in verschiedenen, aufeinander folgenden Intervallen, z.B. Einkommensklassen auftreten. Die am stärksten besetzte Klasse oder Kennziffern wie Mittelwert, Median und Spannweite helfen, die Verteilung der Werte treffend zu beschreiben.

Der Korrelationsvergleich zeigt, ob der Zusammenhang zwischen zwei Variablen den „normalen“ Erwartungen entspricht, z.B. steigende Gewinne bei steigenden Umsätzen.

Welche Vergleichsart passt, das zeigen oftmals Schlüsselwörter in der Frage, die man beantworten möchte. „Welcher Anteil der Umsätze entfällt auf..“ ist z.B. ein Indiz für einen Strukturvergleich.

Die fünf Grundtypen decken vor allem die weit verbreiteten Geschäftsgrafiken ab. Der Freund der gepflegten Datenanalyse wird hier tiefer einsteigen und eine Reihe weiterer Vergleichsarten in sein Rüstzeug aufnehmen, z.B. Geo‑, Warenkorb‑ oder Konzentrationsvergleiche. Mehr zum geistigen Handwerkszeug für die Datenanalyse demnächst an dieser Stelle.

* Zelazny, Gene: Wie aus Zahlen Bildern werden – Der Weg zur visuellen Kommunikation, 5. Aufl., 2002, Gabler Verlag.