Vor allem zeig Deine Zahlen

Wer verdichtet, versteckt sich und seine Daten. Nur selten haben wir Informationen, die so valide und repräsentativ sind, dass sie eine Kompression aushalten, ohne dass Bedeutung verloren geht.

Die WAMS, meine hochgeschätzte Sonntagszeitung, unterhält ein „Unternehmerpanel“. Zwölf Firmenchefs bewerten die gegenwärtige und zukünftige konjunkturelle Situation für ihr Unternehmen. Das Ganze nennt sich Unternehmer-Konjunkturindex.

Darstellung Unternehmer-Konjunkturindex, WamS 2008–04–06 S.29

Die WAMS steht mit derlei Darstellungen nicht allein. Sie finden sich so oder ähnlich in vielen Artikeln, Präsentationen, Gutachten oder Memoranden. Man kann den Wunsch nach Verdichtung darin erkennen, nach Kompression und Präzision. Die Information soll auf den Punkt sein. Schwarz oder Weiß. Fakten, Fakten, Fakten, gemäß Helmut Markworts inzwischen geflügeltem (Un)Wort.

Der Wunsch ist begreiflich, aber schwer erfüllbar. Wir haben sie so selten, die Fakten, Fakten, Fakten. Die Wirklichkeit ist grau schattiert, nie ganz weiß und nie ganz schwarz. Durchschnitte signalisieren damit eine Präzision, die Daten gar nicht haben. Auch anderes spricht für einen behutsamen Umgang mit Mittelwerten. Null Grad zu einem Zeitpunkt und 40 Grad zu einem anderen ergeben im Mittel angenehme 20 Grad, die so aber nie vorkamen. In der Wirklichkeit der unverdichteten Daten wurde gefroren und geschwitzt. Im Fall der einsamen zwölf Unternehmer des WAMS-Panels würde allein meine Prognose für meine Branche den Mittelwert verschieben. Nach oben. Das Panel ist viel zu klein. Wie meine fiktive schematische Abbildung zeigt, kann derselbe WAMS-Mittelwert bei völlig unterschiedlichen Verteilungen zustande kommen.

Unterschiedliche Rohdaten führen zu identischen Mittelwerten

Diese Darstellung ist in meinen Augen übrigens die einzig seriöse. Sie versteckt und verdeckt nichts. Sie zeigt alle Daten. Sie überlässt es dem Betrachter für sich zu entscheiden, ob er den Mittelwert überhaupt für eine geeignete Charakterisierung der Verteilung hält. Sie zeigt die Spannweite der Antworten, sie zeigt, ob Tendenzen innerhalb der Verteilung vorliegen, z. B. 10 Antworten, die dicht beieinander liegen, und 2, die weiter entfernt davon sind usw. Sie zeigt, dass die Daten dünn sind, holt aber gleichzeitig alles aus ihnen heraus. Beautiful Evidence.

Wer seine Daten so zeigt, beweist, dass er seine Leser und seine Daten mag.