Ist Signifikanz signifikant? (Teil II)

Wir müssen signifikant aus unserem Wortschatz für Management­berichte streichen. Nach dem Test vor zwei Wochen ist nur noch eines sicher: Unsere Empfänger werden uns missverstehen. Und wahrscheinlich wissen wir selbst nicht, was wir eigentlich meinen.

Haben Sie vor zwei Wochen den Test gemacht? Wir hatten wie seinerzeit in einer Studie von Haller und Krauss* gefragt, was man aus einem statistisch signifikanten Testergebnis ableiten kann. Haben Sie bestanden? Bravo! Falls nicht, wären Sie in guter Gesellschaft. Die meisten beantworten fälschlicher­weise mindestens eine der zu bewertenden Aussagen als „richtig“ und fallen damit durch. Das sind die Durchfallquoten:

Methodenausbilder: 80,0 % (n=30)
Wissenschaftliche Psychologen: 89,7 % (n=39)
Psychologie-Studenten: 100,0 % (n=44)
Blogleser: 64,0 % (n=139)

Bei soviel Fehlinterpretation ist die Signifikanz keine Lösung, sondern ein Problem. Auch die Ausbilder sind betroffen.

Dass meist weder der Autor noch der Leser den Test bestehen würden, hindert kaum jemanden daran, etwas für signifikant zu halten, was vielleicht statistisch signifikant, aber damit eben noch lange nicht bewiesen ist. Davon kann man sich täglich in den Medien überzeugen. Wer das überprüfen möchte, wähle in unserer kleinen vorkonfigurierten Google-Suche eine Zeitung links und einen der einschlägigen Begriffe rechts:

Statistisch etwas beweisen zu können ist so wünschenswert wie Tarnkappen, Dukatenesel und Jungbrunnen. Und genauso märchenhaft. Da wir Unternehmen führen wollen, müssen wir realistisch bleiben. Fassen wir daher zusammen, wovon hier schon die Rede war:

  1. Ob man etwas mit den Mitteln der Statistik testet oder nicht: Unterschiede zwischen Gruppen sind normal. Gleichheit ist merkwürdig. Ein signifikantes Ergebnis besagt, der Unterschied ist nicht zufällig. Ein nicht signifikantes Ergebnis besagt, der Unterschied ist vielleicht dennoch nicht zufällig.
  2. Woher der Unterschied rührt, das sagt der Signifikanztest nicht. Es ist ähnlich wie bei der Korrelation. Der Rückgang der Storchenpopulation ähnelt dem der Geburtenrate. Wer an einen Zusammenhang glauben will, kann das tun. Oder lassen.
  3. Bei sozialen, medizinischen oder betriebswirtschaftlichen Experimenten können wir die Einflussvariablen weder vollständig erfassen noch konstant halten. Das gelingt selbst Technikern nur schwer, aber immerhin etwas besser.
  4. Weil Variation normal ist, weil der Signifikanztest das nur immer wieder bestätigt und weil er über wahre Gründe nichts aussagt, können wir ihn ohne den geringsten Schaden beerdigen und stattdessen die Verteilungen selbst beäugen.

Aus alledem folgt, dass wir Satzkonstruktionen wie diese aus unserem aktiven Sprachgebrauch besser verbannen:

  1. Das ist statistisch nachgewiesen (aus A folgt B).
  2. Der Unterschied ist signifikant.
  3. Die neue Kampagne ist mit einer Sicherheit von 95 % wirksam.
  4. Die Zusammenhang ist statistisch bewiesen.

Fürs Managementberichtswesen sind wir bereits gewappnet. Statistisch signifikant ist nämlich nur ein Attribut. Und das vermeiden wir ja ohnehin.

* Quelle: Haller, H., Krauss, S. (2002). Misinterpretations of Significance: A problem students share with their teachers? Methods of Psychological Research Online, Vol. 7, No. 1, S. 1–20.