Simulation des Konfidenzintervalls

Konfidenzintervalle gehören zu den am häufigsten missverstandenen Konzepten der Statistik. Die verbreitete Lesart, der wahre Wert liege „mit 95-prozentiger Wahrscheinlichkeit“ im berechneten Intervall, ist im frequentistischen Rahmen nicht korrekt – die 95 % beziehen sich auf das Verfahren, nicht auf das einzelne Intervall. Dass selbst Forschende und Statistik-Dozierende dieser Fehlinterpretation unterliegen, zeigten unter anderem Cumming (2014), Gigerenzer (2004) und Hoekstra et al. (2014), die die Ursache in einer jahrzehntelangen Weitergabe fehlerhafter Darstellungen von Lehrbuch zu Lehrbuch sah. Der entscheidende Perspektivwechsel besteht darin, nicht das einzelne Intervall zu betrachten, sondern das Verfahren dahinter – und genau das lässt sich mit der folgenden Simulation beobachten.

Simulation des Konfidenzintervalls

Die Simulation soll die korrekte Interpretation und Bedeutung von Konfidenzintervallen ermöglichen. In dieser Simulation können verschieden Paramter verändert werden, um deren Einfluss auf das Ergebnis visuelle nachvollziehen zu können.

Stichprobengröße
25
Konfidenzniveau
95 %
Standardabweichung
15
Geschwindigkeit
3
Stichproben 0
Überdeckungsrate
Treffer (μ überdeckt) 0
0 Verfehlt (μ nicht überdeckt)
μ überdeckt
μ nicht überdeckt
wahrer Wert μ = 100

Anmerkungen

  • Die 95% (Konfidenzniveau) beschreiben das Verfahren, nicht das einzelne Intervall. Beobachte, wie sich die Überdeckungsrate über viele Stichproben hinweg bei 95 % einpendelt. Für jedes einzelne (bereits berechnete) Intervall gilt jedoch nur: Der wahre Wert liegt entweder darin oder nicht. Die Aussage „der wahre Wert liegt mit 95-prozentiger Wahrscheinlichkeit in diesem Intervall“ ist eine häufige, aber im frequentistischen Rahmen fehlerhafte Interpretation.
  • Ein schmales Intervall ist nicht automatisch ein gutes Intervall. Wenn Du die Stichprobengröße erhöhst, werden die Intervalle schmaler – aber das Verhältnis von Treffern zu Fehlschüssen bleibt gleich. Schmalere Intervalle sind präziser (sie grenzen den Wertebereich enger ein), aber ob ein bestimmtes Intervall den wahren Wert tatsächlich enthält, lässt sich daraus nicht ablesen.
  • Das Konfidenzintervall sagt nichts über einzelne Beobachtungen aus. Der dargestellte Bereich bezieht sich auf den Populationsmittelwert μ, nicht auf die Streuung individueller Messwerte. Die Aussage „95 % aller Personen liegen in diesem Bereich“ ist eine Verwechslung mit einem Vorhersageintervall – einem anderen statistischen Konzept.

Literatur

  1. Cumming, G. (2014). The New Statistics: Why and How: Why and How. Psychological Science, 25(1), 7-29.
  2. Hoekstra, R., Morey, R. D., Rouder, J. N., & Wagenmakers, E. J. (2014). Robust misinterpretation of confidence intervals. Psychonomic bulletin & review, 21(5), 1157–1164. https://doi.org/10.3758/s13423-013-0572-3
  3. Gigerenzer, G. (2004). Mindless statistics. The Journal Of Socio-Economics, 33(5), 587–606. https://doi.org/10.1016/j.socec.2004.09.033