Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu. |
Home Bivariate Daten Korrelation Verteilung des Korrelationskoeffizienten | ||||
Siehe auch: Pearsons Korrelationskoeffizient, Zufallsvariable, Zufallskorrelation, Test: Korrelationskoeffizient | ||||
Search the VIAS Library | Index | ||||
Verteilung des KorrelationskoeffizientenAuthor: Hans Lohninger
Da die Messung sehr vieler Werte aber zu zeitraubend ist, messen wir nur jeweils eine kleine Zahl an Werten (z.B. fünf) und berechnen die Korrelation dieser fünf Werte. Die Messung dieser kleinen Zahl an Werten wird mehrmals wiederholt. Wir werden nun feststellen, dass der tatsächlich ermittelte Wert der Korrelation manchmal ganz erheblich vom eigentlich erwarteten Wert null abweicht. Wiederholen wir das Experiment sehr oft, so können wir die Häufigkeiten der Korrelationswerte in einem Histogramm zusammenfassen und erhalten dadurch die Verteilung des Korrelationskoeffizienten (siehe Experiment rechts). Der Korrelationskoeffizient r ist eine Zufallsvariable, die wie jede Zufallsvariable einer Verteilungsfunktion unterliegt. Die Breite und die Form der Verteilung ist vom Populations-Wert des Korrelationskoeffizienten ρ und von der Zahl der Proben n abhängig.
In den Abbildungen der Verteilungsfunktionen oben kann man sehen, dass es eine erhebliche Chance gibt, einen deutlich von null abweichenden Korrelationskoeffizienten zu erhalten, falls nur wenige Beobachtungen vorliegen. Ein hoher Korrelationskoeffizient repräsentiert also nicht notwendigerweise eine hohe Korrelation zwischen zwei Variablen. Der Grund für eine hohe zufällige Korrelation kann auch die geringe Stichprobengröße sein. Speziell bei vier Stichprobenwerten ist die Wahrscheinlichkeit einen beliebigen Korrelationskoeffizienten zu erhalten immer gleich groß. Als Konsequenz dieses Effekts muss immer auch die Signifikanz des Korrelationskoeffizienten getestet werden. Als Daumenregel kann man sich merken, dass bei 10 Beobachtungen der Korrelationskoeffizient mindestens 0.8 sein muss, damit er sich signifikant von null unterscheidet. Bei 20 Beobachtungen liegt diese Grenze bei ca. 0.5.
|
||||
Home Bivariate Daten Korrelation Verteilung des Korrelationskoeffizienten |