Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Zufallskorrelation

Author: Hans Lohninger

Nehmen wir an, wir haben eine Datenmatrix von 6 Variablen und 13 Beobachtungen, gefüllt mit Zufallszahlen. Nun führen wir folgendes einfache Experiment durch: Ohne den Verlust der Allgemeingültigkeit suchen wir die erste der 6 Variablen aus und versuchen, diese Variable mit Hilfe der verbliebenen 5 Variablen zu modellieren. Im Idealfall sollten wir erwarten, dass es unmöglich ist, ein Regressionsmodell, das eine signifikante Beziehung zwischen irgendeiner der ausgewählten Variablen und der ersten Variablen herstellt, aufzustellen. Wenn wir das Experiment durchführen und es einige Male wiederholen, sehen wir, dass wir beträchtliche Korrelationen zwischen den vorhergesagten und den eigentlichen Zielwerten erhalten. Dieser Effekt verschlimmert sich, je mehr unabhängige Variablen verwendet und je weniger Beobachtungen gemacht werden. Sie können das folgende interaktive Beispiel starten, um Erfahrungen mit diesem Effekt zu sammeln.

In Summe haben Zufallskorrelationen einen beträchtlichen Effekt auf multivariate Modelle. Darum ist es wichtig, die Anzahl der Variablen im Vergleich zur Anzahl der Beobachtungen gering zu halten. In der Literatur wird oft eine Daumenregel empfohlen, die besagt, dass die Anzahl der Beobachtungen mindestens der dreifachen Anzahl der Variablen entsprechen sollte. Es kann jedoch leicht bewiesen werden, dass diese Daumenregel ziemlich sinnlos ist, besonders wenn eine umfassende Variablenselektion stattfindet.

Gehen Sie zum  DataLab , um selbst ein paar Versuchsberechnungen durchzuführen. Verwenden Sie den mathematischen Formeleditor, um eine Datenmatrix mit Zufallszahlen zu füllen und versuchen Sie, dann ein MLR-Modell zwischen irgendeiner Anzahl von unabhängigen Variablen und einer ausgesuchten Zielvariablen aufzustellen. Ändern Sie die Anzahl der Beobachtungen und wiederholen Sie das Experiment. (Fangen Sie mit 10 Beobachtungen an und wiederholen Sie das Experiment dann mit 20 und 100 Beobachtungen.)


Last Update: 2021-08-15