Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Übung - Abhängigkeit der Hauptkomponente von der Skalierung der Daten

Author: Hans Lohninger

Diese Übung wird Ihnen die Ergebnisse einer Hauptkomponentenanalyse und deren Abhängigkeit von der Skalierung der Originaldaten zeigen. Die Daten, die in dieser Übung verwendet werden, beinhalten zwei Klassen, die entweder durch das Verwenden einer Kombination der ersten und der zweiten Variablen oder durch das alleinige Verwenden einer dritten Variablen unterschieden werden können. Hauptkomponentenplots sind nützlich, um sich die Daten auf eine "multidimensionale" Art anzusehen, wobei die Richtung der Hauptkomponenten von der Skalierung der Daten abhängen kann.

Gehen Sie ins  DataLab , um selbst zu experimentieren. Sie sollten sich den Datensatz zuerst mit der 3-D-Rotationsoption ansehen. Wenn Sie die Box "isometrische Achsen" ankreuzen, sehen Sie die Beziehung zwischen den drei Variablen maßstabsgerecht.

Als Nächstes sollten Sie die Hauptkomponenten mittels verschiedener Skalierungsoptionen berechnen und die Ergebnisse vergleichen. Warum zeigt der Hauptkomponentenplot die zwei Klassen nur als separate Cluster, wenn die Daten vor der Hauptkomponentenanalyse standardisiert worden sind?


Last Update: 2012-10-08