Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu. |
Home Multivariate Daten Modellbildung Klassifizierung und Diskriminierung LDA Linear Discriminant Analysis Einführung | |
Siehe auch: Diskrimination und Klassifikation, Multiple lineare Regression - Einführung, Logistische Regression | |
Search the VIAS Library | Index | |
Lineare Diskriminanzanalyse - EinführungAuthor: Hans Lohninger
Die lineare Diskriminanzanalyse (engl. linear discriminant analysis, LDA) ist eine Methode, mit der man zwischen zwei oder mehr Stichprobengruppen unterscheiden kann. Um einen Klassifikator basierend auf LDA zu entwickeln, müssen folgende Schritte durchgeführt werden:
Festlegung der Gruppen Festlegung der Gruppen: Die zu unterscheidenden Gruppen können sich entweder aus
dem untersuchten Problem oder durch vorangehende Analysen, wie z.B. der Clusteranalyse, ergeben. Die Anzahl
der Gruppen ist nicht notwendigerweise auf zwei beschränkt, obwohl die
Unterscheidung zwischen zwei Gruppen die üblichste Methode ist. Beachten Sie,
dass die Zahl der Gruppen die Zahl der Variablen nicht überschreiten darf. Eine
weitere Voraussetzung ist, dass die Gruppen dieselbe Kovarianzstruktur haben
(d.h. sie müssen vergleichbar sein). Festlegung der Diskriminanzfunktion: Im Prinzip kann jede mathematische Funktion als Diskriminanzfunktion verwendet werden. Im Falle der LDA wird eine lineare Funktion der Form y = a0 + a1x1 + a2x2 + ..... + anxn
mit xi als beschreibende Variablen verwendet. Die Parameter ai müssen so bestimmt werden, dass die Trennung der Gruppen optimal ist. Beachten Sie, dass die lineare Diskriminanzfunktion formal der multiplen linearen Regression gleicht. Tatsächlich kann man direkt die MLR anwenden, wenn die abhängige Variable y durch die gewichteten Klassenzahlen c1 und c2 ersetzt wird. c1 = n2/(n1+n2) und c2 = - n1/(n1+n2) Um ein besseres Verständnis für die Wirkungsweise der Diskriminanzfunktion zu
bekommen, sollten Sie dieses interaktive Beispiel starten. Abschätzung der Parameter der Diskriminanzfunktion: Wie Sie im interaktiven Beispiel sehen konnten, gibt es nur eine Richtung der
Diskriminanzfunktion, die die besten Trennungsergebnisse liefert. Die Bestimmung
der Koeffizienten der Diskriminanzfunktion ist sehr einfach. Im Prinzip wird die
Diskriminanzfunktion so gebildet, dass die Trennung (= Entfernung) zwischen den
Gruppen maximal und die Entfernung innerhalb der Gruppen minimal ist. Testen der Diskriminanzfunktion: Nachdem die Diskriminanzfunktion mit Parametern versehen wurde, muss sie
entweder durch einen unabhängigen Satz von Testdaten oder durch Kreuzvalidierung getestet werden.
In beiden Fällen sollte das Testergebnis mit den Trainingsdaten vergleichbar
sein. Anwendung: Die Diskriminanzanalyse kann entweder zur Analyse oder zur Klassifikation
verwendet werden:
|
|
Home Multivariate Daten Modellbildung Klassifizierung und Diskriminierung LDA Linear Discriminant Analysis Einführung |