Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Clusteranalyse

Author: Hans Lohninger

Die Clusteranalyse ist ein Oberbegriff für multivariate Methoden, die versuchen, Strukturen (clusters) in den Daten zu finden. Diese Methoden basieren meist auf Berechnungen der Distanz der Beobachtungen im multidimensionalen Datenraum. Generell gibt die Clusteranalyse Antworten auf die folgenden Fragen:

  • Wie viele Gruppen (Cluster) können in einem Datensatz beobachtet werden?
  • Welche Objekte gehören zu welchen Clustern?
  • Wie gleichmäßig sind die Cluster?

Rechts sehen Sie ein Diagramm mit ca. 150 Datenpunkten, die drei verschiedene Arten von Veilchen zeigen (jeweils 50). In diesem Diagramm sieht man zumindest zwei klare Cluster, die durch Methoden der Clusteranalyse auch automatisch gefunden werden können.


Die Resultate einer Clusteranalyse werden oft als Dendrogramme dargestellt, welche die multidimensionalen Beziehungen als zweidimensionale Liniengrafik darstellen. Im Allgemeinen können Clusteranalysemethoden in mehrere Kategorien eingeteilt werden:


Last Update: 2012-10-08