Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu. |
Home Statistische Tests Varia Iterationstest | |||||||
Siehe auch: Zufallszahlengenerator, Autokorrelationsfunktion | |||||||
Search the VIAS Library | Index | |||||||
Iterationstest (Runs-Test)Author: Hans Lohninger
Obwohl der Begriff "Zufall" in der Statistik eine zentrale Rolle spielt, ist es nicht einfach zu entscheiden, ob eine bestimmte Zahlenfolge zufällig ist oder nicht. Hier spielt eine Vielzahl von Aspekten eine Rolle, von denen die wichtigsten kurz aufgezählt seien:
Betrachtet man eine Folge von binären Zufallszahlen (z.B. 00101110110111000100110) so kann man die Frage stellen, wie viele "Runs" (also Teilfolgen gleicher Werte) in einer Folge mit einer bestimmten Zahl an Nullen und Einsen normalerweise auftreten. Zu wenige Runs deuten auf zu geringe Durchmischung hin, zu viele auf eine zu starke Durchmischung. Weicht die Zahl der tatsächlich gefundenen Runs von der erwarteten Häufigkeit ab, so liegt der Verdacht nahe, dass die Folge nicht zufällig entstanden ist. Die obige Beispielsfolge lässt sich also in folgende Runs unterteilen: 00 | 1 | 0 | 111 | 0 | 11 | 0 | 111 | 000 | 1 | 00 | 11 | 0 Die Zufallsfolge enthält 13 Runs bei 23 Zufallszahlen (11 mal null, 12 mal eins). Um nun zu entscheiden, ob die Zahl der gefundenen Runs unwahrscheinlich ist (also die Wahrscheinlichkeit, dass diese Zahl von Runs auftritt, kleiner als das Signifikanzniveau ist) muss man zuerst die Verteilung der Runs in Abhängigkeit der Zahl der beiden Zufallszahlen (n1 und n2) kennen. Diese Verteilung lässt sich aus kombinatorischen Überlegungen ableiten. Daraus ergibt sich die Wahrscheinlichkeit p(r), dass bei gegebenem n1 und n2 genau r Runs beobachtet werden, nach folgendem Zusammenhang:
Mit n1, n2 gegen unendlich geht die Verteilung in eine Normalverteilung mit dem Mittelwert μr und der Standardabweichung σr über:
In der Praxis benützt man diese Tatsache um für Stichproben mit n1 und n2 > 20 die Wahrscheinlichkeiten nicht mehr exakt berechnen zu müssen, sondern durch die Normalverteilung approximieren zu können, was bei den dann auftretenden großen Binomialkoeffizienten rechentechnische Vorteile mit sich bringt. Allerdings weisen nur wenige Autoren auf die beträchtlichen Abweichungen dieser Approximation bei ungleichem n1 und n2 hin.(1)
Anwendungen des Runs-TestsDer Runs-Test (auch Wald-Wolfowitz-Test genannt) wird primär zur Überprüfung der Zufälligkeit einer Zufallsfolge eingesetzt. Hier wäre die Überprüfung der Residuen auf Unkorreliertheit bei der linearen Regression zu nennen: Ist die Folge der Residuen nicht zufällig, so erklärt die mit Hilfe der Regression parametrisierte Funktion die Daten nicht vollständig.Er kann aber auch dazu verwendet werden, zwei Verteilungen auf Gleichheit zu überprüfen. Die Idee dahinter ist folgende: Fasst man die Stichproben A und B, die aus zwei Verteilungen stammen, zusammen und sortiert sie, so wird die Abfolge der Werte aus A und B zufällig sein, falls die beiden Verteilungen in allen Parametern gleich sind. Anderfalls werden sich Werte aus zumindest einer der beiden Verteilungen in bestimmten Bereichen häufen, was zu längeren und zu einer geringeren Zahl an Runs führt als man für eine zufällige Folge erwarten würde. So ist klar, dass es z.B. bei ungleicher Varianz zu Häufungen der Werte einer Verteilung an den Rändern der Folge kommen muss. Dieser Test ist ein sogenannter Omnibus-Test, der die beiden Verteilungen in allen Aspekten vergleicht.
|
|||||||
Home Statistische Tests Varia Iterationstest |