Statistical Computing '99 - Schloß Reisensburg

Ist der exakte X**2-Test immer eine sinnvolle Alternative zum asymptotischen X**2-Test?

Bertram Krumm
Zentralinstitut für Seelische Gesundheit, Abteilung Biostatistik
D-68159 Mannheim, J5

Zur Prüfung der Hypothese der Unabhängigkeit in zweidimensionalen Kontingenztafeln wird häufig der Pearsonsche X**2-Test verwendet. Die X**2-Statistik ist unter der Nullhypothese asymptotisch chiquadratverteilt. Die Güte der Approximation ist für kleines N und kleine erwartete Zellbesetzungen nicht zufriedenstellend. Es hat sich keine Regel durchgesetzt, mit der - gestützt auf präzise Kriterien - Bedingungen identifiziert werden können, unter denen der X**2-Test ungültige Ergebnisse liefert (Agresti, 1990, S.246-247).
In der jüngeren Vergangenheit ist die Verfügbarkeit und die Vielfalt exakter Tests wesentlich verbessert worden (Agresti, 1992). Zur Prüfung der Unabhängigkeit steht eine exakte Version des X**2-Tests zur Verfügung. Diese stützt sich auf die bedingte Verteilung der X**2-Statistik, gegeben die Randsummen der beobachteten Kontingenztafel (Mehta, Patel, 1996). Die bedingte Verteilung kann sehr unstetig sein (z.B. bei 2x2 Tafeln). Angeregt von der Anwendung des exakten X**2-Tests in der Beratungspraxis stellte sich die Frage, ob die Unstetigkeit das Verhalten des Tests beeinträchtigt.
Daher wurden in einer umfänglichen Simulationsstudie der Pearsonsche und der exakte X**2-Test miteinander verglichen. Das Format der Kontingenztafel, die Anzahl der Beobachtungen und die Randverteilungen sind Parameter die systematisch variiert wurden. Es wurde mit homogenen und inhomogenen Randverteilungen gearbeitet; die Abweichung von der Homogenität wurde ebenfalls variiert.
Es wurde untersucht, - unter welchen Parameterkonstellationen wesentliche Unter- und Überschreitungen des Niveaus auftreten, - ob der exakte Test unter allen Bedingungen eine sinnvolle Alternative zum asymptotischen Test ist und - ob Abweichung von der Homogenität die Einhaltung des Niveaus beeinflusst.
Die wichtigsten Ergebnisse: Unterschreitungen des Niveaus sind häufiger als Überschreitungen. Parameterkonstellationen, unter denen Überschreitungen auftreten, und Konstellationen, unter denen der exakte Test keine gute Alternative ist, können angegeben werden.


31. Statistical Computing '99