Reisensburg 1996: Abstract J. Röhmel
Statistical Computing '96 - Schloß Reisensburg

p-Wert Funktionen auf 2x2 Felder Tafeln - Neue Entwicklungen und Power-Vergleiche

Joachim Röhmel

Bundesinstitut für Arzneimittel und Medizinprodukte, Berlin

Der wohl bekannteste Test auf einer 2x2 Tafel ist der exakte Test von Fisher. Es ist weiter bekannt, daß dieser Test sich konservativ verhält, wenn man - wie in Klinischen Versuchen üblich - die iid-Annahme mit Bernoulli verteilten Zufallsvariablen macht. Das bedeutet, daß der Test unter der Nullhypothese (kein Unterschied zwischen den Behandlungen) sein Niveau nicht ausschöpft (wenn als unbedingter Test aufgefasst).

Im Gegensatz dazu zeigt die Normalapproximation gelegentlich auch ein zu liberales Verhalten, d.h. es kommt zu Überschreitungen des Niveaus. Bei der Entwicklung besserer Niveau Alpha-Tests (d.h. solcher, die stets ihr Niveau einhalten, es aber versuchen auch auszunutzen) ist es 1970 Boschloo gelungen, den Test von Fisher gleichmäßig zu verbessern. Dieser Test ist bis heute wenig bekannt. Vermutlich deswegen wurde er 1977 von McDonald, Davis und Milliken neu entdeckt. Außerdem ist seine Berechnung zeit- und rechenintensiv. Ich zeige, daß sich auch hier der Streitberg/Röhmel'sche Shift Algorithmus gut einsetzen läßt.

1986 gaben Suissa und Shuster eine weitere Methode zur Ermittlung von gültigen p-Werten an. 1991 haben Streitberg,Röhmel, 1994 auch Berger,Boos gezeigt, daß sich dahinter eine allgemeine Konstruktionsmöglichkeit verbirgt, mit Hilfe derer man gültige p-Werte konstruieren kann, und die auch bestehencle p-Werte gleichmäßig verbessern kann. Dabei wird der p-Wert als Familie ineinander geschachtelter Niveau Alpha-Tests eingeführt.

Berger hat dann 1995 ein weiteres Konstruktionsprinzip eingeführt ( Beta klein, z.B. 0.001 ) mit:

BILD

für den "Nuisance" Parameter Theta ist. Damit entstehen eine Reihe weiterer Tests. Diese konnten von mir noch weiter verbessert werden durch
BILD

Die zur Konkurrenz anstehenden Tests (alle gültige Niveau Alpha-Tests) werden bezüglich ihrer Ausnutzung des Niveaus miteinander verglichen).

Literatur:

  1. Boschloo R.D. (1970). Raised conditional level of significance for the 2x2 table when testingthe equality of two probabilities. Statistica Neerlandica 24, 1-35.
  2. Berger R.L., Boos D.D. (1994). p-values maximized over a confidence set for the nuisance parameter. JASA 89, 1012-1016.
  3. McDonald L.L., Davis B.M., Milliken G.A. (1977). A non randomized unconditional test for comparing two proportions in 2x2 contingency tables. Technometrics 19, 145-157.
  4. Streitberg B., Röhmel J. (1991). Alternatives to Fisher's Exact Test? Biometrie und Informatik in Biologie und Medizin, 22, 139-146.


Statistical Computing '96 auf Schloß Reisensburg