Reisensburg 1997: Abstract Vach
Statistical Computing '97 - Schloß Reisensburg

Ein Werkzeug zur Berechnung von ML-Schätzern aus Daten mit unvollständigen Beobachtungen

Werner Vach

Zentrum für Datenanalyse und Modellbildung
Universität Freiburg

Für viele Probleme der statistischen Inferenz ist bei Vorliegen unvollständiger Daten das Maximum Likelihood Prinzip weiterhin anwendbar (Little & Rubin 1987). Die Berechnung der ML-Schätzer ist jedoch in vielen Fällen mit Hilfe von Standardsoftware sehr aufwendig oder nicht möglich, auch wenn der EM Algorithmus benutzt wird.

In diesem Vortrag wird ein Werkzeug vorgestellt, welches die Berechnung von ML-Schätzern für eine Reihe von Problemen erlaubt. Diese Probleme sind dadurch charakterisiert, daß sich die Likelihood einer einzelnen Beobachtungseinheit mit vollständigen Daten als Produkt von Termen darstellen läßt, die der Likelihood eines logistischen Regressionsmodelles, eines log-linearen Modelles, eines Gaußschen Regressionsmodelles oder eines Poisson-Regressionsmodelles entsprechen. Hinsichtlich der Unvollständigkeit einzelner Variablen ist vollständiges Fehlen als auch teilweise Beobachtung wie Rechts- oder Linkszensierung erlaubt.
Durch diesen Rahmen sind auch Fälle abgedeckt, bei denen bestimmte Variablen nie beobachtet werden, z.B. also auch Latent-Class-Modelle oder Modelle mit zufälligen Effekten. Ferner ist es möglich, in einfacher Weise Sensitivitätsanalysen hinsichtlich einer Verletzung der Annahme nichtinformativer Unvollständigkeit durchzuführen.

Es werden verschiedene Beispiele aufgezeigt, in denen das Werkzeug eingesetzt wurde, oder eingesetzt werden kann: Analyse von Fall-Kontroll-Studien mit fehlenden Werten in den Kovariablen (Vach & Blettner 1995), Analyse prognostischer Faktoren für Überlebenszeiten in klinischen Studien (Vach 1997), Analyse longitudinaler, binärer Daten mit Markov- und Random-Effects-Modellen sowie die Auswertung von Kohortenstudien mit Validierungsstichproben zur Vermeidung von Verzerrungen aufgrund von Mißklassifikationen in den Kovariablen.

Literatur:

  1. Little, R.J.A., Rubin, D.B. (1987). Statistical analysis with missing data. Wiley, New York.
  2. Vach, W., Blettner, M. (1995). Logistic regression with incompletely observed categorical covariates - Investigating the sensitivity against violation of the missing at random assumption. Statistics in Medicine 14, 1315-1329.
  3. Vach, W. (1997). Some issues in estimating the effect of prognostic factors from incomplete covariate data. Statistics in Medicine 16, 57-72.


Vortragstermin bei 29. Statistical Computing '97 --- Adresse