New In

Verbesserungen im Do-file Editor

Höhepunkte

  • Parametrische und semiparametrische Überlebensmodelle

  • Rechtszensierte und intervallzensierte Daten

  • Drei Schätzer für die kumulative Risikofunktion

  • Gruppenweise und stratifizierte Modelle

Stata 18 bietet den neuen estat-Befehl gofplot, um Goodness-of-Fit-Diagramme (GOF) für Überlebensmodelle zu erstellen. Sie können ihn nach vier Überlebensmodellen verwenden: rechtszensierte Cox (stcox), intervallzensierte Cox (stintcox), rechtszensierte parametrische (streg) und intervallzensierte parametrische (stintreg). Überprüfen Sie die Modellanpassung nach stratifizierten Modellen oder separat für jede Nebengruppe.

GOF-Diagramme bieten visuelle Überprüfungen, wie gut das Modell zu den Daten passt. In der Überlebensanalyse basieren diese Prüfungen auf den so genannten Cox-Snell-Residuen und der Annahme, dass diese Residuen bei einem korrekten Modell eine exponentielle Standardverteilung aufweisen sollten. Diese Annahme wird visuell beurteilt, indem die Residuen gegen ihre geschätzte kumulative Gefährdung aufgetragen werden – je näher die aufgetragenen Werte an der 45°-Linie liegen, desto besser ist die Anpassung (Cox und Snell 1968).

Wir wollen sehen, wie es funktioniert

Wir verwenden den Datensatz von 103 Patienten, die in das Herztransplantationsprogramm von Stanford aufgenommen wurden (Crowley und Hu 1977). Der Datensatz enthält das Jahr, in dem der Patient in das Programm aufgenommen wurde (Jahr), das Alter des Patienten (Alter), ob der Patient zuvor eine andere Herzoperation hatte (Operation) und ob der Patient ein Transplantat erhielt (posttran). Wir wollen die Zeit bis zum Tod analysieren und prüfen, ob unser Modell gut zu den Daten passt. Wir passen zunächst ein Cox-Modell an, indem wir Folgendes eingeben

Vergleicht man die blaue Linie mit der schwarzen Referenzlinie, kommt man zu dem Schluss, dass unser Cox-Modell gut zu den Daten passt.

Für rechtszensierte Daten können wir anstelle des Standard-Nelson-Aalen-Schätzers (Nelson 1972; Aalen 1978) die Option km verwenden, um den alternativen Minus-Log des Kaplan-Meier-Schätzers (Kaplan und Meier 1958) zu verwenden.

Passen wir nun ein stratifiziertes Cox-Modell an, das davon ausgeht, dass sich die Basis-Hazard-Funktionen zwischen Patienten aus verschiedenen Gruppen (pgroup) unterscheiden, die Koeffizienten in diesen Gruppen jedoch gleich sind.

Das Modell passt in allen Schichten gut zu den Daten. Die rote Linie für pgroup = 2 weicht zum Ende hin von der Referenzlinie ab. Dies ist in der Praxis nicht ungewöhnlich, da zum Ende der Studie hin weniger Beobachtungen für die Schätzung zur Verfügung stehen.

Um die visuelle Inspektion des Diagramms zu erleichtern, können wir auch die Option separate hinzufügen, um separate Diagramme für jede Schicht zu erstellen.

. estat gofplot, stratify separate
GOF-Diagramme für intervallzensierte Daten

Wir verwenden den Datensatz einer Studie für Brustkrebspatientinnen im Frühstadium (Finkelstein und Wolfe 1985), in der die kosmetischen Auswirkungen von zwei Krebsbehandlungen (treat) auf die Brustretraktion verglichen werden. Da die Patientinnen zu zufälligen Nachuntersuchungszeitpunkten beobachtet wurden, wurde der genaue Zeitpunkt der Brustretraktion nicht beobachtet und war nur für das Intervall zwischen den Besuchen bekannt (Variablen ltime und rtime). Zunächst passten wir ein intervallzensiertes Weibull-Modell der Zeit bis zur Brustretraktion bei Behandlung mit stintreg an:

Bei intervallzensierten Daten werden Cox-Snell-ähnliche Residuen definiert und zum Plotten verwendet (Farrington 2000). Wenn ein Modell gut zu den Daten passt, sollten sich diese Residuen der zensierten Standard-Exponentialverteilung annähern. Auch der nichtparametrische Turnbull-Schätzer (Turnbull 1976) wird zur Schätzung des kumulativen Risikos verwendet.

Die gezackte Linie bleibt im obigen Diagramm nahe an der Referenzlinie, was darauf hindeutet, dass das Weibull-Modell gut zu den Daten passt.

Nehmen wir an, dass wir nun ein Exponentialmodell anpassen und dessen Modellanpassung überprüfen wollen. Wir geben ein

. quietly stintreg i.treat, interval(ltime rtime) distribution(exponential)
. estat gofplot

Vergleicht man dieses GOF-Diagramm mit dem obigen, kann man sehen, dass das Weibull-Modell besser zu unseren Daten passt als das Exponentialmodell.

Referenzen

Aalen, O. O. 1978. Nichtparametrische Inferenz für eine Familie von Zählprozessen. Annals of Statistics 6: 701-726. https://doi.org/10.1214/aos/1176344247.

Cox, D. R., und E. J. Snell. 1968. Eine allgemeine Definition von Residuen (mit Diskussion). Zeitschrift der Royal Statistical Society, Serie B 30: 248-275.

Crowley, J., und M. Hu. 1977. Kovarianzanalyse der Überlebensdaten von Herztransplantationen. Zeitschrift der American Statistical Association 72: 27-36.

Farrington, C. P. 2000. Residuen für proportionale Gefährdungsmodelle mit intervallzensierten Überlebensdaten. Biometrics 56: 473-482.

Finkelstein, D. M., und R. A. Wolfe. 1985. Ein semiparametrisches Modell für die Regressionsanalyse von intervallzensierten Ausfallzeitdaten. Biometrics 41: 933-945.

Kaplan, E. L., und P. Meier. 1958. Nichtparametrische Schätzung aus unvollständigen Beobachtungen. Zeitschrift der Amerikanischen Statistischen Vereinigung 53: 457-481.

Nelson, W. 1972. Theory and applications of hazard plotting for censored failure data. Technometrics 14: 945-966.

Turnbull, B. W. 1976. Die empirische Verteilungsfunktion mit willkürlich gruppierten, zensierten und abgeschnittenen Daten. Journal of the Royal Statistical Society, Serie B 38: 290-295.