New In

Vylepšení editoru souborů Do

Nejdůležitější informace

  • Parametrické a semiparametrické modely přežití

  • Data s pravostranným a intervalovým cenzorováním

  • Tři odhady kumulativní funkce rizika

  • Modely podle skupin a stratifikované modely

Stata 18 nabízí nový příkaz estat gofplot, který umožňuje vytvářet grafy dobré shody (GOF) pro modely přežití. Můžete jej použít po čtyřech modelech přežití: Coxův model s pravostranným cenzorováním (stcox), Coxův model s intervalovým cenzorováním (stintcox), parametrický model s pravostranným cenzorováním (streg) a parametrický model s intervalovým cenzorováním (stintreg). Zkontrolujte vhodnost modelu po stratifikovaných modelech nebo samostatně pro každou podskupinu.

Grafy GOF poskytují vizuální kontrolu toho, jak dobře model odpovídá datům. V analýze přežití jsou tyto kontroly založeny na takzvaných Cox-Snellových reziduích a předpokladu, že pokud je model správný, měla by tato rezidua mít standardní exponenciální rozdělení. Vizuálně se tento předpoklad posuzuje vynesením reziduí do grafu proti odhadovanému kumulativnímu nebezpečí – čím blíže jsou vynesené hodnoty k přímce 45°, tím lépe odpovídají (Cox a Snell 1968).

Podívejme se, jak to funguje

Používáme soubor dat o 103 pacientech přijatých do Stanfordského programu transplantace srdce (Crowley a Hu 1977). Soubor dat obsahuje rok přijetí pacienta do programu (rok), věk pacienta (věk), zda pacient dříve podstoupil jinou operaci srdce (operace) a zda pacient podstoupil transplantaci (posttran). Chceme analyzovat dobu do úmrtí a ověřit, zda náš model dobře odpovídá údajům. Nejprve sestavíme Coxův model zadáním příkazu

Porovnáme-li modrou čáru s černou referenční čárou, dojdeme k závěru, že náš Coxův model dobře odpovídá datům.

Pro data s pravostranným cenzorováním můžeme místo výchozího Nelson-Aalenova odhadu (Nelson 1972; Aalen 1978) použít možnost km a použít alternativní minus log Kaplan-Meierův odhad (Kaplan a Meier 1958).

Nyní dosaďme stratifikovaný Coxův model, který předpokládá, že základní funkce nebezpečí se liší mezi pacienty z různých skupin (pgroup), ale koeficienty jsou v těchto skupinách stejné.

Model dobře odpovídá údajům ve všech vrstvách. Červená přímka pro skupinu p = 2 se ke konci odchyluje od referenční přímky. To se v praxi nezřídka stává, protože ke konci studie je k dispozici méně pozorování pro odhad.

Pro usnadnění vizuální kontroly grafu můžeme také přidat volbu separate, která vytvoří samostatné grafy pro každou vrstvu.

. estat gofplot, stratify separate
Grafy GOF pro data s intervalovou cenzurou

Používáme soubor dat ze studie u pacientek s časnou rakovinou prsu (Finkelstein a Wolfe 1985), která srovnává kosmetické účinky dvou způsobů léčby rakoviny (léčba) na vtažení prsu. Vzhledem k tomu, že pacientky byly sledovány v náhodných časech sledování, nebyl sledován přesný čas vtažení prsu a bylo známo pouze to, že spadá do intervalu mezi návštěvami (proměnné ltime a rtime). Nejprve jsme pomocí stintreg sestavili intervalově cenzurovaný Weibullův model doby do retrakce prsu při léčbě:

U intervalově cenzorovaných dat se definují rezidua podobná Cox-Snellovým a používají se pro vykreslení (Farrington 2000). Pokud model dobře vyhovuje datům, měla by se tato rezidua blížit cenzorovanému standardnímu exponenciálnímu rozdělení. K odhadu kumulativního rizika se používá také neparametrický Turnbullův odhad (Turnbull 1976).

Zubatá čára zůstává ve výše uvedeném grafu blízko referenční čáry, což naznačuje, že Weibullův model dobře vyhovuje datům.

Předpokládejme, že nyní chceme dosadit exponenciální model a ověřit jeho vhodnost. Zadáme

. quietly stintreg i.treat, interval(ltime rtime) distribution(exponential)
. estat gofplot

Porovnáme-li tento graf GOF s výše uvedeným, vidíme, že Weibullův model odpovídá našim datům lépe než exponenciální model.

Odkazy

Aalen, O. O. 1978. Neparametrická inference pro rodinu počítacích procesů. Annals of Statistics 6: 701-726. https://doi.org/10.1214/aos/1176344247.

Cox, D. R. a E. J. Snell. 1968. Obecná definice reziduí (s diskusí). Journal of the Royal Statistical Society, Series B 30: 248-275.

Crowley, J. a M. Hu. 1977. Kovarianční analýza údajů o přežití po transplantaci srdce. Journal of the American Statistical Association 72: 27-36.

Farrington, C. P. 2000. Residuals for proportional hazards models with interval-censored survival data [Rezidua pro modely proporcionálních rizik s intervalově cenzorovanými daty o přežití]. Biometrics 56: 473-482.

Finkelstein, D. M. a R. A. Wolfe. 1985. A semiparametric model for regression analysis of interval-censored failure time data [Semiparametrický model pro regresní analýzu intervalově cenzorovaných dat o době přežití]. Biometrics 41: 933-945.

Kaplan, E. L. a P. Meier. 1958. Nonparametric estimation from incomplete observations (Neparametrický odhad z neúplných pozorování). Journal of the American Statistical Association 53: 457-481.

Nelson, W. 1972. Theory and applications of hazard plotting for censored failure data [Teorie a aplikace vykreslení rizika pro cenzorovaná data o selhání]. Technometrics 14: 945-966.

Turnbull, B. W. 1976. Empirická distribuční funkce s libovolně seskupenými, cenzorovanými a zkrácenými daty. Journal of the Royal Statistical Society, Series B 38: 290-295.