New In

Подобрения на редактора на досиета

Акценти

  • Параметрични и полупараметрични модели на оцеляване

  • Данни с дясно цензуриране и интервално цензуриране

  • Три оценки за кумулативната функция на риска

  • Модели по групи и стратифицирани модели

Stata 18 предоставя новата команда estat gofplot за създаване на графики на доброто напасване (GOF) за модели на оцеляване. Можете да я използвате след четири модела на оцеляване: Cox с десен цензур (stcox), Cox с интервален цензур (stintcox), параметричен с десен цензур (streg) и параметричен с интервален цензур (stintreg). Проверете пригодността на модела след стратифицирани модели или поотделно за всяка от групите.

GOF графиките осигуряват визуални проверки за това колко добре моделът съответства на данните. При анализа на преживяемостта тези проверки се основават на т.нар. остатъци на Кокс-Снел и предположението, че ако моделът е правилен, тези остатъци трябва да имат стандартно експоненциално разпределение. Визуално това предположение се оценява чрез съпоставяне на остатъците с оценената кумулативна опасност – колкото по-близо са нанесените стойности до линията 45°, толкова по-добро е съответствието (Cox and Snell 1968).

Нека видим как работи

Използваме набор от данни за 103 пациенти, приети в Програмата за трансплантация на сърце в Станфорд (Crowley and Hu 1977). Наборът от данни включва годината, в която пациентът е приет в програмата (year), възрастта на пациента (age), дали пациентът е имал преди това друга сърдечна операция (surgery) и дали пациентът е получил трансплантация (posttran). Искаме да анализираме времето до смъртта и да проверим дали нашият модел отговаря добре на данните. Първо въвеждаме модел на Кокс, като въвеждаме

Сравнявайки синята линия с черната референтна линия, стигаме до заключението, че нашият модел на Кокс отговаря добре на данните.

За данни с дясно цензуриране, вместо стандартната оценка на Нелсън-Аален (Nelson 1972; Aalen 1978), можем да използваме опцията km, за да използваме алтернативната минус логаритмична оценка на Каплан-Майер (Kaplan and Meier 1958).

Нека сега да приложим стратифициран модел на Кокс, който предполага, че изходните функции на опасност са различни за пациентите от различни групи (pgroup), но коефициентите са равни за тези групи.

Моделът отговаря добре на данните във всички слоеве. Червената линия за pgroup = 2 се отклонява от референтната линия към края. Това не е необичайно явление в практиката, тъй като към края на изследването има по-малко наблюдения за оценка.

За да подпомогнем визуалната проверка на графиката, можем да добавим и опцията separate, за да създадем отделни графики за всяка страта.

. estat gofplot, stratify separate
GOF диаграми за данни с интервално цензуриране

Използваме набор от данни от проучване за пациенти с ранен рак на гърдата (Finkelstein and Wolfe 1985), което сравнява козметичните ефекти на две лечения на рак (лечение) върху прибирането на гърдите. Тъй като пациентите са наблюдавани на случаен принцип, точното време на прибиране на гърдите не е наблюдавано и е известно само, че попада в интервала между посещенията (променливи ltime и rtime). Най-напред съставихме интервално цензуриран модел на Weibull за времето до прибиране на гърдата при лечението, като използвахме stintreg:

При данни с интервално цензуриране се дефинират остатъци, подобни на остатъците на Кокс-Снел, които се използват за изчертаване (Farrington 2000). Ако моделът пасва добре на данните, тези остатъци трябва да се доближават до цензурираното стандартно експоненциално разпределение. Също така за оценка на кумулативната опасност се използва непараметричната оценка на Turnbull (Turnbull 1976).

В горната графика неравната линия остава близо до референтната линия, което показва, че моделът на Weibull отговаря добре на данните.

Да предположим, че сега искаме да приложим експоненциален модел и да проверим неговото съответствие. Въвеждаме

. quietly stintreg i.treat, interval(ltime rtime) distribution(exponential)
. estat gofplot

Сравнявайки тази GOF диаграма с горната, можем да видим, че моделът на Weibull отговаря по-добре на нашите данни, отколкото експоненциалният модел.

Препратки

Aalen, O. O. 1978 г. Непараметричен извод за семейство процеси на броене. Annals of Statistics 6: 701-726. https://doi.org/10.1214/aos/1176344247.

Cox, D. R., and E. J. Snell. 1968. A general definition of residuals (with discussion). Journal of the Royal Statistical Society, Series B 30: 248-275.

Crowley, J. и M. Hu. 1977. Ковариационен анализ на данни за преживяемостта при сърдечна трансплантация. Journal of the American Statistical Association 72: 27-36.

Farrington, C. P. 2000. Остатъчни стойности за модели на пропорционални опасности с интервално цензурирани данни за оцеляване. Biometrics 56: 473-482.

Финкелщайн, Д. М. и Р. А. Улф. 1985. Полупараметричен модел за регресионен анализ на интервално цензурирани данни за времето на отказ. Biometrics 41: 933-945.

Каплан, Е. Л. и П. Майер. 1958. Nonparametric estimation from incomplete observations (Непараметрична оценка от непълни наблюдения). Journal of the American Statistical Association 53: 457-481.

Нелсън, У. 1972 г. Теория и приложения на графиката на риска за цензурирани данни за неуспех. Технометрия 14: 945-966.

Търнбул, Б. У. 1976 г. Емпиричната функция на разпределение с произволно групирани, цензурирани и съкратени данни. Journal of the Royal Statistical Society, Series B 38: 290-295.