New In

Покращення редактора до-файлів

Основні моменти

  • Параметричні та напівпараметричні моделі виживання

  • Дані з правою та інтервальною цензурою

  • Три оцінки для функції кумулятивної небезпеки

  • Групові та стратифіковані моделі

Stata 18 містить нову команду estat gofplot для побудови графіків відповідності (GOF) для моделей виживання. Ви можете використовувати її після чотирьох моделей виживання: Кокса з правою цензурою (stcox), Кокса з інтервальною цензурою (stintcox), параметричної з правою цензурою (streg) та параметричної з інтервальною цензурою (stintreg). Перевірте відповідність моделі після стратифікованих моделей або окремо для кожної підгрупи.

Графіки GOF забезпечують візуальну перевірку того, наскільки добре модель відповідає даним. В аналізі виживання ці перевірки базуються на так званих залишках Кокса-Снелла і припущенні, що, якщо модель правильна, ці залишки повинні мати стандартний експоненціальний розподіл. Візуально це припущення оцінюється шляхом побудови графіків залишків проти оціненої кумулятивної небезпеки – чим ближче значення на графіку до лінії 45°, тим краща відповідність (Cox and Snell 1968).

Подивимося, як це працює

Ми використовуємо набір даних про 103 пацієнтів, прийнятих до Стенфордської програми трансплантації серця (Crowley and Hu 1977). Набір даних включає рік, коли пацієнт був прийнятий до програми (year), вік пацієнта (age), чи були у пацієнта інші операції на серці раніше (surgery), і чи отримував пацієнт трансплантацію (posttran). Ми хочемо проаналізувати час до смерті і перевірити, чи добре наша модель відповідає даним. Спочатку ми підбираємо модель Кокса, ввівши

Порівнюючи синю лінію з чорною контрольною лінією, ми дійшли висновку, що наша модель Кокса добре відповідає даним.

Для даних з правою цензурою замість стандартної оцінки Нельсона-Аалена (Nelson 1972; Aalen 1978) ми можемо використати опцію km для використання альтернативного мінусового логарифму оцінки Каплана-Мейєра (Kaplan and Meier 1958).

Тепер застосуємо стратифіковану модель Кокса, яка припускає, що базові функції ризику відрізняються між пацієнтами з різних груп (pgroup), але коефіцієнти в цих групах однакові.

Модель добре узгоджується з даними у всіх стратах. Червона лінія для pgroup = 2 відхиляється від базової лінії до кінця. Це не рідкість на практиці, оскільки наприкінці дослідження стає менше спостережень для оцінювання.

Щоб полегшити візуальний огляд графіка, ми також можемо додати опцію separate, щоб створити окремі графіки для кожної страти.

. estat gofplot, stratify separate
Графіки GOF для даних з інтервальною цензурою

Ми використовуємо набір даних дослідження для пацієнток з ранніми стадіями раку молочної залози (Finkelstein and Wolfe 1985), в якому порівнюються косметичні ефекти двох методів лікування раку (treat) на ретракцію грудей. Оскільки пацієнтки спостерігалися у випадковий час спостереження, точний час ретракції молочної залози не спостерігався і було відомо лише, що він припадає на інтервал між візитами (змінні ltime і rtime). Спочатку ми підібрали інтервальну модель Вейбулла для визначення часу до втягування молочної залози під час лікування за допомогою stintreg:

Для даних з інтервальною цензурою визначаються залишки, подібні до залишків Кокса-Снелла, які використовуються для побудови графіків (Фаррінгтон, 2000). Якщо модель добре відповідає даним, ці залишки повинні наближатися до стандартного експоненціального розподілу з цензурою. Крім того, для оцінки кумулятивного ризику використовується непараметрична оцінка Тернбулла (Turnbull 1976).

На наведеному вище графіку нерівна лінія залишається близькою до базової лінії, що свідчить про те, що модель Вейбулла добре підходить до даних.

Припустимо, що тепер ми хочемо підібрати експоненціальну модель і перевірити її відповідність. Введемо

. quietly stintreg i.treat, interval(ltime rtime) distribution(exponential)
. estat gofplot

Порівнюючи цей графік GOF з наведеним вище, ми бачимо, що модель Вейбулла краще відповідає нашим даним, ніж експоненціальна модель.

Посилання

Аален, О. О. 1978. Непараметричний висновок для сімейства процесів підрахунку. Аннали статистики 6: 701-726. https://doi.org/10.1214/aos/1176344247.

Cox, D. R., and E. J. Snell. 1968. Загальне визначення залишків (з обговоренням). Журнал Королівського статистичного товариства, серія B 30: 248-275.

Crowley, J., and M. Hu. 1977. Коваріаційний аналіз даних про виживання після трансплантації серця. Журнал Американської статистичної асоціації 72: 27-36.

Farrington, C. P. 2000. Залишки для моделей пропорційних ризиків з інтервальними даними виживання. Біометрія 56: 473-482.

Фінкельштейн, Д. М. та Р. А. Вульф. 1985. Напівпараметрична модель для регресійного аналізу даних про час безвідмовної роботи з інтервальною цензурою. Біометрія 41: 933-945.

Каплан, Е. Л. та П. Майєр. 1958. Непараметричне оцінювання за неповними спостереженнями. Журнал Американської статистичної асоціації 53: 457-481.

Нельсон, В. 1972. Теорія та застосування побудови діаграм небезпеки для цензурованих даних про відмови. Technometrics 14: 945-966.

Turnbull, B. W. 1976. Емпірична функція розподілу з довільно згрупованими, цензурованими та усіченими даними. Журнал Королівського статистичного товариства, серія B 38: 290-295.