New In 
ТВК з інтервальною цензурою моделі Кокса
У Stata 17 введено команду stintcox для підбору справжніх напівпараметричних моделей Кокса до даних про час подій з інтервальною цензурою. У Stata 18 додано підтримку змінних у часі коваріатів (TVC), які зазвичай використовуються на практиці для запису характеристик, що змінюються під час спостереження. Отже, якщо у вас є змінна біомаркера або політична змінна, яка змінюється з часом, тепер ви можете включити їх для моделювання подій, які вас цікавлять, якщо відомо, що вони відбуваються лише в межах певного часового інтервалу. Наприклад, такою подією може бути рецидив раку або зміна
Основні моменти
-
Нове в putdocx
-
Додайте закладки до абзаців і таблиць
-
Додайте альтернативний текст, який буде начитаний голосовим програмним забезпеченням для зображень
-
Додавати зображення у форматі масштабованої векторної графіки (.svg)
-
-
Нове в putexcel
-
Зупинити аркуш на певному рядку або стовпчику
-
Вставити розрив сторінки в певному рядку або стовпчику
-
Вставлення верхнього та нижнього колонтитулів на аркуші
-
Додавання гіперпосилань до клітинок
-
Створення іменованого діапазону клітинок
-
у статусі зайнятості, зафіксованому під час одного з подальших спостережень. Обидва приклади є прикладами даних з інтервальним цензуруванням часу події, в яких час події не спостерігається точно.
Використовуйте stintcox для автоматичного створення TVC шляхом взаємодії існуючих коваріатів із заданими детермінованими функціями часу або вкажіть власні TVC у новому форматі даних з множинними записами на суб’єкта. Використовуйте ТВК для перевірки припущення про пропорційність ризиків за допомогою тесту Вальда або тесту відношення ймовірностей. І включайте ТВК у свої прогнози, графіки виживання та інші функції.
Подивимося, як це працює
Перевірка припущення про пропорційність ризиків за допомогою ТВК
Тут ми демонструємо, як використовувати ТВК для перевірки припущення про пропорційні ризики в моделі Кокса. Наслідуючи Zeng та ін. (2016), ми використовуємо інтервальну регресію Кокса для моделювання часу до інфікування ВІЛ серед споживачів ін’єкційних наркотиків. Усі 1 124 респонденти спочатку мали негативний результат тесту на ВІЛ. За ними спостерігали та оцінювали серопозитивність на ВІЛ-1 за допомогою аналізів крові приблизно кожні чотири місяці. Оскільки суб’єкти здавали аналізи періодично, точний час інфікування ВІЛ не спостерігався, але було відомо, що він припадає на проміжки часу між аналізами крові. Відповідні нижня та верхня часові кінцеві точки зафіксовані у змінних ltime та rtime.
Базовими факторами, які ми використовуємо для моделювання серопозитивності ВІЛ-1, є центрований вік на момент рекрутингу (age_mean), стать (чоловіча), історія спільного використання шприців (needle), історія ін’єкційних наркотиків (inject), а також те, чи перебував суб’єкт у в’язниці на момент рекрутингу (jail). Нижче наведено підмножину даних для респондентів з 271 по 274 з одним записом на кожного респондента:

Ми застосовуємо модель пропорційних ризиків Кокса, в якій час до інфікування ВІЛ залежить від вищезазначених базових факторів. У форматі одного запису на суб’єкта ми вказуємо нижній і верхній інтервали часу настання подій в опції stintcox’а interval().

Ми виявили, що вік та перебування у в’язниці на момент вступу до програми пов’язані з нижчим та вищим ризиком інфікування ВІЛ відповідно.
Одним із способів перевірки припущення про пропорційність ризиків для коваріативної ознаки є перевірка того, чи є коефіцієнт, пов’язаний з цією коваріативною ознакою, інваріантним у часі. Цього можна досягти, включивши в модель взаємодію між цією змінною та функцією часу і перевіривши, чи дорівнює відповідний коефіцієнт нулю.
Щоб перевірити припущення про пропорційні ризики в нашому прикладі, ми включили всі коваріати в опцію tvc(), щоб додатково включити їх взаємодію з часом аналізу _t, за замовчуванням, в модель. У цьому аналізі ми пригнічуємо звітність про коефіцієнти ризику за замовчуванням за допомогою опції nohr:

Перше рівняння, основне, містить коефіцієнти для коваріатів, які не змінюються з часом; друге рівняння, tvc, містить результати для коваріатів, які взаємодіють з часом. І припущення про пропорційність ризиків, як видається, порушується для коваріатів male і jail відповідно до їхніх p-значень, наведених у рівнянні tvc. Тест Вальда внизу таблиці також вказує на те, що припущення про пропорційність ризиків не виконується в глобальному масштабі.
Підгонка інтервальної моделі Кокса з використанням TVC в даних з декількома записами
У попередньому прикладі ми використовували опцію tvc() stintcox для створення TVC для перевірки припущення про пропорційні ризики. У деяких додатках TVC вже існують у наборі даних. Продовжуючи розглядати дані про споживачів ін’єкційних наркотиків, перебування у в’язниці є такою ТВК. КТВ можна реєструвати лише у форматі даних з множинним записом на суб’єкта. У цьому форматі кожен суб’єкт може містити кілька записів з кількома періодами обстеження, статусом події на кожний момент обстеження та потенційними змінними, що змінюються в часі, на кожний момент обстеження.
Використаємо розширену версію idu2.dta попереднього набору даних idu.dta, яка містить усі базові коваріати, а також змінну індикатора ув’язнення, що змінюється в часі (jail_vary). jail_vary вказує на те, чи був суб’єкт ув’язнений з моменту останнього візиту до клініки. Набір даних також містить ідентифікатор суб’єкта (id), час проведення аналізу крові (time) та інформацію про те, чи був аналіз крові позитивним на момент обстеження (is_seropos). Нижче наведено підмножину цього набору даних для суб’єктів з 271 по 274 з кількома записами для кожного суб’єкта:

Ми використовуємо попередню модель Кокса, але тепер замість базової змінної jail використовуємо змінну jail_vary, яка змінюється в часі. У форматі множинних записів на суб’єкта ми вказуємо ідентифікатор суб’єкта в опції id(), час обстеження в опції time() і статус індикатора події в опції status().

Прокручуючи список до Північно-Центрального регіону, ми бачимо в середньому 47 436 шлюбів у кожному штаті; найбільше в Іллінойсі – 109 823.
Ми також можемо зберігати зведену статистику для кожного регіону на одному аркуші і посилатися на таблицю з іншого аркуша завдяки новій підтримці гіперпосилань. Ми можемо додатково налаштувати наш робочий аркуш, додавши верхній і нижній колонтитули або розрив сторінки. Дивіться [RPT] putexcel для отримання додаткової інформації.
Порівняно з попереднім прикладом, після того, як ми врахували ув’язнення з різною тривалістю, коефіцієнт ризику для ін’єкційних наркотиків збільшився з 1,25 до 1,37, але вплив ув’язнення зменшився з 1,57 для базового варіанту до 1,44 для варіанту jail_vary з різною тривалістю ув’язнення.
Побудова графіків функцій виживання
Після підгонки моделі ми можемо використати stcurve для побудови оціночної функції виживання, невдач, небезпеки або кумулятивної небезпеки. За замовчуванням stcurve оцінює функції за загальним середнім значенням коваріатів.
. stcurve, survival note: function evaluated at overall means of covariates.

У випадку даних з декількома записами з TVC, ми можемо захотіти врахувати змінну в часі природу цих коваріатів при побудові функцій. У цьому випадку ми можемо використати опцію attmeans, щоб оцінити функцію за певними часовими значеннями.
. stcurve, survival attmeans note: function evaluated at time-specific means of covariates.

Ми також можемо використати опцію atframe(), щоб вказати власні значення TVC, які будуть використані для оцінки функції виживання. Припустімо, що ми хочемо побудувати криву виживання для особи з таким самим коваріаційним патерном, як у досліджуваного 1 в нашому наборі даних. Ми створюємо новий фрейм під назвою id1 і використовуємо команду put для копіювання відповідної інформації для досліджуваного 1 в цей новий фрейм. Ми перелічимо дані, які ми щойно зберегли у фреймі id1.

Потім ми можемо побудувати криву виживання для цього конкретного профілю, ввівши
. stcurve, survival atframe(id1) note: function evaluated at specified values of selected covariates and overall means of other covariates (if any). note: covariate values from frame id1 used to evaluate function.

Посилання
Зенг, Д., Л. Мао та Д. Лін. 2016. Оцінка максимальної правдоподібності для моделей напівпараметричного перетворення з інтервальними цензурованими даними. Біометрика 103: 253-271.