New In 
TVC с интервално цензуриран модел на Кокс
В Stata 17 е въведена командата stintcox за напасване на истински полупараметрични модели на Кокс към данни с интервално цензуриране на времето на събитието. В Stata 18 е добавена поддръжка на променливи във времето ковариати (TVCs), често използвани в практиката за записване на характеристики, които се променят по време на проследяването. Така че, независимо дали имате променлива за биомаркер или променлива за политика, която се променя с времето, сега можете да ги включите, за да моделирате събития от интерес, за които се знае, че се намират само в рамките на някакъв интервал от време. Например, събитието може да бъде повторна поява на рак или промяна
Акценти
-
Ново в putdocx
-
Включване на отметки в параграфи и таблици
-
Включете алтернативен текст, който да се чете от гласов софтуер за изображения
-
Включете изображения с мащабируема векторна графика (.svg)
-
-
Ново в putexcel
-
Замразяване на работен лист в определен ред или колона
-
Вмъкване на прекъсване на страницата в определен ред или колона
-
Вмъкване на заглавие и колонтитул в работен лист
-
Включване на хипервръзки в клетките
-
Създаване на именуван диапазон от клетки
-
в трудовия статус, регистриран по време на едно от проследяванията. И двата случая са примери за интервално цензурирани данни за времето на събитието, при които времето на събитието не се наблюдава точно.
Използвайте stintcox, за да създадете автоматично TVCs чрез взаимодействие на съществуващи ковариати с определени детерминистични функции на времето или посочете свои собствени TVCs в новия формат за данни с множество записи за всеки субект. Използвайте TVCs, за да тествате предположението за пропорционални рискове с теста на Wald или теста за съотношение на вероятност. Включете TVC в прогнозите и графиките на функциите на оцеляването и други функции.
Нека видим как работи
Проверка на предположението за пропорционални рискове с помощта на TVC
Тук демонстрираме как да използваме TVCs за проверка на предположението за пропорционални рискове на модела на Кокс. Следвайки Zeng et al. (2016), използваме интервално цензурирана регресия на Кокс, за да моделираме времето до заразяването с ХИВ на инжекционно употребяващи наркотици. Всички 1 124 участници първоначално са тествани за ХИВ с отрицателен резултат. Те са били проследявани и оценявани за серопозитивност към ХИВ-1 чрез кръвни тестове приблизително на всеки четири месеца. Тъй като субектите са били тествани периодично, не е наблюдавано точното време на заразяване с ХИВ, но е известно, че времето попада в интервалите между кръвните тестове. Съответните долни и горни крайни точки на времето са записани в променливите ltime и rtime.
Базовите фактори, които използваме за моделиране на серопозитивността към ХИВ-1, са центрирана възраст при набирането (age_mean), пол (мъж), история на споделяне на игли (needle), история на инжектиране на наркотици (inject) и дали субектът е бил в затвора по време на набирането (jail). Тук е представено подмножество на набора от данни за субекти от 271 до 274 с по един запис за субект:

Приложихме модел на Кокс с пропорционални опасности, в който времето до заразяването с ХИВ зависи от горепосочените базови фактори. Във формат един запис на субект посочваме долния и горния интервал на времето на събитието в опцията interval() на stintcox.

Установихме, че възрастта и престоят в затвора в момента на записване са свързани съответно с по-нисък и по-висок риск от заразяване с ХИВ.
Един от начините за проверка на предположението за пропорционални рискове за дадена ковариация е да се провери дали коефициентът, свързан с тази ковариация, е инвариантен във времето. Това може да се постигне, като се включи в модела взаимодействие между тази ковариация и функция на времето и се провери дали съответният коефициент е равен на нула.
За да тестваме предположението за пропорционални рискове в нашия пример, включваме всички ковариати в опцията tvc(), за да включим допълнително в модела взаимодействието им с времето за анализ _t, което е по подразбиране. В този анализ потискаме отчитането по подразбиране на съотношенията на риска с опцията nohr:

Първото уравнение, main, представя коефициентите за ковариатите, които не се променят във времето; второто уравнение, tvc, представя резултатите за ковариатите, взаимодействащи с времето. А предположението за пропорционални рискове изглежда е нарушено за ковариатите мъж и затворник според техните р-стойности, отчетени в уравнението tvc. Тестът на Уолд в долната част на таблицата също показва, че предположението за пропорционални рискове не е валидно в световен мащаб.
Приспособяване на интервално цензуриран модел на Кокс с помощта на TVC при данни с множество записи
В предишния пример използвахме опцията tvc() на stintcox, за да създадем TVC за проверка на предположението за пропорционални рискове. В някои приложения TVC вече съществуват в набора от данни. Ако продължим с данните за инжекционно употребяващите наркотици, попадането в затвора е TVC. TVC могат да се записват само във формат за данни с множество записи за всеки субект. В този формат всеки субект може да съдържа множество записи с множество времена на изследване, състоянието на събитието във всяко време на изследване и потенциални променливи във времето ковариати във всяко време на изследване.
Нека да използваме разширена версия, idu2.dta, на предишния набор от данни idu.dta, който съдържа всички изходни ковариати, както и променлива индикаторна променлива за лишаване от свобода, която се променя във времето (jail_vary). jail_vary показва дали субектът е бил лишен от свобода след последното посещение в клиниката. В набора от данни се записват също идентификаторът на субекта (id), времето на изследване на кръвния тест (time) и дали кръвният тест е положителен в момента на изследването (is_seropos). Тук е представено подмножество на този набор от данни за субекти от 271 до 274 с множество записи за всеки субект:

Преизчисляваме предишния модел на Кокс, но вече използваме променливата jail_vary, която се променя във времето, вместо базовата променлива jail. Във формат с множество записи за всеки субект посочваме идентификатора на субекта в опцията id(), времето на изследването в опцията time() и състоянието на индикатора за събитие в опцията status().

Когато преминем към Северния централен регион, виждаме, че всеки щат е сключил средно по 47 436 брака; в Илинойс те са най-много – 109 823.
Можем също така да съхраняваме обобщени статистически данни за всеки регион в един работен лист и да правим хипервръзки към таблицата от друг лист с новата поддръжка на хипервръзки. Бихме могли да персонализираме работния си лист допълнително, като включим заглавие, колонтитул или прекъсване на страницата. Вижте [RPT] putexcel за повече информация.
В сравнение с предишния пример, след като отчетем променливото във времето лишаване от свобода, коефициентът на опасност за инжектиране се увеличава от 1,25 на 1,37, но ефектът от лишаването от свобода намалява от 1,57 за базовия затвор до 1,44 за променливия във времето затвор_vary.
Графично представяне на функциите на оцелелите
След като сме напаснали модела, можем да използваме stcurve, за да изобразим оценената функция на оцеляване, отказ, опасност или кумулативна опасност. По подразбиране stcurve оценява функциите при общите средни стойности на ковариатите.
. stcurve, survival note: function evaluated at overall means of covariates.

При данни от множество записи с TVC може да искаме да включим променливото във времето естество на тези ковариати, когато чертаем функциите. В този случай можем да използваме опцията attmeans, за да оценим функцията по средни стойности, специфични за времето.
. stcurve, survival attmeans note: function evaluated at time-specific means of covariates.

Можем също така да използваме опцията atframe(), за да зададем собствени стойности на TVC, които да се използват за оценка на функцията survivor. Да предположим, че искаме да начертаем кривата на оцеляване за индивид със същия модел на ковариативност като субект 1 в нашата съвкупност от данни. Създаваме нова рамка, наречена id1, и използваме frame put, за да копираме съответната информация за субект 1 в тази нова рамка. Изброяваме данните, които току-що записахме в рамка id1.

След това можем да изобразим кривата на оцеляването за този конкретен профил, като въведем
. stcurve, survival atframe(id1) note: function evaluated at specified values of selected covariates and overall means of other covariates (if any). note: covariate values from frame id1 used to evaluate function.

Справка
Zeng, D., L. Mao и D. Lin. 2016. Максимално правдоподобна оценка за полупараметрични модели на трансформация с данни с интервално цензуриране. Biometrika 103: 253-271.