New In 
TVC-uri cu modelul Cox cu cenzură de interval
Stata 17 a introdus comanda stintcox pentru a ajusta modelele Cox semiparametrice autentice la date de evenimente-timp cu cenzură de interval. Stata 18 adaugă suport pentru covariatele variabile în timp (TVC), utilizate în mod obișnuit în practică pentru a înregistra caracteristicile care se modifică în timpul urmăririi. Așadar, fie că aveți o variabilă de biomarker sau o variabilă de politică care se modifică în timp, le puteți include acum pentru a modela evenimente de interes despre care se știe că se situează doar într-un anumit interval de timp. De exemplu, evenimentul poate fi o recidivă a cancerului sau o schimbare
Repere
-
Nou în putdocx
-
Includeți semne de carte în paragrafe și tabele
-
Includeți text alternativ pentru a fi citit de un software vocal pentru imagini
-
Includeți imagini Scalable Vector Graphics (.svg)
-
-
Nou în putexcel
-
Înghețați o foaie de lucru la un anumit rând sau coloană
-
Introduceți o pauză de pagină la un anumit rând sau coloană
-
Introduceți un antet și un subsol într-o foaie de lucru
-
Includeți hyperlink-uri în celule
-
Crearea unui interval de celule cu nume
-
în ceea ce privește statutul de ocupare a forței de muncă înregistrat în timpul uneia dintre monitorizările ulterioare. Ambele sunt exemple de date eveniment-timp cu cenzură de interval, în care momentul evenimentului nu este observat cu exactitate.
Utilizați stintcox pentru a crea automat TVC-uri prin interacțiunea covariatelor existente cu funcții deterministe specificate ale timpului sau specificați propriile TVC-uri în noul format de date cu înregistrări multiple pe subiect. Utilizați TVC pentru a testa ipoteza riscurilor proporționale cu ajutorul testului Wald sau al testului likelihood-ratio. Și încorporați TVC-uri în predicțiile și graficele funcțiilor de supraviețuire și ale altor funcții.
Să vedem cum funcționează
Testarea ipotezei riscurilor proporționale cu ajutorul TVC-urilor
Aici demonstrăm cum să folosim TVC-uri pentru a testa ipoteza riscurilor proporționale a unui model Cox. Urmând modelul lui Zeng et al. (2016), folosim o regresie Cox cenzurată pe intervale pentru a modela timpul până la infectarea cu HIV a consumatorilor de droguri injectabile. Toți cei 1 124 de subiecți au fost inițial testați negativ pentru HIV. Aceștia au fost urmăriți și evaluați pentru depistarea seropozitivității HIV-1 prin teste de sânge la aproximativ fiecare patru luni. Deoarece subiecții au fost testați periodic, nu a fost observat momentul exact al infecției cu HIV, dar se știa că timpii se încadrează în intervalele dintre testele de sânge. Punctele finale de timp inferioare și superioare corespunzătoare sunt înregistrate în variabilele ltime și rtime.
Factorii de bază pe care îi folosim pentru a modela seropozitivitatea HIV-1 sunt vârsta centrată la recrutare (age_mean), sexul (bărbat), istoricul de partajare a acelor (needle), istoricul de injectare a drogurilor (inject) și dacă un subiect a fost în închisoare la momentul recrutării (jail). Iată un subset al setului de date pentru subiecții 271 până la 274, cu o înregistrare pentru fiecare subiect:

Am adaptat un model Cox cu hazard proporțional în care timpul până la infecția cu HIV depinde de factorii de bază de mai sus. Într-un format cu o singură înregistrare pe subiect, specificăm intervalele de timp de eveniment inferior și superior în opțiunea interval() din stintcox.

Am constatat că vârsta și faptul de a fi în închisoare în momentul înscrierii par să fie asociate cu riscuri mai mici și, respectiv, mai mari de infectare cu HIV.
O modalitate de a testa ipoteza riscurilor proporționale pentru o covariantă este de a testa dacă coeficientul asociat cu acea covariantă este invariant în timp. Acest lucru poate fi realizat prin includerea în model a unei interacțiuni între această covariantă și o funcție a timpului și prin testarea dacă coeficientul corespunzător este egal cu zero.
Pentru a testa ipoteza riscurilor proporționale în exemplul nostru, includem toate covariatele în opțiunea tvc() pentru a include în plus în model interacțiunile acestora cu timpul de analiză _t, implicit, în modelul. În această analiză, suprimăm raportarea implicită a rapoartelor de hazard cu opțiunea nohr:

Prima ecuație, main, raportează coeficienții pentru covariatele care nu variază în timp; a doua ecuație, tvc, raportează rezultatele pentru covariatele care interacționează cu timpul. Iar ipoteza riscurilor proprționale pare să fie încălcată pentru covariatele bărbat și închisoare, conform valorilor p raportate în ecuația tvc. Testul Wald din partea de jos a tabelului indică, de asemenea, faptul că ipoteza hazardului proporțional nu este valabilă la nivel global.
Ajustarea unui model Cox cu interval de cenzură folosind TVC-uri în date cu înregistrări multiple
În exemplul anterior, am folosit opțiunea tvc() a lui stintcox pentru a crea TVC-uri pentru a testa ipoteza riscurilor proporționale. În unele aplicații, TVC-urile există deja în setul de date. Continuând cu datele privind consumatorii de droguri injectabile, faptul de a fi în închisoare este un TVC. TVC-urile pot fi înregistrate numai în formatul de date cu înregistrări multiple pe subiect. În acest format, fiecare subiect poate conține mai multe înregistrări cu mai multe momente de examinare, starea evenimentului la fiecare moment de examinare și covariate potențiale care variază în timp la fiecare moment de examinare.
Să folosim o versiune extinsă, idu2.dta, a setului de date idu.dta anterior, care conține toate covariatele de bază, precum și o variabilă indicatoare de încarcerare care variază în timp (jail_vary). jail_vary indică dacă subiectul a fost încarcerat de la ultima vizită la clinică. Setul de date înregistrează, de asemenea, un identificator al subiectului (id), momentul examinării testului de sânge (time) și dacă testul de sânge este pozitiv la momentul examinării (is_seropos). Iată un subset al acestui set de date pentru subiecții 271 până la 274, cu înregistrări multiple pentru fiecare subiect:

Am refăcut modelul Cox anterior, dar acum folosim variabila variabilă în timp jail_vary în loc de variabila de bază jail. Într-un format cu mai multe înregistrări pentru fiecare subiect, specificăm identificatorul subiectului în opțiunea id(), ora examinării în opțiunea time() și starea indicatorului de eveniment în opțiunea status().

Dacă ne deplasăm în jos, în regiunea Nord-Centrală, observăm o medie de 47.436 de căsătorii pe stat; Illinois a avut cele mai multe, 109.823 de căsătorii.
Am putea, de asemenea, să stocăm statisticile sumare pentru fiecare regiune într-o foaie de lucru și să facem un hyperlink către tabel dintr-o altă foaie cu noul suport pentru hyperlink-uri. Am putea personaliza și mai mult foaia de lucru prin includerea unui antet, a unui picior de pagină sau a unei pauze de pagină. Pentru mai multe informații, consultați [RPT] putexcel.
Comparativ cu exemplul anterior, după ce luăm în considerare încarcerarea variabilă în timp, raportul de risc pentru injectare crește de la 1,25 la 1,37, dar efectul încarcerării scade de la 1,57 pentru închisoarea de bază la 1,44 pentru jail_vary variabilă în timp.
Reprezentarea grafică a funcțiilor de supraviețuire
După ajustarea modelului, putem utiliza stcurve pentru a reprezenta grafic funcția estimată de supraviețuire, de eșec, de hazard sau de hazard cumulat. În mod implicit, stcurve evaluează funcțiile la mediile globale ale covariatelor.
. stcurve, survival note: function evaluated at overall means of covariates.

În cazul datelor cu înregistrări multiple cu TVC, este posibil să dorim să încorporăm natura variabilă în timp a acestor covariate atunci când trasăm funcțiile. În acest caz, putem utiliza opțiunea attmeans pentru a evalua funcția la medii specifice în funcție de timp.
. stcurve, survival attmeans note: function evaluated at time-specific means of covariates.

De asemenea, putem utiliza opțiunea atframe() pentru a specifica propriile valori TVC care să fie utilizate pentru evaluarea funcției de supraviețuire. Să presupunem că dorim să reprezentăm grafic curba supraviețuitorului pentru un individ cu același model de covariate ca și subiectul 1 din setul nostru de date. Creăm un nou cadru numit id1 și folosim frame put pentru a copia informațiile relevante pentru subiectul 1 în acest nou cadru. Enumerăm datele pe care tocmai le-am salvat în cadrul id1.

Apoi, putem reprezenta grafic curba de supraviețuire pentru acest profil specific, tastând
. stcurve, survival atframe(id1) note: function evaluated at specified values of selected covariates and overall means of other covariates (if any). note: covariate values from frame id1 used to evaluate function.

Reference
Zeng, D., L. Mao și D. Lin. 2016. Estimarea cu maximă verosimilitate pentru modelele de transformare semiparametrice cu date cenzurate în intervale. Biometrika 103: 253-271.