Nou în 
Model Cox cenzurat pe intervale
Adesea, datele privind timpul până la eveniment sau timpul de eșec sunt colectate la anumite ore de observare. Dar, uneori, evenimentul de interes nu este observat exact, dar se știe că se produce doar într-un interval de timp. De exemplu, un medic va detecta reapariția cancerului numai atunci când pacientul vine la clinică pentru o programare ulterioară, iar un epidemiolog care studiază perioada de incubație COVID-19 va ști doar infecția apărută înainte ca pacientul să prezinte simptome sau teste pozitiv pentru COVID-19. În statistici, date ca acestea sunt denumite date de eveniment-timp cenzurate pe intervale. Datele eveniment-timp cenzurate la intervale apar în multe domenii, inclusiv studii medicale, epidemiologice, financiare și sociologice. Ignorarea cenzurării intervalelor poate duce la estimări părtinitoare.
La fel ca în cazul datelor cenzurate de dreapta, modelul de pericole proporționale Cox este atrăgător pentru datele cenzurate în intervale, deoarece nu necesită parametrizarea funcției de pericol de referință și rată de evenimente scăzute, parametrii de regresie exponențiați aproximează riscurile relative ale jurnalului.
În Stata 17, noua comandă de estimare stintcox se potrivește modelelor de pericole proporționale Cox semiparametrice la datele eveniment-timp cenzurate pe intervale. Comanda poate analiza date care includ toate tipurile de cenzurare, inclusiv date de stare curentă, în care se știe că evenimentul de interes are loc numai înainte sau după un timp observat. De asemenea, susține stratificarea.
Repere
- Modelare semiparametrică autentică
- Stare curentă și date generale cenzurate la intervale
- Estimare stratificată
- Doi estimatori pentru pericolul inițial
- Doi estimatori pentru erori standard
- Grafice ale supraviețuitorului, pericol cumulativ și funcții de pericol
- Diagnosticare reziduală
- Verificări grafice ale asumării proporționale a pericolelor
Să vedem cum funcționează
- Estimarea
- Graficarea funcțiilor supraviețuitorului
- Stratificarea
- Verificarea presupunerii proporționale a pericolelor
- Resurse aditionale
Estimarea
Folosim date de la Zeng, Mao și Lin (2016), care studiază timpul până la infecția cu HIV într-un studiu de cohortă asupra consumatorilor de droguri injectabile din Thailanda. Setul de date conține 1.124 de subiecți. Acești subiecți au fost testați inițial negativ pentru virusul HIV. Au fost apoi urmăriți și evaluați pentru seropozitivitatea HIV-1 prin teste de sânge aproximativ la fiecare patru luni. Deoarece subiecții au fost testați periodic, ora exactă a infecției cu HIV nu a fost observată, dar s-a știut că scade în intervale între testele de sânge cu punctele finale inferioare și superioare înregistrate în variabilele ltime și time.
Vrem să identificăm factorii care influențează timpul până la infectarea cu HIV. Factorii care ne interesează sunt vârsta la recrutare (vârstă), sex (bărbat), istoricul partajării acului(ac), istoricul injecției cu droguri (injectare) și dacă un subiect a fost în închisoare în momentul recrutării (închisoare).
. use https://www.stata-press.com/data/r17/bts (Bangkok Tenofovir Study (BTS)) . describe Contains data from https://www.stata-press.com/data/r17/bts.dta Observations: 1,124 Bangkok Tenofovir Study (BTS) Variables: 8 15 Dec 2020 13:34 (_dta has notes)
Variable Storage Display Value | ||||||
name type format label Variable label | ||||||
age byte %8.0g Age (in years) | ||||||
male byte %8.0g yesno Male | ||||||
needle byte %8.0g yesno Shared needles | ||||||
jail byte %8.0g yesno Imprisoned | ||||||
inject byte %8.0g yesno Injected drugs before recruitment | ||||||
ltime double %10.0g Last time seronegative for HIV-1 | ||||||
rtime double %10.0g First time seropositive for HIV-1 | ||||||
age_mean double %10.0g Centered age (in years) | ||||||
Ne potrivim unui model de riscuri proporționale Cox, în care timpul până la infecția cu HIV depinde de factorii de interes de mai sus. Pentru a face interpretarea funcției de risc de bază mai rezonabilă, vom folosi variabila de vârstă centrată, age_mean.
. stintcox age_mean i.male i.needle i.inject i.jail, interval(ltime rtime) note: using adaptive step size to compute derivatives. Performing EM optimization (showing every 100 iterations): Iteration 0: log likelihood = -1086.2564 Iteration 100: log likelihood = -597.65634 Iteration 200: log likelihood = -597.57555 Iteration 295: log likelihood = -597.56443 Computing standard errors: ............................ done Interval-censored Cox regression Number of obs = 1,124 Baseline hazard: Reduced intervals Uncensored = 0 Left-censored = 41 Right-censored = 991 Interval-cens. = 92 Wald chi2(5) = 17.10 Log likelihood = -597.56443 Prob > chi2 = 0.0043
OPG | ||||||
Haz. ratio std. err. z P>|z| [95% conf. interval] | ||||||
age_mean | .9684341 .0126552 -2.45 0.014 .9439452 .9935582 | |||||
male | ||||||
Yes | .6846949 .1855907 -1.40 0.162 .4025073 1.164717 | |||||
needle | ||||||
Yes | 1.275912 .2279038 1.36 0.173 .8990401 1.810768 | |||||
inject | ||||||
Yes | 1.250154 .2414221 1.16 0.248 .8562184 1.825334 | |||||
jail | ||||||
Yes | 1.567244 .3473972 2.03 0.043 1.014982 2.419998 | |||||
Constatăm că vârsta la recrutare este asociată cu un risc mai scăzut de infecție cu HIV, iar aflarea în închisoare la înscriere este asociată cu un risc mai mare de infecție cu HIV. Alți factori nu sunt semnificativi statistic.
Graficarea funcțiilor supraviețuitorului
Putem realiza graficul curbei de supraviețuire de bază folosind stcurve cu toate covariabilele setate la 0.
. stcurve, survival at((zero) _all)

De asemenea, putem realiza graficul funcțiilor supraviețuitorului cu covariabile setate la orice valoare. Să presupunem că vrem să comparăm funcțiile supraviețuitorilor unui subiect mediu în grupurile feminine și masculine. Tastăm
. stcurve, survival at(male=(0 1))

Stratificarea
Dacă presupunem că funcția de risc de bază pentru femeie este diferită de cea pentru bărbați, putem încadra un model stratificat de riscuri proporționale Cox utilizând opțiunea strata():
. stintcox age_mean i.needle i.inject i.jail, interval(ltime rtime) strata(male) note: using adaptive step size to compute derivatives. Performing EM optimization (showing every 100 iterations): Iteration 0: log likelihood = -1087.0536 Iteration 100: log likelihood = -585.59848 Iteration 200: log likelihood = -585.53143 Iteration 282: log likelihood = -585.5222 Computing standard errors: ........................... done Stratified interval-censored Cox regression Baseline hazard: Reduced intervals Strata variable: male Number of obs = 1,124 Uncensored = 0 Left-censored = 41 Right-censored = 991 Interval-cens. = 92 Wald chi2(4) = 14.84 Log likelihood = -585.5222 Prob > chi2 = 0.0051
OPG | ||||||
Haz. ratio std. err. z P>|z| [95% conf. interval] | ||||||
age_mean | .9682508 .0126326 -2.47 0.013 .9438052 .9933295 | |||||
male | ||||||
Yes | 1.276222 .2270302 1.37 0.170 .9005422 1.808625 | |||||
needle | ||||||
Yes | 1.245357 .2393768 1.14 0.254 .8544367 1.815131 | |||||
inject | ||||||
Yes | 1.245357 .2393768 1.14 0.254 .8544367 1.815131 | |||||
jail | ||||||
Yes | 1.57314 .3490687 2.04 0.041 1.018337 2.430205 | |||||
Concluzia noastră aici este similară ca și în cazul fără stratificare.
Verificarea presupunerii proporționale a pericolelor
Este important să se evalueze validitatea ipotezei de bază pentru modelul de pericole proporționale Cox, care reprezintă faptul că raportul de pericol este constant în timp. Stata 17 oferă două noi comenzi grafice pentru a evalua presupunerea proporțională a pericolelor.
Pentru o singură covarianță categorică într-un model Cox, puteți utiliza stintphplot, care trasează curbele -ln {-ln (supraviețuire)} pentru fiecare categorie versus ln (timpul de analiză). Dacă curbele sunt paralele, presupunerea proporțională a pericolelor nu a fost încălcată. Alternativ, puteți utiliza stintcoxnp pentru a trasa curba de supraviețuire a estimării neparametrice a probabilității maxime comparativ cu curba de supraviețuire prevăzută de Cox pentru fiecare categorie. Când cele două curbe sunt apropiate, presupunerea riscurilor proporționale este valabilă.
Când un model Cox conține mai multe covariabile, așa cum s-a menționat în exemplul de mai sus, numai stintphplot este adecvat pentru testarea presupunerii proporționale a pericolelor. În acest caz, trebuie să folosim opțiunea adjustfor().
De exemplu, pentru a verifica presupunerea proporțională a riscurilor pentru injectare, includem toate covariabilele, cu excepția injectării, în opțiunea adjustfor():
. stintphplot, interval(ltime rtime) by(inject) adjustfor(age_mean i.male i.needle i.jail)

Un model Cox separat, care conține toate covariabilele din opțiunea adjustfor(), este potrivit pentru fiecare nivel de injectare. Iar cele două curbe sunt aproape paralele, ceea ce indică faptul că ipoteza proporțională a pericolelor nu a fost încălcată pentru variabila categorică injectată.
Referință
Zeng, D., L. Mao și D. Lin. 2016. Estimarea maximă a probabilității pentru modelele de transformare semiparametrică cu date cenzurate pe intervale. Biometrika 103: 253-271.