Nou în

Model Cox cenzurat pe intervale

Adesea, datele privind timpul până la eveniment sau timpul de eșec sunt colectate la anumite ore de observare. Dar, uneori, evenimentul de interes nu este observat exact, dar se știe că se produce doar într-un interval de timp. De exemplu, un medic va detecta reapariția cancerului numai atunci când pacientul vine la clinică pentru o programare ulterioară, iar un epidemiolog care studiază perioada de incubație COVID-19 va ști doar infecția apărută înainte ca pacientul să prezinte simptome sau teste pozitiv pentru COVID-19. În statistici, date ca acestea sunt denumite date de eveniment-timp cenzurate pe intervale. Datele eveniment-timp cenzurate la intervale apar în multe domenii, inclusiv studii medicale, epidemiologice, financiare și sociologice. Ignorarea cenzurării intervalelor poate duce la estimări părtinitoare.
La fel ca în cazul datelor cenzurate de dreapta, modelul de pericole proporționale Cox este atrăgător pentru datele cenzurate în intervale, deoarece nu necesită parametrizarea funcției de pericol de referință și rată de evenimente scăzute, parametrii de regresie exponențiați aproximează riscurile relative ale jurnalului.
În Stata 17, noua comandă de estimare stintcox se potrivește modelelor de pericole proporționale Cox semiparametrice la datele eveniment-timp cenzurate pe intervale. Comanda poate analiza date care includ toate tipurile de cenzurare, inclusiv date de stare curentă, în care se știe că evenimentul de interes are loc numai înainte sau după un timp observat. De asemenea, susține stratificarea.

Repere

  • Modelare semiparametrică autentică
  • Stare curentă și date generale cenzurate la intervale
  • Estimare stratificată
  • Doi estimatori pentru pericolul inițial
  • Doi estimatori pentru erori standard
  • Grafice ale supraviețuitorului, pericol cumulativ și funcții de pericol
  • Diagnosticare reziduală
  • Verificări grafice ale asumării proporționale a pericolelor

Să vedem cum funcționează

  • Estimarea
  • Graficarea funcțiilor supraviețuitorului
  • Stratificarea
  • Verificarea presupunerii proporționale a pericolelor
  • Resurse aditionale

Estimarea

Folosim date de la Zeng, Mao și Lin (2016), care studiază timpul până la infecția cu HIV într-un studiu de cohortă asupra consumatorilor de droguri injectabile din Thailanda. Setul de date conține 1.124 de subiecți. Acești subiecți au fost testați inițial negativ pentru virusul HIV. Au fost apoi urmăriți și evaluați pentru seropozitivitatea HIV-1 prin teste de sânge aproximativ la fiecare patru luni. Deoarece subiecții au fost testați periodic, ora exactă a infecției cu HIV nu a fost observată, dar s-a știut că scade în intervale între testele de sânge cu punctele finale inferioare și superioare înregistrate în variabilele ltime și time.
Vrem să identificăm factorii care influențează timpul până la infectarea cu HIV. Factorii care ne interesează sunt vârsta la recrutare (vârstă), sex (bărbat), istoricul partajării acului(ac), istoricul injecției cu droguri (injectare) și dacă un subiect a fost în închisoare în momentul recrutării (închisoare).

. use https://www.stata-press.com/data/r17/bts
(Bangkok Tenofovir Study (BTS))

. describe

Contains data from https://www.stata-press.com/data/r17/bts.dta
 Observations:         1,124                  Bangkok Tenofovir Study (BTS)
    Variables:             8                  15 Dec 2020 13:34
                                              (_dta has notes)
Variable Storage Display Value
name type format label Variable label
age byte %8.0g Age (in years)
male byte %8.0g yesno Male
needle byte %8.0g yesno Shared needles
jail byte %8.0g yesno Imprisoned
inject byte %8.0g yesno Injected drugs before recruitment
ltime double %10.0g Last time seronegative for HIV-1
rtime double %10.0g First time seropositive for HIV-1
age_mean double %10.0g Centered age (in years)
Sortat de:

Ne potrivim unui model de riscuri proporționale Cox, în care timpul până la infecția cu HIV depinde de factorii de interes de mai sus. Pentru a face interpretarea funcției de risc de bază mai rezonabilă, vom folosi variabila de vârstă centrată, age_mean.

. stintcox age_mean i.male i.needle i.inject i.jail, interval(ltime rtime)
note: using adaptive step size to compute derivatives.

Performing EM optimization (showing every 100 iterations):
Iteration 0:    log likelihood = -1086.2564
Iteration 100:  log likelihood = -597.65634
Iteration 200:  log likelihood = -597.57555
Iteration 295:  log likelihood = -597.56443

Computing standard errors: ............................ done

Interval-censored Cox regression                    Number of obs     =  1,124
Baseline hazard: Reduced intervals                         Uncensored =      0
                                                        Left-censored =     41
                                                       Right-censored =    991
                                                       Interval-cens. =     92

                                                    Wald chi2(5)      =  17.10
Log likelihood = -597.56443                         Prob > chi2       = 0.0043
OPG
Haz. ratio std. err. z P>|z| [95% conf. interval]
age_mean .9684341 .0126552 -2.45 0.014 .9439452 .9935582
male
Yes .6846949 .1855907 -1.40 0.162 .4025073 1.164717
needle
Yes 1.275912 .2279038 1.36 0.173 .8990401 1.810768
inject
Yes 1.250154 .2414221 1.16 0.248 .8562184 1.825334
jail
Yes 1.567244 .3473972 2.03 0.043 1.014982 2.419998
Note: Standard-error estimates may be more variable for small datasets and datasets with low proportions of interval-censored observations.

Constatăm că vârsta la recrutare este asociată cu un risc mai scăzut de infecție cu HIV, iar aflarea în închisoare la înscriere este asociată cu un risc mai mare de infecție cu HIV. Alți factori nu sunt semnificativi statistic.

Graficarea funcțiilor supraviețuitorului

Putem realiza graficul curbei de supraviețuire de bază folosind stcurve cu toate covariabilele setate la 0.

. stcurve, survival at((zero) _all)

De asemenea, putem realiza graficul funcțiilor supraviețuitorului cu covariabile setate la orice valoare. Să presupunem că vrem să comparăm funcțiile supraviețuitorilor unui subiect mediu în grupurile feminine și masculine. Tastăm

. stcurve, survival at(male=(0 1))

Stratificarea

Dacă presupunem că funcția de risc de bază pentru femeie este diferită de cea pentru bărbați, putem încadra un model stratificat de riscuri proporționale Cox utilizând opțiunea strata():

. stintcox age_mean i.needle i.inject i.jail, interval(ltime rtime) strata(male)
note: using adaptive step size to compute derivatives.

Performing EM optimization (showing every 100 iterations):
Iteration 0:    log likelihood = -1087.0536
Iteration 100:  log likelihood = -585.59848
Iteration 200:  log likelihood = -585.53143
Iteration 282:  log likelihood =  -585.5222

Computing standard errors: ........................... done

Stratified interval-censored Cox regression
Baseline hazard: Reduced intervals

Strata variable: male                               Number of obs     =  1,124
                                                           Uncensored =      0
                                                        Left-censored =     41
                                                       Right-censored =    991
                                                       Interval-cens. =     92

                                                    Wald chi2(4)      =  14.84
Log likelihood = -585.5222                          Prob > chi2       = 0.0051
OPG
Haz. ratio std. err. z P>|z| [95% conf. interval]
age_mean .9682508 .0126326 -2.47 0.013 .9438052 .9933295
male
Yes 1.276222 .2270302 1.37 0.170 .9005422 1.808625
needle
Yes 1.245357 .2393768 1.14 0.254 .8544367 1.815131
inject
Yes 1.245357 .2393768 1.14 0.254 .8544367 1.815131
jail
Yes 1.57314 .3490687 2.04 0.041 1.018337 2.430205
Note: Standard-error estimates may be more variable for small datasets and datasets with low proportions of interval-censored observations.

Concluzia noastră aici este similară ca și în cazul fără stratificare.

Verificarea presupunerii proporționale a pericolelor

Este important să se evalueze validitatea ipotezei de bază pentru modelul de pericole proporționale Cox, care reprezintă faptul că raportul de pericol este constant în timp. Stata 17 oferă două noi comenzi grafice pentru a evalua presupunerea proporțională a pericolelor.
Pentru o singură covarianță categorică într-un model Cox, puteți utiliza stintphplot, care trasează curbele -ln {-ln (supraviețuire)} pentru fiecare categorie versus ln (timpul de analiză). Dacă curbele sunt paralele, presupunerea proporțională a pericolelor nu a fost încălcată. Alternativ, puteți utiliza stintcoxnp pentru a trasa curba de supraviețuire a estimării neparametrice a probabilității maxime comparativ cu curba de supraviețuire prevăzută de Cox pentru fiecare categorie. Când cele două curbe sunt apropiate, presupunerea riscurilor proporționale este valabilă.
Când un model Cox conține mai multe covariabile, așa cum s-a menționat în exemplul de mai sus, numai stintphplot este adecvat pentru testarea presupunerii proporționale a pericolelor. În acest caz, trebuie să folosim opțiunea adjustfor().
De exemplu, pentru a verifica presupunerea proporțională a riscurilor pentru injectare, includem toate covariabilele, cu excepția injectării, în opțiunea adjustfor():

. stintphplot, interval(ltime rtime) by(inject) adjustfor(age_mean i.male i.needle i.jail)

Un model Cox separat, care conține toate covariabilele din opțiunea adjustfor(), este potrivit pentru fiecare nivel de injectare. Iar cele două curbe sunt aproape paralele, ceea ce indică faptul că ipoteza proporțională a pericolelor nu a fost încălcată pentru variabila categorică injectată.

Referință

Zeng, D., L. Mao și D. Lin. 2016. Estimarea maximă a probabilității pentru modelele de transformare semiparametrică cu date cenzurate pe intervale. Biometrika 103: 253-271.