New In 
TVC s intervalově cenzurovaným Coxovým modelem
Stata 17 zavedla příkaz stintcox, který umožňuje fitovat skutečné semiparametrické Coxovy modely na data s intervalovou cenzurou. Stata 18 přidává podporu pro časově proměnné kovariáty (TVC), které se v praxi běžně používají k záznamu charakteristik, které se během sledování mění. Ať už tedy máte proměnnou biomarkeru nebo proměnnou politiky, která se mění v čase, můžete je nyní zahrnout do modelu událostí zájmu, o nichž je známo, že leží pouze v určitém časovém intervalu. Takovou událostí může být například recidiva rakoviny nebo změna
Nejdůležitější informace
-
Novinky v putdocx
-
Uvádění záložek v odstavcích a tabulkách
Zahrnout alternativní text pro čtení hlasovým softwarem u obrázků.
Zahrnout obrázky vektorové grafiky s možností škálování (.svg)
-
-
Novinky v aplikaci putexcel
-
Zastavení pracovního listu na určitém řádku nebo sloupci
-
Vložení přerušení stránky na určitém řádku nebo sloupci
-
Vložení záhlaví a zápatí do pracovního listu
-
Zahrnout hypertextové odkazy do buněk
-
Vytvořit pojmenovaný rozsah buněk
-
v zaměstnaneckém statusu zaznamenaném během jedné z kontrol. Oba případy jsou příkladem intervalově cenzurovaných údajů o čase události, kdy čas události není přesně sledován.
Pomocí nástroje stintcox můžete automaticky vytvořit TVC interakcí stávajících kovariát se zadanými deterministickými funkcemi času nebo zadat vlastní TVC v novém formátu dat s více záznamy na subjekt. Použijte TVC k testování předpokladu proporcionálního rizika pomocí Waldova testu nebo testu pravděpodobnostního poměru. A začleňte TVC do svých předpovědí a grafů funkcí přežití a dalších funkcí.
Podívejme se, jak to funguje
Testování předpokladu proporcionálních rizik pomocí TVC
V této části ukážeme, jak lze pomocí TVC testovat předpoklad proporcionálního rizika Coxova modelu. Po vzoru Zeng et al. (2016) používáme intervalově cenzurovanou Coxovu regresi k modelování doby do nakažení HIV u injekčních uživatelů drog. Všech 1 124 subjektů bylo na počátku testováno na HIV negativně. Byli sledováni a jejich séropozitivita na HIV-1 byla vyhodnocována prostřednictvím krevních testů přibližně každé čtyři měsíce. Vzhledem k tomu, že subjekty byly testovány pravidelně, nebyl sledován přesný čas infekce HIV, ale bylo známo, že časy spadají do intervalů mezi krevními testy. Odpovídající dolní a horní časové koncové hodnoty jsou zaznamenány v proměnných ltime a rtime.
Výchozími faktory, které používáme k modelování séropozitivity HIV-1, jsou soustředěný věk při náboru (age_mean), pohlaví (muž), historie sdílení jehel (needle), historie injekčního užívání drog (inject) a skutečnost, zda byl subjekt v době náboru ve vězení (jail). Zde je uvedena podmnožina souboru údajů pro subjekty 271 až 274 s jedním záznamem na subjekt:

Použili jsme Coxův model proporcionálních rizik, ve kterém doba do infekce HIV závisí na výše uvedených základních faktorech. Ve formátu jednoho záznamu na subjekt zadáme dolní a horní časový interval události v možnosti interval() funkce stintcox.

Zjistili jsme, že věk a pobyt ve vězení při vstupu do studie jsou spojeny s nižším, resp. vyšším rizikem infekce HIV.
Jedním ze způsobů, jak testovat předpoklad proporcionálního rizika pro kovariátu, je otestovat, zda je koeficient spojený s touto kovariátou časově invariantní. Toho lze dosáhnout tak, že se do modelu zahrne interakce mezi touto kovariátou a funkcí času a testuje se, zda je příslušný koeficient roven nule.
Abychom v našem příkladu otestovali předpoklad proporcionálního rizika, zahrneme všechny kovariáty do volby tvc(), abychom do modelu dodatečně zahrnuli jejich interakci s časem analýzy _t, což je výchozí hodnota. V této analýze potlačíme výchozí vykazování poměrů rizik pomocí volby nohr:

První rovnice, main, uvádí koeficienty pro kovariáty, které se v čase nemění; druhá rovnice, tvc, uvádí výsledky pro kovariáty interagující s časem. Podle p-hodnot uvedených v rovnici tvc se zdá, že předpoklad o vlastnickém riziku je porušen pro kovariáty muž a vězení. Waldův test v dolní části tabulky rovněž naznačuje, že předpoklad proporcionálního rizika neplatí globálně.
Fitting intervalově cenzorovaného Coxova modelu pomocí TVC v datech s více záznamy
V předchozím příkladu jsme použili volbu tvc() programu stintcox k vytvoření TVC pro testování předpokladu proporcionálního rizika. V některých aplikacích již TVC v souboru dat existují. Pokud budeme pokračovat v datech o injekčních uživatelích drog, pobyt ve vězení je TVC. TVC lze zaznamenat pouze ve formátu dat s více záznamy na subjekt. V tomto formátu může každý subjekt obsahovat více záznamů s více časy vyšetření, stavem události v každém čase vyšetření a potenciálními kovariátami proměnnými v čase v každém čase vyšetření.
Použijme rozšířenou verzi, idu2.dta, předchozího souboru dat idu.dta, který obsahuje všechny základní kovariáty a také časově proměnnou indikátor uvěznění (jail_vary). jail_vary označuje, zda byl subjekt od poslední návštěvy kliniky uvězněn. Datový soubor také zaznamenává identifikátor subjektu (id), čas vyšetření krevního testu (time) a zda je krevní test v době vyšetření pozitivní (is_seropos). Zde je podmnožina tohoto datového souboru pro subjekty 271 až 274 s více záznamy na subjekt:

Znovu použijeme předchozí Coxův model, ale místo základní proměnné vězení nyní použijeme časově proměnnou vězení_vary. Ve formátu více záznamů na subjekt zadáme identifikátor subjektu v možnosti id(), čas vyšetření v možnosti time() a stav indikátoru události v možnosti status().

Když se posuneme dolů do regionu Severní střední Evropy, zjistíme, že v průměru na jeden stát připadá 47 436 sňatků; nejvíce jich bylo uzavřeno v Illinois, a to 109 823.
Souhrnné statistiky pro jednotlivé regiony bychom také mohli ukládat do jednoho listu a na tabulku hypertextově odkazovat z jiného listu s novou podporou hypertextových odkazů. Pracovní list bychom mohli dále přizpůsobit tím, že bychom do něj vložili záhlaví, zápatí nebo zalomení stránky. Další informace naleznete v části [RPT] putexcel.
V porovnání s předchozím příkladem se po zohlednění časově proměnlivého vězení poměr rizik pro injekci zvýší z 1,25 na 1,37, ale vliv vězení se sníží z 1,57 pro základní vězení na 1,44 pro časově proměnlivé vězení_vary.
Grafické znázornění funkcí přeživších
Po přizpůsobení modelu můžeme pomocí stcurve vykreslit odhadnutou funkci přežití, selhání, nebezpečí nebo kumulativního nebezpečí. Ve výchozím nastavení stcurve vyhodnocuje funkce na celkových středních hodnotách kovariát.
. stcurve, survival note: function evaluated at overall means of covariates.

U dat s více záznamy a TVC můžeme chtít při vykreslování funkcí zohlednit časově proměnlivou povahu těchto kovariát. V takovém případě můžeme použít volbu attmeans pro vyhodnocení funkce na časově specifických průměrech.
. stcurve, survival attmeans note: function evaluated at time-specific means of covariates.

Pomocí volby atframe() můžeme také zadat vlastní hodnoty TVC, které se použijí pro vyhodnocení funkce survivor. Předpokládejme, že chceme vykreslit křivku přežití pro jedince se stejným vzorem kovariát jako subjekt 1 v našem souboru dat. Vytvoříme nový rámec s názvem id1 a pomocí funkce frame put zkopírujeme příslušné informace pro subjekt 1 do tohoto nového rámce. Vypíšeme údaje, které jsme právě uložili do rámce id1.

Poté můžeme vykreslit křivku přežití pro tento konkrétní profil zadáním příkazu
. stcurve, survival atframe(id1) note: function evaluated at specified values of selected covariates and overall means of other covariates (if any). note: covariate values from frame id1 used to evaluate function.

Odkaz
Zeng, D., L. Mao a D. Lin. 2016. Maximum likelihood estimation for semiparametric transformation models with interval-censored data (Odhad maximální věrohodnosti pro semiparametrické transformační modely s intervalově cenzorovanými daty). Biometrika 103: 253-271.