New In 
TVCs mit intervall-zensiertem Cox-Modell
Mit Stata 17 wurde der Befehl stintcox eingeführt, um echte semiparametrische Cox-Modelle an intervallzensierte Ereignis-Zeit-Daten anzupassen. Stata 18 fügt Unterstützung für zeitvariable Kovariaten (TVCs) hinzu, die in der Praxis häufig verwendet werden, um Merkmale zu erfassen, die sich während der Nachverfolgung ändern. Unabhängig davon, ob es sich um eine Biomarker-Variable oder eine Politik-Variable handelt, die sich mit der Zeit verändert, können Sie diese nun einbeziehen, um Ereignisse von Interesse zu modellieren, von denen bekannt ist, dass sie nur innerhalb eines bestimmten Zeitintervalls liegen. Bei dem Ereignis kann es sich zum Beispiel um ein Wiederauftreten von Krebs oder eine Veränderung
Höhepunkte
-
Neu in putdocx
-
Lesezeichen in Absätze und Tabellen einfügen
-
Einfügen von alternativem Text, der von Sprachsoftware für Bilder gelesen werden kann
-
Einfügen von Bildern mit skalierbaren Vektorgrafiken (.svg)
-
-
Neu in putexcel
-
Ein Arbeitsblatt in einer bestimmten Zeile oder Spalte einfrieren
-
Einfügen eines Seitenumbruchs in einer bestimmten Zeile oder Spalte
-
Einfügen einer Kopf- und Fußzeile in ein Arbeitsblatt
-
Hyperlinks in Zellen einfügen
-
Einen benannten Zellbereich erstellen
-
bei einer der Nachuntersuchungen erfasste Änderung des Beschäftigungsstatus. Beides sind Beispiele für intervallzensierte Ereigniszeitdaten, bei denen der Ereigniszeitpunkt nicht genau beobachtet wird.
Verwenden Sie stintcox, um automatisch TVCs zu erstellen, indem Sie vorhandene Kovariaten mit bestimmten deterministischen Funktionen der Zeit interagieren lassen, oder geben Sie Ihre eigenen TVCs im neuen Datenformat mit mehreren Datensätzen pro Proband an. Verwenden Sie TVCs, um die Proportional-Hazards-Annahme mit dem Wald-Test oder dem Likelihood-Ratio-Test zu testen. Und integrieren Sie TVCs in Ihre Vorhersagen und Darstellungen von Überlebens- und anderen Funktionen.
Wir wollen sehen, wie es funktioniert
Prüfung der Annahme des proportionalen Risikos anhand von TVCs
Hier zeigen wir, wie TVCs verwendet werden können, um die Proportionalitätsannahme eines Cox-Modells zu testen. In Anlehnung an Zeng et al. (2016) verwenden wir eine intervallzensierte Cox-Regression zur Modellierung der Zeit bis zur HIV-Infektion von injizierenden Drogenkonsumenten. Alle 1 124 Probanden wurden zunächst negativ auf HIV getestet. Sie wurden beobachtet und etwa alle vier Monate durch Bluttests auf HIV-1-Seropositivität untersucht. Da die Probanden in regelmäßigen Abständen getestet wurden, konnte der genaue Zeitpunkt der HIV-Infektion nicht beobachtet werden, aber es war bekannt, dass die Zeiten in die Intervalle zwischen den Bluttests fielen. Die entsprechenden unteren und oberen Zeitendpunkte werden in den Variablen ltime und rtime erfasst.
Die Basisfaktoren, die wir zur Modellierung der HIV-1-Seropositivität verwenden, sind das mittlere Alter bei der Rekrutierung (age_mean), das Geschlecht (male), die Geschichte der gemeinsamen Nutzung von Nadeln (needle), die Geschichte der Drogeninjektion (inject) und die Frage, ob eine Person zum Zeitpunkt der Rekrutierung im Gefängnis war (jail). Hier ist eine Teilmenge des Datensatzes für die Probanden 271 bis 274 mit einem Datensatz pro Proband:

Wir passen ein Cox-Proportional-Hazard-Modell an, bei dem die Zeit bis zur HIV-Infektion von den oben genannten Ausgangsfaktoren abhängt. Im Format eines einzelnen Datensatzes pro Proband geben wir die unteren und oberen Ereignis-Zeit-Intervalle mit der Option interval() von stintcox an.

Wir stellen fest, dass das Alter und der Gefängnisaufenthalt bei der Einschulung mit einem geringeren bzw. höheren Risiko einer HIV-Infektion verbunden zu sein scheinen.
Eine Möglichkeit, die Proportionalitätsannahme für eine Kovariate zu testen, besteht darin, zu prüfen, ob der mit dieser Kovariate verbundene Koeffizient zeitinvariant ist. Dies kann erreicht werden, indem man eine Interaktion zwischen dieser Kovariate und einer Funktion der Zeit in das Modell aufnimmt und prüft, ob der entsprechende Koeffizient gleich Null ist.
Um die Proportional-Hazard-Annahme in unserem Beispiel zu testen, schließen wir alle Kovariaten in der Option tvc() ein, um zusätzlich ihre Wechselwirkungen mit der Analysezeit _t, der Vorgabe, in das Modell aufzunehmen. In dieser Analyse unterdrücken wir die standardmäßige Angabe von Hazard Ratios mit der Option nohr:

Die erste Gleichung, main, gibt die Koeffizienten für die Kovariaten an, die sich im Laufe der Zeit nicht verändern; die zweite Gleichung, tvc, gibt die Ergebnisse für Kovariaten an, die mit der Zeit interagieren. Und die Annahme des proprtionalen Risikos scheint für die Kovariablen männlich und Gefängnis verletzt zu sein, wie aus den p-Werten in der tvc-Gleichung hervorgeht. Der Wald-Test am Ende der Tabelle deutet ebenfalls darauf hin, dass die Proportional-Hazard-Vermutung insgesamt nicht zutrifft.
Anpassung eines intervallzensierten Cox-Modells unter Verwendung von TVCs bei Daten mit mehreren Datensätzen
Im vorigen Beispiel haben wir die tvc()-Option von stintcox verwendet, um TVCs zu erstellen, um die Proportionalitätsannahme zu testen. In einigen Anwendungen sind TVCs bereits im Datensatz vorhanden. Bei den Daten über injizierende Drogenkonsumenten ist der Gefängnisaufenthalt eine TVC. TVCs können nur in einem Datenformat mit mehreren Datensätzen pro Subjekt erfasst werden. In diesem Format kann jedes Subjekt mehrere Datensätze mit mehreren Untersuchungszeitpunkten, dem Ereignisstatus zu jedem Untersuchungszeitpunkt und potenziellen zeitvariablen Kovariaten zu jedem Untersuchungszeitpunkt enthalten.
Wir verwenden eine erweiterte Version, idu2.dta, des vorherigen idu.dta-Datensatzes, die alle Baseline-Kovariaten sowie eine zeitvariable Indikatorvariable für Inhaftierung (jail_vary) enthält. jail_vary gibt an, ob der Proband seit dem letzten Klinikbesuch inhaftiert wurde. Der Datensatz erfasst auch eine Probandenkennung (id), den Untersuchungszeitpunkt des Bluttests (time) und ob der Bluttest zum Untersuchungszeitpunkt positiv ist (is_seropos). Hier ist eine Teilmenge dieses Datensatzes für die Probanden 271 bis 274 mit mehreren Datensätzen pro Proband:

Wir wiederholen das vorherige Cox-Modell, aber wir verwenden jetzt die zeitvariable Variable jail_vary anstelle der Basisvariablen jail. In einem Format mit mehreren Datensätzen pro Proband geben wir die Probandenkennung in der Option id(), die Untersuchungszeit in der Option time() und den Status des Ereignisindikators in der Option status() an.

Wenn wir zur Region North Central hinunterblättern, sehen wir einen Durchschnitt von 47.436 Eheschließungen pro Staat; Illinois hatte mit 109.823 die meisten.
Wir könnten auch zusammenfassende Statistiken für jede Region in einem Arbeitsblatt speichern und mit Hilfe der neuen Unterstützung für Hyperlinks von einem anderen Blatt aus auf die Tabelle verweisen. Wir könnten unser Arbeitsblatt weiter anpassen, indem wir eine Kopf- oder Fußzeile oder einen Seitenumbruch einfügen. Siehe [RPT] putexcel für weitere Informationen.
Verglichen mit dem vorherigen Beispiel steigt die Hazard Ratio für Injektion nach Berücksichtigung der zeitlich variierenden Inhaftierung von 1,25 auf 1,37, aber der Effekt der Inhaftierung sinkt von 1,57 für das Basisgefängnis auf 1,44 für das zeitlich variierende Gefängnis_vary.
Graphische Darstellung von Überlebensfunktionen
Nach der Anpassung des Modells können wir stcurve verwenden, um die geschätzte Überlebens-, Ausfall-, Gefährdungs- oder kumulative Gefährdungsfunktion darzustellen. Standardmäßig wertet stcurve die Funktionen anhand der Gesamtmittelwerte der Kovariaten aus.
. stcurve, survival note: function evaluated at overall means of covariates.

Bei Mehrfachdatensätzen mit TVCs kann es sinnvoll sein, die zeitliche Veränderung dieser Kovariaten bei der Darstellung der Funktionen zu berücksichtigen. In diesem Fall können wir die Option attmeans verwenden, um die Funktion mit zeitspezifischen Mittelwerten zu bewerten.
. stcurve, survival attmeans note: function evaluated at time-specific means of covariates.

Wir können auch die Option atframe() verwenden, um unsere eigenen TVC-Werte anzugeben, die zur Auswertung der Überlebensfunktion verwendet werden sollen. Angenommen, wir möchten die Überlebenskurve für ein Individuum mit demselben Kovariatenmuster wie Proband 1 in unserem Datensatz darstellen. Wir erstellen einen neuen Frame mit dem Namen id1 und verwenden frame put, um die relevanten Informationen für Proband 1 in diesen neuen Frame zu kopieren. Wir listen die Daten auf, die wir gerade im Rahmen id1 gespeichert haben.

Dann können wir die Überlebenskurve für dieses spezielle Profil grafisch darstellen, indem wir Folgendes eingeben
. stcurve, survival atframe(id1) note: function evaluated at specified values of selected covariates and overall means of other covariates (if any). note: covariate values from frame id1 used to evaluate function.

Referenz
Zeng, D., L. Mao, und D. Lin. 2016. Maximum-Likelihood-Schätzung für semiparametrische Transformationsmodelle mit intervallzensierten Daten. Biometrika 103: 253-271.