New In 
TVC avec le modèle de Cox censuré par intervalles
Stata 17 a introduit la commande stintcox pour ajuster de véritables modèles semi-paramétriques de Cox à des données d’événements temporels censurées par intervalles. Stata 18 ajoute la prise en charge des covariables variables dans le temps (CVT), couramment utilisées dans la pratique pour enregistrer les caractéristiques qui changent au cours du suivi. Ainsi, que vous ayez une variable biomarqueur ou une variable politique qui change avec le temps, vous pouvez maintenant les inclure pour modéliser des événements d’intérêt dont on sait qu’ils se situent uniquement dans un certain intervalle de temps. Par exemple, l’événement peut être une récurrence du cancer ou un changement dans le temps.
Points forts
-
Nouveau dans putdocx
-
inclure des signets dans les paragraphes et les tableaux
-
Inclure un texte alternatif à lire par un logiciel vocal pour les images
-
Inclure des images de type Scalable Vector Graphics (.svg)
-
-
Nouveau dans putexcel
-
Geler une feuille de calcul sur une ligne ou une colonne spécifique
-
Insérer un saut de page sur une ligne ou une colonne spécifique
-
Insérer un en-tête et un pied de page dans une feuille de calcul
-
Inclure des liens hypertextes dans les cellules
-
Créer une plage de cellules nommée
-
dans le statut d’emploi enregistré au cours de l’un des suivis. Il s’agit dans les deux cas d’exemples de données événementielles censurées par intervalles, dans lesquelles l’heure de l’événement n’est pas observée avec précision.
Utilisez stintcox pour créer automatiquement des CVT en faisant interagir des covariables existantes avec des fonctions déterministes du temps spécifiées ou spécifiez vos propres CVT dans le nouveau format de données à enregistrements multiples par sujet. Utilisez les CVT pour tester l’hypothèse des risques proportionnels à l’aide du test de Wald ou du test du rapport des vraisemblances. Incorporez les CVT dans vos prédictions et tracés de fonctions de survie et d’autres fonctions.
Voyons comment cela fonctionne
Test de l’hypothèse des risques proportionnels à l’aide des TVC
Nous montrons ici comment utiliser les TVC pour tester l’hypothèse de risques proportionnels d’un modèle de Cox. À l’instar de Zeng et al. (2016), nous utilisons une régression de Cox censurée par intervalles pour modéliser le temps écoulé avant l’infection par le VIH chez les consommateurs de drogues injectables. Les 1 124 sujets ont d’abord été testés négatifs pour le VIH. Ils ont été suivis et évalués pour la séropositivité au VIH-1 par des tests sanguins environ tous les quatre mois. Comme les sujets ont été testés périodiquement, le moment exact de l’infection par le VIH n’a pas été observé, mais on sait que les délais se situent dans les intervalles entre les tests sanguins. Les points limites inférieurs et supérieurs correspondants sont enregistrés dans les variables ltime et rtime.
Les facteurs de base que nous utilisons pour modéliser la séropositivité au VIH-1 sont l’âge centré au moment du recrutement (age_mean), le sexe (masculin), les antécédents de partage de seringue (needle), les antécédents d’injection de drogue (inject) et le fait qu’un sujet ait été en prison au moment du recrutement (jail). Voici un sous-ensemble de données pour les sujets 271 à 274, avec un enregistrement par sujet :
Nous avons ajusté un modèle à risques proportionnels de Cox dans lequel le temps écoulé avant l’infection par le VIH dépend des facteurs de base susmentionnés. Dans un format d’enregistrement unique par sujet, nous spécifions les intervalles inférieurs et supérieurs entre les événements et le temps dans l’option interval() de stintcox.
Nous constatons que l’âge et le fait d’être en prison au moment de l’inscription semblent être associés, respectivement, à des risques plus faibles et plus élevés d’infection par le VIH.
Une façon de vérifier l’hypothèse de risques proportionnels pour une covariable est de tester si le coefficient associé à cette covariable est invariant dans le temps. Pour ce faire, on peut inclure une interaction entre cette covariable et une fonction du temps dans le modèle et tester si le coefficient correspondant est égal à zéro.
Pour tester l’hypothèse des risques proportionnels dans notre exemple, nous incluons toutes les covariables dans l’option tvc() afin d’inclure également leurs interactions avec le temps d’analyse _t, la valeur par défaut, dans le modèle. Dans cette analyse, nous supprimons la déclaration par défaut des rapports de risque avec l’option nohr :
La première équation, main, rapporte les coefficients des covariables qui ne varient pas dans le temps ; la deuxième équation, tvc, rapporte les résultats des covariables qui interagissent avec le temps. L’hypothèse des risques proportionnels semble être violée pour les covariables homme et prison d’après les valeurs p indiquées dans l’équation tvc. Le test de Wald au bas du tableau indique également que l’hypothèse des hasards proportionnels ne tient pas globalement.
Ajustement d’un modèle de Cox censuré par intervalles à l’aide de TVC dans des données à enregistrements multiples
Dans l’exemple précédent, nous avons utilisé l’option tvc() de stintcox pour créer des TVC afin de tester l’hypothèse de risques proportionnels. Dans certaines applications, les CVT existent déjà dans l’ensemble de données. Si l’on poursuit avec les données sur les consommateurs de drogues injectables, le fait d’être en prison est une CVT. Les CVT ne peuvent être enregistrées que dans un format de données à enregistrements multiples par sujet. Dans ce format, chaque sujet peut contenir plusieurs enregistrements avec plusieurs heures d’examen, l’état de l’événement à chaque heure d’examen et des covariables potentielles variant dans le temps à chaque heure d’examen.
Utilisons une version étendue, idu2.dta, de l’ensemble de données idu.dta précédent, qui contient toutes les covariables de base ainsi qu’une variable indicatrice d’emprisonnement variable dans le temps (jail_vary). jail_vary indique si le sujet a été emprisonné depuis la dernière visite à la clinique. L’ensemble de données enregistre également un identifiant du sujet (id), l’heure de l’examen du test sanguin (time), et si le test sanguin est positif à l’heure de l’examen (is_seropos). Voici un sous-ensemble de cet ensemble de données pour les sujets 271 à 274 avec plusieurs enregistrements par sujet :
Nous reformulons le modèle de Cox précédent, mais nous utilisons maintenant la variable temporelle jail_vary au lieu de la variable de base jail. Dans un format d’enregistrement multiple par sujet, nous spécifions l’identifiant du sujet dans l’option id(), l’heure de l’examen dans l’option time(), et le statut de l’indicateur d’événement dans l’option status().
En descendant jusqu’à la région Centre-Nord, nous constatons une moyenne de 47 436 mariages par État ; c’est l’Illinois qui en compte le plus, avec 109 823.
Nous pourrions également stocker des statistiques sommaires pour chaque région dans une feuille de calcul et créer un lien hypertexte vers le tableau à partir d’une autre feuille grâce à la nouvelle prise en charge des liens hypertextes. Nous pourrions personnaliser davantage notre feuille de calcul en y ajoutant un en-tête, un pied de page ou un saut de page. Voir [RPT] putexcel pour plus d’informations.
Par rapport à l’exemple précédent, après prise en compte de l’emprisonnement variable dans le temps, le ratio de risque pour l’injection passe de 1,25 à 1,37, mais l’effet de l’emprisonnement diminue de 1,57 pour l’emprisonnement de base à 1,44 pour l’emprisonnement variable dans le temps.
Représentation graphique des fonctions de survie
Après avoir ajusté le modèle, nous pouvons utiliser stcurve pour tracer la fonction estimée de survie, d’échec, de hasard ou de hasard cumulatif. Par défaut, stcurve évalue les fonctions aux moyennes globales des covariables.
. stcurve, survival note: function evaluated at overall means of covariates.
Dans le cas de données à enregistrements multiples comportant des CVT, il se peut que nous souhaitions intégrer la nature variable dans le temps de ces covariables lors de la représentation graphique des fonctions. Dans ce cas, nous pouvons utiliser l’option attmeans pour évaluer la fonction à des moyennes spécifiques au temps.
. stcurve, survival attmeans note: function evaluated at time-specific means of covariates.
Nous pouvons également utiliser l’option atframe() pour spécifier nos propres valeurs de CVT à utiliser pour évaluer la fonction de survie. Supposons que nous voulions tracer la courbe de survie d’un individu ayant les mêmes covariables que le sujet 1 de notre ensemble de données. Nous créons un nouveau cadre appelé id1 et utilisons frame put pour copier les informations pertinentes du sujet 1 dans ce nouveau cadre. Nous listons les données que nous venons d’enregistrer dans le cadre id1.
Nous pouvons ensuite tracer la courbe des survivants pour ce profil particulier en tapant
. stcurve, survival atframe(id1)
note: function evaluated at specified values of selected covariates and overall
means of other covariates (if any).
note: covariate values from frame id1 used to evaluate function.
Référence
Zeng, D., L. Mao et D. Lin. 2016. Maximum likelihood estimation for semiparametric transformation models with interval-censored data (Estimation du maximum de vraisemblance pour les modèles de transformation semiparamétriques avec des données censurées par intervalles). Biometrika 103 : 253-271.
