Nouveau dans

Modèles de différence dans les différences (DID) et DDD

Les nouvelles commandes didregress et xtdidregress de Stata permettent d’ajuster les modèles DID et DDD qui contrôlent les effets de groupe et de temps non observés. didregress peut être utilisé avec des données transversales répétées, où nous échantillonnons différentes unités d’observations à différents moments dans le temps. xtdidregress est à utiliser avec des données de panel (longitudinales). Ces commandes fournissent un cadre unifié pour obtenir une inférence qui convient à une variété de plans d’étude.
La différence dans les différences (DID) offre une technique non expérimentale pour estimer l’effet moyen du traitement sur les traités (ATET) en comparant la différence dans le temps des différences entre les moyennes des résultats dans les groupes de contrôle et de traitement. D’où le nom de différence de différences. Cette technique permet de contrôler les caractéristiques non observables du temps et du groupe qui confondent l’effet du traitement sur le résultat.
La différence dans les différences (DDD) ajoute un groupe de contrôle au cadre DID pour tenir compte des interactions inobservables entre les caractéristiques du groupe et du temps qui pourraient ne pas être prises en compte par le DID. Elle augmente la DID avec une autre différence pour le nouveau groupe de contrôle. D’où le nom de différence dans la différence dans les différences.
Parmi les exemples d’effets de traitement, citons l’examen des effets d’un régime médicamenteux sur la pression artérielle, d’une intervention chirurgicale sur la mobilité, d’un programme de formation sur l’emploi ou d’une campagne publicitaire sur les ventes.

Points forts

  • Estimateurs DID et DDD ATET pour les sections transversales répétées et les données de panel
  • Valeurs p et intervalles de confiance de Wild-bootstrap
  • Erreurs types corrigées du biais à l’aide de l’ajustement des degrés de liberté de Bell et McCaffrey
  • Estimations et erreurs standard de l’ATET à l’aide de la méthode de Donald et Lang
  • Diagnostics graphiques des résultats moyens et des tendances parallèles
  • Tests de type Granger et de tendances parallèles

Voyons comment cela fonctionne

Un prestataire de santé souhaite étudier l’effet d’une nouvelle procédure d’admission à l’hôpital sur la satisfaction des patients en utilisant des données mensuelles sur les patients avant et après la mise en œuvre de la nouvelle procédure dans certains de ses hôpitaux. Le prestataire de santé utilisera la régression DID pour analyser l’effet de la nouvelle procédure d’admission sur les hôpitaux qui ont participé au programme. Le résultat d’intérêt est la satisfaction des patients, satis, et la variable de traitement est la procédure. Nous pouvons ajuster ce modèle en utilisant didregress.

. didregress (satis) (procedure), group(hospital) time(month)

La première série de parenthèses est utilisée pour spécifier le résultat d’intérêt, suivi des covariables du modèle. Dans ce cas, il n’y a pas de covariables. La deuxième série de parenthèses est utilisée pour spécifier la variable binaire qui indique les observations traitées, la procédure. Les options group() et time() sont utilisées pour construire des effets fixes de groupe et de temps qui sont inclus dans le modèle. La variable spécifiée dans group() définit le niveau de clustering pour les erreurs standard par défaut de cluster-robust. Dans cet exemple, nous regroupons au niveau de l’hôpital. Les résultats de cette commande sont

Number of groups and treatment time

Time variable: month
Control:       procedure = 0
Treatment:     procedure = 1
Control Treatment
Group
hospital 28 18
Time
Minimum 1 4
Maximum 1 4
Difference in differences regression Number of obs = 7,368 Data type: Repeated cross-sectional (Std. err. adjusted for 46 clusters in hospital)
Robust
stais Coefficient std. err. t P>|t| [95% conf. interval]
ATET
procedure
(New
vs
Old) .8479879 .0321121 26.41 0.000 .7833108 .912665
Note: ATET estimate adjusted for group effects and time effects.

Le premier tableau donne des informations sur les groupes de contrôle et de traitement et sur le moment du traitement. La première section nous indique que 28 hôpitaux ont continué à utiliser l’ancienne procédure et que 18 hôpitaux sont passés à la nouvelle. La deuxième section nous indique que tous les hôpitaux qui ont mis en œuvre la nouvelle procédure l’ont fait au cours de la 4e période. Si certains hôpitaux avaient adopté la politique plus tard, le moment minimum et maximum du premier traitement serait différent.
Le second tableau donne l’estimation de l’ATET, 0,85 (IC 95 % [0,78, 0,91]). Les hôpitaux de traitement ont connu une augmentation de 0,85 point de la satisfaction des patients par rapport à ceux qui n’avaient pas mis en œuvre la nouvelle procédure.
L’une des hypothèses de ce modèle est que les trajectoires des satis sont parallèles pour les groupes de contrôle et de traitement avant la mise en œuvre de la nouvelle procédure. Une vérification visuelle de ces trajectoires peut être obtenue en traçant les moyennes du résultat dans le temps pour les deux groupes ou en visualisant les résultats du modèle de tendances linéaires. Nous pouvons effectuer ces deux vérifications diagnostiques à l’aide des diagrammes de tendance estat.

. estat trendplots

Avant la mise en œuvre de la politique, les hôpitaux de contrôle et de traitement suivaient une trajectoire parallèle. Nous pouvons évaluer plus précisément cette hypothèse en utilisant un test de tendances parallèles avec estat ptrends.

Parallel-trends test (pretreatment time period)
H0: Linear trends are parallel

F(1, 45) = 0.55
Prob > F = 0.4615

Nous ne disposons pas de preuves suffisantes pour rejeter l’hypothèse nulle de tendances parallèles. Ce test et l’analyse graphique confirment l’hypothèse de tendances parallèles.
Un autre test que nous pourrions vouloir effectuer est de voir si, en prévision du traitement, les groupes de contrôle ou de traitement changent leur comportement. Ceci est évalué avec le test de causalité de Granger en utilisant estat granger.

. estat granger

Granger causality test
H0: No effect in anticipation of treatment

F(2, 45) =   0.33
Prob > F = 0.7239

Nous ne disposons pas de preuves suffisantes pour rejeter l’hypothèse nulle d’absence de changement de comportement avant le traitement. Avec nos diagnostics précédents, ces résultats suggèrent que nous devrions faire confiance à la validité de notre estimation ATET.
Dans cet exemple, nous avions un nombre suffisant d’hôpitaux (46) pour faire des inférences fiables sur l’effet du traitement. Cependant, si nous n’avions eu que les données de 15 hôpitaux, nous aurions peut-être envisagé des méthodes alternatives.
Pour utiliser des erreurs standard corrigées du biais avec l’ajustement des degrés de liberté de Bell et McCaffrey (2002), nous pouvons ajouter l’option vce(hc2).

. didregress (satis) (procedure), group(hospital) time(month) vce(hc2)

Pour utiliser la méthode d’agrégation proposée par Donald et Lang (2007), nous pouvons ajouter l’option aggregate(dlang).

. didregress (satis) (procedure), group(hospital) time(month) aggregate(dlang)

Nous pouvons ajouter l’option variable si nous voulons permettre à certains coefficients de varier entre les groupes.

. didregress (satis) (procedure), group(hospital) time(month) aggregate(dlang, varying)

Nous pouvons également utiliser le bootstrap en grappes sauvages pour obtenir des p-values et des intervalles de confiance. Comme pour toutes les méthodes bootstrap, nous devons définir une graine pour que nos résultats soient reproductibles.

. didregress (satis) (procedure), group(hospital) time(month) wildbootstrap(rseed(111))

computing 1000 replications

Finding p-value
.................................................. 50%
................................................. 100%
Confidence interval lower bound
...
Confidence interval upper bound
...

Number of groups and treatment time

Time variable: month
Control:       procedure = 0
Treatment:     procedure = 1
Control Treatment
Group
hospital 7 8
Time
Minimum 1 4
Maximum 1 4
DID with wild-cluster bootstrap inference Number of obs = 2,192 No. of clusters = 15 Replications = 1,000 Data type: Repeated cross-sectional Error weight: rademacher
stais Coefficient t P>|t| [95% conf. interval]
ATET
procedure
(New vs Old) .860162 19.72 0.000 .7714875 .9587552
Note: ATET estimate adjusted for group effects and time effects.

L’intervalle de confiance et la valeur p ci-dessus permettent une inférence fiable pour les cas où le nombre de groupes est faible. Ces résultats peuvent être interprétés de la même manière que notre modèle original.