New In

Différence hétérogène dans les différences (DID)

Lorsque les effets moyens du traitement varient dans le temps et selon la cohorte, vous pouvez désormais utiliser les nouvelles commandes hdidregress et xthdidregress pour estimer les effets moyens hétérogènes du traitement sur les personnes traitées (ATET). Utilisez hdidregress avec des données transversales répétées et xthdidregress avec des données de panel. Choisissez l’un des quatre estimateurs, y compris l’ajustement de la régression et la pondération de la probabilité inverse. Tracez les profils temporels des ATET pour chaque cohorte avec estat atetplot. Agréger les ATETs au sein de la cohorte, du temps et de l’exposition au traitement avec estat aggregation. Explorez d’autres fonctions de post-estimation.

Les effets du traitement mesurent l’effet causal d’un traitement sur un résultat. Un traitement est un nouveau régime médicamenteux, une procédure chirurgicale, un programme de formation ou même une campagne publicitaire visant à affecter un résultat tel que la tension artérielle, la mobilité, l’emploi ou les ventes. Il est intéressant d’estimer un ATET.

L’estimateur standard de la différence des différences (DID), mis en œuvre dans les commandes existantes didregress et xtdidregress, estime un ATET commun à tous les groupes dans le temps. Lorsque les groupes sont traités à des moments différents, l’hypothèse d’un ATET constant peut être violée. Les nouvelles commandes mettent en œuvre des méthodes d’estimation qui tiennent compte de l’hétérogénéité de l’ATET et fournissent des estimations de l’ATET spécifiques à la cohorte et au temps.

Points forts

  • Estimation

    • Hétérogénéité au sein de la cohorte et dans le temps

    • Données de panel

    • Données transversales répétées

  • Quatre estimateurs

    • Ajustement de la régression (AR)

    • Pondération de la probabilité inverse (IPW)

    • Pondération inverse augmentée de la probabilité (AIPW)

    • Régression à deux effets fixes (TWFE)

  • Graphiques de l’hétérogénéité des effets du traitement

  • Essai de tendances parallèles en matière de prétraitement

  • Agrégation des ATET sur :

    • Cohorte

    • L’heure

    • Exposition au traitement

  • Intervalles de confiance simultanés

Voyons comment cela fonctionne

Nous aimerions savoir si un programme au niveau du district scolaire, Healthy Habits, réduit l’indice de masse corporelle (IMC) des élèves dans le district scolaire. Nous disposons de données fictives sur le programme Healthy Habits. Ce programme prévoit plus de temps pour faire de l’exercice et augmente la consommation de fruits et de légumes. Nos données se situent au niveau du district scolaire et comprennent des informations sur la participation de l’école au programme, hhabit, et l’IMC des élèves du district, bmi. Nous disposons d’échantillons répétés d’élèves âgés de 11 à 14 ans provenant de 40 districts scolaires entre 2013 et 2021.

Pour le modèle des résultats, nous pensons que l’éducation de la mère, medu, est un bon prédicteur des habitudes de santé des enfants. Nous pensons également que la participation à des sports, sports, affecte l’IMC. Enfin, nous contrôlons si l’élève est une fille pour tenir compte des différences de comportement et des différences de morphologie entre les garçons et les filles à cet âge.

Pour le modèle de traitement, nous utilisons le nombre de parcs dans le district (parksd) pour modéliser hhabit. Nous supposons que les districts scolaires disposant de plus de parcs considèrent que les espaces d’exercice sont plus importants dans leur planification urbaine que ceux disposant de moins de parcs. Ces districts sont donc plus réceptifs au programme Healthy Habits.

Nous utilisons l’estimateur aipw pour modéliser à la fois le résultat et le traitement. L’estimateur aipw possède une propriété de double robustesse, ce qui implique qu’un seul des modèles de résultats ou de traitement doit être correctement spécifié pour obtenir des estimations cohérentes.

Nous avons ajusté le modèle suivant :

. hdidregress aipw (bmi medu i.girl i.sports) (hhabit parksd), group(schools) time(year)
note: variable _did_cohort, containing cohort indicators formed by treatment variable hhabit and
      group variable schools, was added to the dataset.

Computing ATET for each cohort and time:
Cohort 2015 (8): ........ done
Cohort 2017 (8): ........ done
Cohort 2019 (8): ........ done

Treatment and time information

Time variable: year
Time interval: 2013 to 2021
Control:       _did_cohort = 0
Treatment:     _did_cohort > 0
 
    _did_cohort
 
Number of cohorts   4
 
Number of obs  
Never treated   11355
2015   1231
2017   2097
2019   2042
 
Heterogeneous treatment-effects regression              Number of obs = 16,725
Estimator:       Augmented IPW
Treatment level: schools
Control group:   Never treated

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Cohort   ATET std. err. z P>|z| [95% conf. interval]
 
2015    
year    
2014   .6544681 .5946048 1.10 0.271 -.5109359 1.819872
2015   -1.226451 .379168 -3.23 0.001 -1.969607 -.4832957
2016   -2.491842 .4169657 -5.98 0.000 -3.30908 -1.674605
2017   -2.72486 .2363878 -11.53 0.000 -3.188171 -2.261548
2018   -2.786634 .6672867 -4.18 0.000 -4.094492 -1.478776
2019   -3.980456 .2993279 -13.30 0.000 -4.567127 -3.393784
2020   -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
2021   -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
 
2017    
year    
2014   .6635794 .3089663 2.15 0.032 .0580167 1.269142
2015   -1.3933 .3871204 -3.60 0.000 -2.152042 -.6345582
2016   .5947865 .4065947 1.46 0.144 -.2021245 1.391697
2017   -1.71427 .4565384 -3.75 0.000 -2.609069 -.8194714
2018   -3.170542 .5221368 -6.07 0.000 -4.193912 -2.147173
2019   -2.967701 .4247053 -6.99 0.000 -3.800108 -2.135294
2020   .0360098 .6868764 0.05 0.958 -1.310243 1.382263
2021   -.957117 .3510986 -2.73 0.006 -1.645258 -.2689763
 
2019    
year    
2014   -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
2015   1.010288 .4808165 2.10 0.036 .067905 1.952671
2016   -.3809733 .4336764 -0.88 0.380 -1.230963 .4690169
2017   .5199519 .4849723 1.07 0.284 -.4305763 1.47048
2018   -.0315794 .5863875 -0.05 0.957 -1.180878 1.117719
2019   -3.602114 .3498692 -10.30 0.000 -4.287845 -2.916383
2020   -1.388906 .6765493 -2.05 0.040 -2.714919 -.0628943
2021   -.6222491 .5510466 -1.13 0.259 -1.70228 .4577824
 
Note: ATET computed using covariates.

Nous avons spécifié le modèle de résultats dans la première série de parenthèses et le modèle de traitement dans la deuxième série de parenthèses. Nous avons également spécifié l’option group(schools) pour définir que le traitement a lieu au niveau de l’école et pour identifier les écoles comme variable de regroupement. Enfin, nous avons spécifié une variable temporelle year dans l’option time().

La note sous la commande indique que la variable catégorielle _did_cohort est générée avec des informations sur la cohorte. Les unités d’une même cohorte commencent le traitement en même temps. Nous constatons qu’il y a trois cohortes dans nos données : 2015, 2017 et 2019. En outre, nous constatons que 11 355 observations ne sont jamais traitées. La variable temporelle année s’étend de 2013 à 2021.

Le tableau d’estimation présente l’ATET pour chaque cohorte et chaque année. Par exemple, pour la cohorte 2015 en 2016, l’estimation de l’ATET est de -2,5, ce qui signifie que le programme Healthy Habits réduit en moyenne l’IMC de 2,5 pour les élèves d’un district de la cohorte 2015 en 2016 par rapport au scénario où le district ne participe pas au programme. Les autres estimations peuvent être interprétées de la même manière.

Il est difficile de voir les tendances des ATETs en regardant seulement toutes les estimations des ATETs. Nous pouvons utiliser estat atetplot pour visualiser le profil temporel des ATET pour chaque cohorte. Nous spécifions l’option sci pour montrer les bandes de confiance simultanées garanties pour couvrir les vraies valeurs des ATETs à travers toutes les cohortes et le temps avec un niveau de probabilité prédéfini.

. estat atetplot, sci
 

Après avoir ajusté le modèle, nous pouvons utiliser l’agrégation estat pour agréger les ATET au sein de la cohorte, du temps et de l’exposition au traitement. Cela permet de résumer les différents aspects des ATET. Par exemple, nous utilisons estat aggregation, cohort pour résumer les ATET de chaque cohorte dans le temps. Nous spécifions également l’option graph pour obtenir un graphique des agrégations en plus de la sortie tabulaire.

. estat aggregation, cohort graph

ATET over cohort                                        Number of obs = 16,725

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Cohort   ATET std. err. z P>|z| [95% conf. interval]
 
2015   -2.065755 .1999412 -10.33 0.000 -2.457633 -1.673877
2017   -1.7781 .4013978 -4.43 0.000 -2.564825 -.9913744
2019   -1.869405 .4650349 -4.02 0.000 -2.780857 -.9579538
 

 

Enfin, si nous voulons résumer les ATET sur différentes durées d’exposition au traitement, nous spécifions l’option dynamique.

. estat aggregation, dynamic graph

Duration of exposure ATET                               Number of obs = 16,725

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Exposure   ATET std. err. z P>|z| [95% conf. interval]
 
-5   -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
-4   1.010288 .4808165 2.10 0.036 .067905 1.952671
-3   .1338267 .3091619 0.43 0.665 -.4721195 .739773
-2   -.4256324 .4292553 -0.99 0.321 -1.266957 .4156925
-1   .3727141 .3197563 1.17 0.244 -.2539967 .999425
0   -2.285098 .3827362 -5.97 0.000 -3.035248 -1.534949
1   -2.344265 .3829047 -6.12 0.000 -3.094744 -1.593785
2   -2.045521 .3911543 -5.23 0.000 -2.81217 -1.278873
3   -1.045601 .6840119 -1.53 0.126 -2.38624 .2950372
4   -2.145004 .5952525 -3.60 0.000 -3.311678 -.978331
5   -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
6   -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
 
Note: Exposure is the number of periods since the first treatment time.