New In

Heterogene Differenz in Differenzen (DID)

Wenn die durchschnittlichen Behandlungseffekte über die Zeit und über die Kohorte variieren, können Sie jetzt die neuen Befehle hdidregress und xthdidregress verwenden, um heterogene durchschnittliche Behandlungseffekte auf die Behandelten (ATETs) zu schätzen. Verwenden Sie hdidregress mit wiederholten Querschnittsdaten und xthdidregress mit Paneldaten. Wählen Sie einen von vier Schätzern, einschließlich Regressionsanpassung und inverse Wahrscheinlichkeitsgewichtung. Stellen Sie die ATETs-Zeitprofile für jede Kohorte mit estat atetplot dar. Aggregieren Sie die ATETs innerhalb der Kohorte, der Zeit und der Exposition gegenüber der Behandlung mit estat aggregation. Erforschen Sie weitere Postestimation-Funktionen.

Behandlungseffekte messen die kausale Wirkung einer Behandlung auf ein Ergebnis. Eine Behandlung ist ein neues Medikamentenregime, ein chirurgischer Eingriff, ein Schulungsprogramm oder sogar eine Werbekampagne, die ein Ergebnis wie Blutdruck, Mobilität, Beschäftigung oder Umsatz beeinflussen soll. Es ist von Interesse, einen ATET zu schätzen.

Der Standard-Differenz-in-Differenzen (DID)-Schätzer, der in den bestehenden Befehlen didregress und xtdidregress implementiert ist, schätzt einen ATET, der für alle Gruppen im Zeitverlauf gleich ist. Wenn Gruppen zu unterschiedlichen Zeitpunkten behandelt werden, kann die Annahme einer konstanten ATET verletzt werden. Die neuen Befehle implementieren Schätzmethoden, die die Heterogenität der ATET berücksichtigen und kohortenspezifische und zeitspezifische ATET-Schätzungen liefern.

Höhepunkte

  • Schätzung

    • Heterogenität über Kohorte und Zeit

    • Panel-Daten

    • Wiederholte Querschnittsdaten

  • Vier Schätzer

    • Regressionsanpassung (RA)

    • Umgekehrte Wahrscheinlichkeitsgewichtung (IPW)

    • Erweiterte inverse Wahrscheinlichkeitsgewichtung (AIPW)

    • Zwei-Wege-Regression mit festen Effekten (TWFE)

  • Darstellung der Heterogenität der Behandlungseffekte

  • Test der parallelen Vorbehandlungstendenzen

  • Aggregation von ATETs über:

    • Kohorte

    • Zeit

    • Exposition gegenüber der Behandlung

  • Gleichzeitige Konfidenzintervalle

Wir wollen sehen, wie es funktioniert

Wir möchten wissen, ob ein Programm auf Schulbezirksebene, Healthy Habits, den Body-Mass-Index (BMI) der Schüler im Schulbezirk reduziert. Wir haben fiktive Daten über das Programm „Gesunde Gewohnheiten“. Dieses Programm sieht mehr Bewegungszeit vor und erhöht den Verzehr von Obst und Gemüse. Unsere Daten beziehen sich auf die Ebene des Schulbezirks und enthalten Informationen darüber, ob eine Schule an dem Programm teilnimmt, hhabit, und den BMI der Schüler im Bezirk, bmi. Wir verfügen über wiederholte Stichproben von Schülern im Alter von 11 bis 14 Jahren aus 40 Schulbezirken von 2013 bis 2021.

Für das Ergebnismodell glauben wir, dass die Bildung der Mutter, medu, ein guter Prädiktor für die Gesundheitsgewohnheiten der Kinder ist. Wir glauben auch, dass die Teilnahme am Sport den BMI beeinflusst. Schließlich kontrollieren wir, ob der Schüler ein Mädchen ist, um Verhaltensunterschiede und Unterschiede im Körperbau von Jungen und Mädchen in diesem Alter zu berücksichtigen.

Für das Behandlungsmodell verwenden wir die Anzahl der Parks im Bezirk (parksd), um hhabit zu modellieren. Wir vermuten, dass Schulbezirke mit mehr Parks Bewegungsräume in ihrer Stadtplanung für wichtiger halten als solche mit weniger Parks. Diese Bezirke sind daher eher für das Programm Gesunde Lebensgewohnheiten geeignet.

Wir verwenden den aipw-Schätzer, um sowohl das Ergebnis als auch die Behandlung zu modellieren. Der aipw-Schätzer hat eine doppelte Robustheitseigenschaft, was bedeutet, dass nur eines der beiden Modelle (Ergebnis- oder Behandlungsmodell) korrekt spezifiziert sein muss, um konsistente Schätzungen zu erhalten.

Wir passen das folgende Modell an:

. hdidregress aipw (bmi medu i.girl i.sports) (hhabit parksd), group(schools) time(year)
note: variable _did_cohort, containing cohort indicators formed by treatment variable hhabit and
      group variable schools, was added to the dataset.

Computing ATET for each cohort and time:
Cohort 2015 (8): ........ done
Cohort 2017 (8): ........ done
Cohort 2019 (8): ........ done

Treatment and time information

Time variable: year
Time interval: 2013 to 2021
Control:       _did_cohort = 0
Treatment:     _did_cohort > 0
 
    _did_cohort
 
Number of cohorts   4
 
Number of obs  
Never treated   11355
2015   1231
2017   2097
2019   2042
 
Heterogeneous treatment-effects regression              Number of obs = 16,725
Estimator:       Augmented IPW
Treatment level: schools
Control group:   Never treated

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Cohort   ATET std. err. z P>|z| [95% conf. interval]
 
2015    
year    
2014   .6544681 .5946048 1.10 0.271 -.5109359 1.819872
2015   -1.226451 .379168 -3.23 0.001 -1.969607 -.4832957
2016   -2.491842 .4169657 -5.98 0.000 -3.30908 -1.674605
2017   -2.72486 .2363878 -11.53 0.000 -3.188171 -2.261548
2018   -2.786634 .6672867 -4.18 0.000 -4.094492 -1.478776
2019   -3.980456 .2993279 -13.30 0.000 -4.567127 -3.393784
2020   -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
2021   -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
 
2017    
year    
2014   .6635794 .3089663 2.15 0.032 .0580167 1.269142
2015   -1.3933 .3871204 -3.60 0.000 -2.152042 -.6345582
2016   .5947865 .4065947 1.46 0.144 -.2021245 1.391697
2017   -1.71427 .4565384 -3.75 0.000 -2.609069 -.8194714
2018   -3.170542 .5221368 -6.07 0.000 -4.193912 -2.147173
2019   -2.967701 .4247053 -6.99 0.000 -3.800108 -2.135294
2020   .0360098 .6868764 0.05 0.958 -1.310243 1.382263
2021   -.957117 .3510986 -2.73 0.006 -1.645258 -.2689763
 
2019    
year    
2014   -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
2015   1.010288 .4808165 2.10 0.036 .067905 1.952671
2016   -.3809733 .4336764 -0.88 0.380 -1.230963 .4690169
2017   .5199519 .4849723 1.07 0.284 -.4305763 1.47048
2018   -.0315794 .5863875 -0.05 0.957 -1.180878 1.117719
2019   -3.602114 .3498692 -10.30 0.000 -4.287845 -2.916383
2020   -1.388906 .6765493 -2.05 0.040 -2.714919 -.0628943
2021   -.6222491 .5510466 -1.13 0.259 -1.70228 .4577824
 
Note: ATET computed using covariates.

Wir haben das Ergebnismodell in der ersten Klammer und das Behandlungsmodell in der zweiten Klammer angegeben. Wir haben auch die Option group(schools) angegeben, um zu definieren, dass die Behandlung auf Schulebene stattfindet und um Schulen als Clustervariable zu identifizieren. Schließlich haben wir in der Option time() eine Zeitvariable year angegeben.

Die Anmerkung unter dem Befehl weist darauf hin, dass die kategorische Variable _did_cohort mit Kohorteninformationen generiert wird. Einheiten in der gleichen Kohorte beginnen die Behandlung zur gleichen Zeit. Wir sehen, dass es in unseren Daten drei Kohorten gibt: 2015, 2017 und 2019. Außerdem sehen wir, dass 11.355 Beobachtungen nie behandelt wurden. Die Zeitvariable Jahr reicht von 2013 bis 2021.

In der Schätzungstabelle wird die ATET für jede Kohorte in jedem Jahr angegeben. Für die Kohorte 2015 im Jahr 2016 beträgt die ATET-Schätzung beispielsweise -2,5, was bedeutet, dass das Programm „Gesunde Lebensgewohnheiten“ den BMI von Schülern in einem Bezirk der Kohorte 2015 im Jahr 2016 im Vergleich zu einem Szenario, in dem der Bezirk nicht teilnimmt, im Durchschnitt um 2,5 reduziert. Die anderen Schätzungen können ähnlich interpretiert werden.

Es ist schwierig, die Trends bei den ATETs allein durch die Betrachtung aller ATETs-Schätzungen zu erkennen. Wir können estat atetplot verwenden, um das Zeitprofil der ATETs für jede Kohorte zu visualisieren. Wir geben die Option sci an, um die gleichzeitigen Konfidenzbänder anzuzeigen, die garantiert die wahren Werte der ATETs über alle Kohorten und die Zeit mit einem vordefinierten Wahrscheinlichkeitsniveau abdecken.

. estat atetplot, sci
 

Nach der Anpassung des Modells können wir die ATETs mit Hilfe der Estat-Aggregation nach Kohorte, Zeit und Behandlungsexposition aggregieren. Sie liefert eine Zusammenfassung verschiedener Aspekte der ATETs. Zum Beispiel verwenden wir estat aggregation, cohort, um die ATETs jeder Kohorte innerhalb der Zeit zusammenzufassen. Wir geben auch die Option graph an, um zusätzlich zur tabellarischen Ausgabe ein Diagramm der Aggregationen zu erhalten.

. estat aggregation, cohort graph

ATET over cohort                                        Number of obs = 16,725

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Cohort   ATET std. err. z P>|z| [95% conf. interval]
 
2015   -2.065755 .1999412 -10.33 0.000 -2.457633 -1.673877
2017   -1.7781 .4013978 -4.43 0.000 -2.564825 -.9913744
2019   -1.869405 .4650349 -4.02 0.000 -2.780857 -.9579538
 

 

Wenn wir schließlich die ATETs über verschiedene Behandlungsdauern hinweg zusammenfassen wollen, geben wir die Option dynamic an.

. estat aggregation, dynamic graph

Duration of exposure ATET                               Number of obs = 16,725

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Exposure   ATET std. err. z P>|z| [95% conf. interval]
 
-5   -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
-4   1.010288 .4808165 2.10 0.036 .067905 1.952671
-3   .1338267 .3091619 0.43 0.665 -.4721195 .739773
-2   -.4256324 .4292553 -0.99 0.321 -1.266957 .4156925
-1   .3727141 .3197563 1.17 0.244 -.2539967 .999425
0   -2.285098 .3827362 -5.97 0.000 -3.035248 -1.534949
1   -2.344265 .3829047 -6.12 0.000 -3.094744 -1.593785
2   -2.045521 .3911543 -5.23 0.000 -2.81217 -1.278873
3   -1.045601 .6840119 -1.53 0.126 -2.38624 .2950372
4   -2.145004 .5952525 -3.60 0.000 -3.311678 -.978331
5   -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
6   -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
 
Note: Exposure is the number of periods since the first treatment time.