New In

Diferența eterogenă în diferențe (DID)

Atunci când efectele medii ale tratamentului variază în timp și în funcție de cohortă, puteți utiliza acum noile comenzi hdidregress și xthdidregress pentru a estima efectele medii eterogene ale tratamentului asupra celor tratați (ATET). Utilizați hdidregress cu date transversale repetate și xthdidregress cu date de panel. Alegeți unul dintre cei patru estimatori, inclusiv ajustarea regresiei și ponderarea probabilității inverse. Reprezentați profilurile temporale ATETs pentru fiecare cohortă cu estat atetplot. Agregarea ATET-urilor în cadrul cohortei, timpului și expunerii la tratament cu estat aggregation. Explorați mai multe caracteristici postestimare.

Efectele tratamentului măsoară efectul cauzal al unui tratament asupra unui rezultat. Un tratament este un nou regim medicamentos, o procedură chirurgicală, un program de formare sau chiar o campanie publicitară menită să afecteze un rezultat, cum ar fi tensiunea arterială, mobilitatea, ocuparea forței de muncă sau vânzările. Este interesant să se estimeze un ATET.

Estimatorul standard de diferențe în diferențe (DID), implementat în comenzile existente didregress și xtdidregress, estimează un ATET care este comun tuturor grupurilor în timp. Atunci când grupurile sunt tratate în momente diferite în timp, ipoteza privind un ATET constant poate fi încălcată. Noile comenzi implementează metode de estimare care țin cont de eterogenitatea ATET și oferă estimări ATET specifice cohortei și specifice în timp.

Repere

  • Estimare

    • Eterogenitate în cohortă și în timp

    • Date panel

    • Date transversale repetate

  • Patru estimatori

    • Ajustarea regresiei (RA)

    • Ponderarea inversă a probabilității (IPW)

    • Ponderarea inversă de probabilitate augmentată (AIPW)

    • Regresie cu efecte fixe în două direcții (TWFE)

  • Graficele de eterogenitate a efectelor tratamentului

  • Testarea tendințelor paralele de pretratament

  • Agregarea ATET-urilor peste:

    • Cohorta

    • Timp

    • Expunerea la tratament

  • Intervale de încredere simultane

Să vedem cum funcționează

Am dori să aflăm dacă un program la nivelul districtului școlar, Healthy Habits, reduce indicele de masă corporală (IMC) al elevilor din districtul școlar. Dispunem de date fictive privind programul Healthy Habits. Acest program încorporează mai mult timp de exerciții fizice și mărește consumul de fructe și legume. Datele noastre sunt la nivelul districtului școlar și includ informații despre faptul dacă o școală participă la program, hhabit, și IMC-ul elevilor din district, bmi. Avem eșantioane repetate de elevi cu vârste cuprinse între 11 și 14 ani din 40 de districte școlare din 2013 până în 2021.

Pentru modelul de rezultat, considerăm că educația mamei, medu, este un bun predictor al obiceiurilor de sănătate ale copiilor. De asemenea, credem că participarea la sport, sport, afectează bmi. În cele din urmă, controlăm dacă elevul este fată pentru a ține cont de diferențele comportamentale și de diferențele dintre tipurile de corp ale băieților și fetelor la această vârstă.

Pentru modelul de tratament, folosim numărul de parcuri din district (parksd) pentru a modela hhabit. Conjecturăm că districtele școlare cu mai multe parcuri consideră că spațiile de exerciții fizice sunt mai importante în planificarea lor urbană decât cele cu mai puține parcuri. Aceste districte sunt, prin urmare, mai predispuse la programul Healthy Habits.

Utilizăm estimatorul aipw pentru a modela atât rezultatul, cât și tratamentul. Estimatorul aipw are o proprietate de dublă robustețe, ceea ce implică faptul că doar unul dintre modelele de rezultat sau de tratament trebuie să fie specificat corect pentru a obține estimări coerente.

Am ajustat următorul model:

. hdidregress aipw (bmi medu i.girl i.sports) (hhabit parksd), group(schools) time(year)
note: variable _did_cohort, containing cohort indicators formed by treatment variable hhabit and
      group variable schools, was added to the dataset.

Computing ATET for each cohort and time:
Cohort 2015 (8): ........ done
Cohort 2017 (8): ........ done
Cohort 2019 (8): ........ done

Treatment and time information

Time variable: year
Time interval: 2013 to 2021
Control:       _did_cohort = 0
Treatment:     _did_cohort > 0
 
    _did_cohort
 
Number of cohorts   4
 
Number of obs  
Never treated   11355
2015   1231
2017   2097
2019   2042
 
Heterogeneous treatment-effects regression              Number of obs = 16,725
Estimator:       Augmented IPW
Treatment level: schools
Control group:   Never treated

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Cohort   ATET std. err. z P>|z| [95% conf. interval]
 
2015    
year    
2014   .6544681 .5946048 1.10 0.271 -.5109359 1.819872
2015   -1.226451 .379168 -3.23 0.001 -1.969607 -.4832957
2016   -2.491842 .4169657 -5.98 0.000 -3.30908 -1.674605
2017   -2.72486 .2363878 -11.53 0.000 -3.188171 -2.261548
2018   -2.786634 .6672867 -4.18 0.000 -4.094492 -1.478776
2019   -3.980456 .2993279 -13.30 0.000 -4.567127 -3.393784
2020   -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
2021   -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
 
2017    
year    
2014   .6635794 .3089663 2.15 0.032 .0580167 1.269142
2015   -1.3933 .3871204 -3.60 0.000 -2.152042 -.6345582
2016   .5947865 .4065947 1.46 0.144 -.2021245 1.391697
2017   -1.71427 .4565384 -3.75 0.000 -2.609069 -.8194714
2018   -3.170542 .5221368 -6.07 0.000 -4.193912 -2.147173
2019   -2.967701 .4247053 -6.99 0.000 -3.800108 -2.135294
2020   .0360098 .6868764 0.05 0.958 -1.310243 1.382263
2021   -.957117 .3510986 -2.73 0.006 -1.645258 -.2689763
 
2019    
year    
2014   -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
2015   1.010288 .4808165 2.10 0.036 .067905 1.952671
2016   -.3809733 .4336764 -0.88 0.380 -1.230963 .4690169
2017   .5199519 .4849723 1.07 0.284 -.4305763 1.47048
2018   -.0315794 .5863875 -0.05 0.957 -1.180878 1.117719
2019   -3.602114 .3498692 -10.30 0.000 -4.287845 -2.916383
2020   -1.388906 .6765493 -2.05 0.040 -2.714919 -.0628943
2021   -.6222491 .5510466 -1.13 0.259 -1.70228 .4577824
 
Note: ATET computed using covariates.

Am specificat modelul de rezultat în primul set de paranteze și modelul de tratament în al doilea set de paranteze. De asemenea, am specificat opțiunea group(schools) pentru a defini faptul că tratamentul are loc la nivelul școlii și pentru a identifica școlile ca fiind variabila de grupare. În cele din urmă, am specificat o variabilă temporală an în opțiunea time().

Nota de sub comandă indică faptul că variabila categorială _did_cohort este generată cu informații despre cohortă. Unitățile din aceeași cohortă încep tratamentul în același timp. Vedem că există trei cohorte în datele noastre: 2015, 2017 și 2019. În plus, observăm că 11 355 de observații nu sunt tratate niciodată. Variabila de timp an variază între 2013 și 2021.

Tabelul de estimare raportează ATET pentru fiecare cohortă în fiecare an. De exemplu, pentru cohorta 2015 în anul 2016, estimarea ATET este -2,5, ceea ce implică faptul că programul Healthy Habits, în medie, reduce IMC cu 2,5 pentru elevii dintr-un district din cohorta 2015 în 2016 în raport cu scenariul în care districtul nu participă. Celelalte estimări pot fi interpretate în mod similar.

Este dificil să se observe tendințele ATET-urilor doar prin examinarea tuturor estimărilor ATET-urilor. Putem utiliza estat atetplot pentru a vizualiza profilul temporal al ATETs pentru fiecare cohortă. Specificăm opțiunea sci pentru a afișa benzile de încredere simultane garantate să acopere valorile reale ale ATETs în toate cohortele și în timp cu un nivel de probabilitate predefinit.

. estat atetplot, sci
 

După ajustarea modelului, putem utiliza agregarea estat pentru a agrega ATET-urile în funcție de cohortă, timp și expunerea la tratament. Aceasta oferă un rezumat al diferitelor aspecte ale ATET-urilor. De exemplu, folosim estat aggregation, cohortă pentru a rezuma ATET-urile fiecărei cohorte în timp. De asemenea, specificăm opțiunea graph pentru a obține un grafic al agregărilor, în plus față de rezultatul tabelar.

. estat aggregation, cohort graph

ATET over cohort                                        Number of obs = 16,725

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Cohort   ATET std. err. z P>|z| [95% conf. interval]
 
2015   -2.065755 .1999412 -10.33 0.000 -2.457633 -1.673877
2017   -1.7781 .4013978 -4.43 0.000 -2.564825 -.9913744
2019   -1.869405 .4650349 -4.02 0.000 -2.780857 -.9579538
 

 

În cele din urmă, dacă dorim să rezumăm ATET-urile pe diferite durate de expunere la tratament, vom specifica opțiunea dinamică.

. estat aggregation, dynamic graph

Duration of exposure ATET                               Number of obs = 16,725

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Exposure   ATET std. err. z P>|z| [95% conf. interval]
 
-5   -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
-4   1.010288 .4808165 2.10 0.036 .067905 1.952671
-3   .1338267 .3091619 0.43 0.665 -.4721195 .739773
-2   -.4256324 .4292553 -0.99 0.321 -1.266957 .4156925
-1   .3727141 .3197563 1.17 0.244 -.2539967 .999425
0   -2.285098 .3827362 -5.97 0.000 -3.035248 -1.534949
1   -2.344265 .3829047 -6.12 0.000 -3.094744 -1.593785
2   -2.045521 .3911543 -5.23 0.000 -2.81217 -1.278873
3   -1.045601 .6840119 -1.53 0.126 -2.38624 .2950372
4   -2.145004 .5952525 -3.60 0.000 -3.311678 -.978331
5   -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
6   -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
 
Note: Exposure is the number of periods since the first treatment time.