New In

Хетерогенна разлика в разликите (DID)

Когато средните ефекти от лечението варират във времето и в кохортата, вече можете да използвате новите команди hdidregress и xthdidregress, за да оцените хетерогенните средни ефекти от лечението върху лекуваните лица (ATET). Използвайте hdidregress за повтарящи се данни от напречно сечение и xthdidregress за панелни данни. Изберете една от четирите оценки, включително корекция на регресията и претегляне по обратна вероятност. Начертайте времевите профили на ATETs за всяка кохорта с estat atetplot. Агрегирайте ATETs в рамките на кохортата, времето и експозицията на лечение с estat aggregation. Разгледайте повече функции след оценяване.

Ефектите от лечението измерват причинно-следствения ефект на лечението върху резултата. Лечението е нова лекарствена схема, хирургическа процедура, програма за обучение или дори рекламна кампания, предназначена да повлияе на резултат, като например кръвно налягане, мобилност, заетост или продажби. От интерес е да се оцени АТЕТ.

Стандартната оценка на разликата в различията (DID), реализирана в съществуващите команди didregress и xtdidregress, оценява АТЕТ, която е обща за всички групи във времето. Когато групите се третират в различни моменти от време, допускането за постоянна ATET може да бъде нарушено. Новите команди прилагат методи за оценяване, които отчитат хетерогенността на ATET и предоставят специфични за кохортата и времето оценки на ATET.

Акценти

  • Оценяване

    • Хетерогенност по отношение на кохортата и времето

    • Панелни данни

    • Повтарящи се данни от кръстосано сечение

  • Четири оценки

    • Регресионна корекция (RA)

    • Претегляне с обратна вероятност (IPW)

    • Разширено претегляне по обратна вероятност (AIPW)

    • Двупосочна регресия с фиксирани ефекти (TWFE)

  • Графики на хетерогенността на ефекта от лечението

  • Проверка на тенденциите за паралелна предварителна обработка

  • Агрегиране на ATET през:

    • Кохорта

    • Време

    • Излагане на лечение

  • Едновременни доверителни интервали

Нека видим как работи

Бихме искали да разберем дали програмата „Здравословни навици“ на ниво училищен район намалява индекса на телесна маса (ИТМ) на учениците в училищния район. Разполагаме с фиктивни данни за програмата „Здравословни навици“. Тази програма включва повече време за физически упражнения и увеличава приема на плодове и зеленчуци. Нашите данни са на ниво училищен район и включват информация за това дали дадено училище участва в програмата, hhabit, и за ИТМ на учениците в района, bmi. Разполагаме с многократни извадки от ученици на възраст между 11 и 14 години от 40 училищни района за периода от 2013 г. до 2021 г.

За модела на резултатите смятаме, че образованието на майката, medu, е добър предиктор за здравните навици на децата. Също така смятаме, че участието в спортни занимания, спорт, влияе върху bmi. И накрая, контролираме дали ученикът е момиче, за да отчетем разликите в поведението и разликите в типовете тяло на момчетата и момичетата на тази възраст.

За модела на третиране използваме броя на парковете в района (parksd), за да моделираме hhabit. Предполагаме, че училищните райони с повече паркове смятат, че местата за упражнения са по-важни в тяхното градско планиране, отколкото тези с по-малко паркове. Следователно тези райони са по-подходящи за програмата „Здравословни навици“.

Използваме оценителя aipw за моделиране както на резултата, така и на третирането. Оценителят aipw има свойството на двойна достоверност, което означава, че само един от моделите на резултатите или на лечението трябва да бъде правилно определен, за да се получат последователни оценки.

Прилагаме следния модел:

. hdidregress aipw (bmi medu i.girl i.sports) (hhabit parksd), group(schools) time(year)
note: variable _did_cohort, containing cohort indicators formed by treatment variable hhabit and
      group variable schools, was added to the dataset.

Computing ATET for each cohort and time:
Cohort 2015 (8): ........ done
Cohort 2017 (8): ........ done
Cohort 2019 (8): ........ done

Treatment and time information

Time variable: year
Time interval: 2013 to 2021
Control:       _did_cohort = 0
Treatment:     _did_cohort > 0
 
    _did_cohort
 
Number of cohorts   4
 
Number of obs  
Never treated   11355
2015   1231
2017   2097
2019   2042
 
Heterogeneous treatment-effects regression              Number of obs = 16,725
Estimator:       Augmented IPW
Treatment level: schools
Control group:   Never treated

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Cohort   ATET std. err. z P>|z| [95% conf. interval]
 
2015    
year    
2014   .6544681 .5946048 1.10 0.271 -.5109359 1.819872
2015   -1.226451 .379168 -3.23 0.001 -1.969607 -.4832957
2016   -2.491842 .4169657 -5.98 0.000 -3.30908 -1.674605
2017   -2.72486 .2363878 -11.53 0.000 -3.188171 -2.261548
2018   -2.786634 .6672867 -4.18 0.000 -4.094492 -1.478776
2019   -3.980456 .2993279 -13.30 0.000 -4.567127 -3.393784
2020   -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
2021   -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
 
2017    
year    
2014   .6635794 .3089663 2.15 0.032 .0580167 1.269142
2015   -1.3933 .3871204 -3.60 0.000 -2.152042 -.6345582
2016   .5947865 .4065947 1.46 0.144 -.2021245 1.391697
2017   -1.71427 .4565384 -3.75 0.000 -2.609069 -.8194714
2018   -3.170542 .5221368 -6.07 0.000 -4.193912 -2.147173
2019   -2.967701 .4247053 -6.99 0.000 -3.800108 -2.135294
2020   .0360098 .6868764 0.05 0.958 -1.310243 1.382263
2021   -.957117 .3510986 -2.73 0.006 -1.645258 -.2689763
 
2019    
year    
2014   -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
2015   1.010288 .4808165 2.10 0.036 .067905 1.952671
2016   -.3809733 .4336764 -0.88 0.380 -1.230963 .4690169
2017   .5199519 .4849723 1.07 0.284 -.4305763 1.47048
2018   -.0315794 .5863875 -0.05 0.957 -1.180878 1.117719
2019   -3.602114 .3498692 -10.30 0.000 -4.287845 -2.916383
2020   -1.388906 .6765493 -2.05 0.040 -2.714919 -.0628943
2021   -.6222491 .5510466 -1.13 0.259 -1.70228 .4577824
 
Note: ATET computed using covariates.

Моделът на резултата е посочен в първата група скоби, а моделът на третирането – във втората група скоби. Посочихме също така опцията group(schools), за да определим, че лечението се извършва на ниво училище, и да определим училищата като променлива за групиране. И накрая, в опцията time() посочихме времева променлива year.

Бележката под командата посочва, че категориалната променлива _did_cohort се генерира с информация за кохортата. Единици в една и съща кохорта започват лечението по едно и също време. Виждаме, че в нашите данни има три кохорти: 2015 г., 2017 г. и 2019 г. Освен това виждаме, че 11 355 наблюдения никога не са третирани. Променливата за времето година варира от 2013 г. до 2021 г.

В таблицата за оценка е представена АТЕТ за всяка кохорта през всяка година. Например за кохорта 2015 г. през 2016 г. оценката на ATET е -2,5, което означава, че програмата „Здравословни навици“ средно намалява ИТМ с 2,5 за учениците в даден район от кохорта 2015 г. през 2016 г. спрямо сценария, при който районът не участва. Другите оценки могат да се тълкуват по подобен начин.

Трудно е да се видят тенденциите в АТЕТ само като се разгледат всички оценки на АТЕТ. Можем да използваме estat atetplot, за да визуализираме времевия профил на ATETs за всяка кохорта. Посочваме опцията sci, за да покажем едновременно доверителните интервали, които гарантирано обхващат истинските стойности на ATETs във всички кохорти и във времето с предварително определено ниво на вероятност.

. estat atetplot, sci
 

След като сме подготвили модела, можем да използваме агрегацията на estat, за да обобщим ATET в рамките на кохортата, времето и експозицията на лечение. Това дава възможност за обобщаване на различните аспекти на ATETs. Например, използваме estat aggregation, cohort, за да обобщим ATETs на всяка кохорта в рамките на времето. Посочваме и опцията graph, за да получим графика на агрегациите в допълнение към табличния изход.

. estat aggregation, cohort graph

ATET over cohort                                        Number of obs = 16,725

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Cohort   ATET std. err. z P>|z| [95% conf. interval]
 
2015   -2.065755 .1999412 -10.33 0.000 -2.457633 -1.673877
2017   -1.7781 .4013978 -4.43 0.000 -2.564825 -.9913744
2019   -1.869405 .4650349 -4.02 0.000 -2.780857 -.9579538
 

 

И накрая, ако искаме да обобщим АТЕТ за различни периоди на излагане на лечение, посочваме опцията dynamic.

. estat aggregation, dynamic graph

Duration of exposure ATET                               Number of obs = 16,725

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Exposure   ATET std. err. z P>|z| [95% conf. interval]
 
-5   -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
-4   1.010288 .4808165 2.10 0.036 .067905 1.952671
-3   .1338267 .3091619 0.43 0.665 -.4721195 .739773
-2   -.4256324 .4292553 -0.99 0.321 -1.266957 .4156925
-1   .3727141 .3197563 1.17 0.244 -.2539967 .999425
0   -2.285098 .3827362 -5.97 0.000 -3.035248 -1.534949
1   -2.344265 .3829047 -6.12 0.000 -3.094744 -1.593785
2   -2.045521 .3911543 -5.23 0.000 -2.81217 -1.278873
3   -1.045601 .6840119 -1.53 0.126 -2.38624 .2950372
4   -2.145004 .5952525 -3.60 0.000 -3.311678 -.978331
5   -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
6   -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
 
Note: Exposure is the number of periods since the first treatment time.