New In
Хетерогенна разлика в разликите (DID)
Когато средните ефекти от лечението варират във времето и в кохортата, вече можете да използвате новите команди hdidregress и xthdidregress, за да оцените хетерогенните средни ефекти от лечението върху лекуваните лица (ATET). Използвайте hdidregress за повтарящи се данни от напречно сечение и xthdidregress за панелни данни. Изберете една от четирите оценки, включително корекция на регресията и претегляне по обратна вероятност. Начертайте времевите профили на ATETs за всяка кохорта с estat atetplot. Агрегирайте ATETs в рамките на кохортата, времето и експозицията на лечение с estat aggregation. Разгледайте повече функции след оценяване.
Ефектите от лечението измерват причинно-следствения ефект на лечението върху резултата. Лечението е нова лекарствена схема, хирургическа процедура, програма за обучение или дори рекламна кампания, предназначена да повлияе на резултат, като например кръвно налягане, мобилност, заетост или продажби. От интерес е да се оцени АТЕТ.
Стандартната оценка на разликата в различията (DID), реализирана в съществуващите команди didregress и xtdidregress, оценява АТЕТ, която е обща за всички групи във времето. Когато групите се третират в различни моменти от време, допускането за постоянна ATET може да бъде нарушено. Новите команди прилагат методи за оценяване, които отчитат хетерогенността на ATET и предоставят специфични за кохортата и времето оценки на ATET.
Акценти
-
Оценяване
-
Хетерогенност по отношение на кохортата и времето
-
Панелни данни
-
Повтарящи се данни от кръстосано сечение
-
-
Четири оценки
-
Регресионна корекция (RA)
-
Претегляне с обратна вероятност (IPW)
-
Разширено претегляне по обратна вероятност (AIPW)
-
Двупосочна регресия с фиксирани ефекти (TWFE)
-
-
Графики на хетерогенността на ефекта от лечението
-
Проверка на тенденциите за паралелна предварителна обработка
-
Агрегиране на ATET през:
-
Кохорта
-
Време
-
Излагане на лечение
-
-
Едновременни доверителни интервали
Нека видим как работи
Бихме искали да разберем дали програмата „Здравословни навици“ на ниво училищен район намалява индекса на телесна маса (ИТМ) на учениците в училищния район. Разполагаме с фиктивни данни за програмата „Здравословни навици“. Тази програма включва повече време за физически упражнения и увеличава приема на плодове и зеленчуци. Нашите данни са на ниво училищен район и включват информация за това дали дадено училище участва в програмата, hhabit, и за ИТМ на учениците в района, bmi. Разполагаме с многократни извадки от ученици на възраст между 11 и 14 години от 40 училищни района за периода от 2013 г. до 2021 г.
За модела на резултатите смятаме, че образованието на майката, medu, е добър предиктор за здравните навици на децата. Също така смятаме, че участието в спортни занимания, спорт, влияе върху bmi. И накрая, контролираме дали ученикът е момиче, за да отчетем разликите в поведението и разликите в типовете тяло на момчетата и момичетата на тази възраст.
За модела на третиране използваме броя на парковете в района (parksd), за да моделираме hhabit. Предполагаме, че училищните райони с повече паркове смятат, че местата за упражнения са по-важни в тяхното градско планиране, отколкото тези с по-малко паркове. Следователно тези райони са по-подходящи за програмата „Здравословни навици“.
Използваме оценителя aipw за моделиране както на резултата, така и на третирането. Оценителят aipw има свойството на двойна достоверност, което означава, че само един от моделите на резултатите или на лечението трябва да бъде правилно определен, за да се получат последователни оценки.
Прилагаме следния модел:
. hdidregress aipw (bmi medu i.girl i.sports) (hhabit parksd), group(schools) time(year) note: variable _did_cohort, containing cohort indicators formed by treatment variable hhabit and group variable schools, was added to the dataset. Computing ATET for each cohort and time: Cohort 2015 (8): ........ done Cohort 2017 (8): ........ done Cohort 2019 (8): ........ done Treatment and time information Time variable: year Time interval: 2013 to 2021 Control: _did_cohort = 0 Treatment: _did_cohort > 0
_did_cohort | ||
Number of cohorts | 4 | |
Number of obs | ||
Never treated | 11355 | |
2015 | 1231 | |
2017 | 2097 | |
2019 | 2042 | |
Heterogeneous treatment-effects regression Number of obs = 16,725 Estimator: Augmented IPW Treatment level: schools Control group: Never treated (Std. err. adjusted for 40 clusters in schools)
Robust | ||
Cohort | ATET std. err. z P>|z| [95% conf. interval] | |
2015 | ||
year | ||
2014 | .6544681 .5946048 1.10 0.271 -.5109359 1.819872 | |
2015 | -1.226451 .379168 -3.23 0.001 -1.969607 -.4832957 | |
2016 | -2.491842 .4169657 -5.98 0.000 -3.30908 -1.674605 | |
2017 | -2.72486 .2363878 -11.53 0.000 -3.188171 -2.261548 | |
2018 | -2.786634 .6672867 -4.18 0.000 -4.094492 -1.478776 | |
2019 | -3.980456 .2993279 -13.30 0.000 -4.567127 -3.393784 | |
2020 | -.604415 .5929199 -1.02 0.308 -1.766517 .5576866 | |
2021 | -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812 | |
2017 | ||
year | ||
2014 | .6635794 .3089663 2.15 0.032 .0580167 1.269142 | |
2015 | -1.3933 .3871204 -3.60 0.000 -2.152042 -.6345582 | |
2016 | .5947865 .4065947 1.46 0.144 -.2021245 1.391697 | |
2017 | -1.71427 .4565384 -3.75 0.000 -2.609069 -.8194714 | |
2018 | -3.170542 .5221368 -6.07 0.000 -4.193912 -2.147173 | |
2019 | -2.967701 .4247053 -6.99 0.000 -3.800108 -2.135294 | |
2020 | .0360098 .6868764 0.05 0.958 -1.310243 1.382263 | |
2021 | -.957117 .3510986 -2.73 0.006 -1.645258 -.2689763 | |
2019 | ||
year | ||
2014 | -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476 | |
2015 | 1.010288 .4808165 2.10 0.036 .067905 1.952671 | |
2016 | -.3809733 .4336764 -0.88 0.380 -1.230963 .4690169 | |
2017 | .5199519 .4849723 1.07 0.284 -.4305763 1.47048 | |
2018 | -.0315794 .5863875 -0.05 0.957 -1.180878 1.117719 | |
2019 | -3.602114 .3498692 -10.30 0.000 -4.287845 -2.916383 | |
2020 | -1.388906 .6765493 -2.05 0.040 -2.714919 -.0628943 | |
2021 | -.6222491 .5510466 -1.13 0.259 -1.70228 .4577824 | |
Note: ATET computed using covariates.
Моделът на резултата е посочен в първата група скоби, а моделът на третирането – във втората група скоби. Посочихме също така опцията group(schools), за да определим, че лечението се извършва на ниво училище, и да определим училищата като променлива за групиране. И накрая, в опцията time() посочихме времева променлива year.
Бележката под командата посочва, че категориалната променлива _did_cohort се генерира с информация за кохортата. Единици в една и съща кохорта започват лечението по едно и също време. Виждаме, че в нашите данни има три кохорти: 2015 г., 2017 г. и 2019 г. Освен това виждаме, че 11 355 наблюдения никога не са третирани. Променливата за времето година варира от 2013 г. до 2021 г.
В таблицата за оценка е представена АТЕТ за всяка кохорта през всяка година. Например за кохорта 2015 г. през 2016 г. оценката на ATET е -2,5, което означава, че програмата „Здравословни навици“ средно намалява ИТМ с 2,5 за учениците в даден район от кохорта 2015 г. през 2016 г. спрямо сценария, при който районът не участва. Другите оценки могат да се тълкуват по подобен начин.
Трудно е да се видят тенденциите в АТЕТ само като се разгледат всички оценки на АТЕТ. Можем да използваме estat atetplot, за да визуализираме времевия профил на ATETs за всяка кохорта. Посочваме опцията sci, за да покажем едновременно доверителните интервали, които гарантирано обхващат истинските стойности на ATETs във всички кохорти и във времето с предварително определено ниво на вероятност.
. estat atetplot, sci
След като сме подготвили модела, можем да използваме агрегацията на estat, за да обобщим ATET в рамките на кохортата, времето и експозицията на лечение. Това дава възможност за обобщаване на различните аспекти на ATETs. Например, използваме estat aggregation, cohort, за да обобщим ATETs на всяка кохорта в рамките на времето. Посочваме и опцията graph, за да получим графика на агрегациите в допълнение към табличния изход.
. estat aggregation, cohort graph ATET over cohort Number of obs = 16,725 (Std. err. adjusted for 40 clusters in schools)
Robust | ||
Cohort | ATET std. err. z P>|z| [95% conf. interval] | |
2015 | -2.065755 .1999412 -10.33 0.000 -2.457633 -1.673877 | |
2017 | -1.7781 .4013978 -4.43 0.000 -2.564825 -.9913744 | |
2019 | -1.869405 .4650349 -4.02 0.000 -2.780857 -.9579538 | |
И накрая, ако искаме да обобщим АТЕТ за различни периоди на излагане на лечение, посочваме опцията dynamic.
. estat aggregation, dynamic graph Duration of exposure ATET Number of obs = 16,725 (Std. err. adjusted for 40 clusters in schools)
Robust | ||
Exposure | ATET std. err. z P>|z| [95% conf. interval] | |
-5 | -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476 | |
-4 | 1.010288 .4808165 2.10 0.036 .067905 1.952671 | |
-3 | .1338267 .3091619 0.43 0.665 -.4721195 .739773 | |
-2 | -.4256324 .4292553 -0.99 0.321 -1.266957 .4156925 | |
-1 | .3727141 .3197563 1.17 0.244 -.2539967 .999425 | |
0 | -2.285098 .3827362 -5.97 0.000 -3.035248 -1.534949 | |
1 | -2.344265 .3829047 -6.12 0.000 -3.094744 -1.593785 | |
2 | -2.045521 .3911543 -5.23 0.000 -2.81217 -1.278873 | |
3 | -1.045601 .6840119 -1.53 0.126 -2.38624 .2950372 | |
4 | -2.145004 .5952525 -3.60 0.000 -3.311678 -.978331 | |
5 | -.604415 .5929199 -1.02 0.308 -1.766517 .5576866 | |
6 | -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812 | |
Note: Exposure is the number of periods since the first treatment time.