New In
Гетерогенная разница в различиях (DID)
Если средние эффекты лечения различаются по времени и по когортам, то для оценки неоднородных средних эффектов лечения для обработанных (ATET) теперь можно использовать новые команды hdidregress и xthdidregress. Используйте команды hdidregress для повторных кросс-секционных данных и xthdidregress для панельных данных. Выберите одну из четырех оценок, включая корректировку регрессии и взвешивание с обратной вероятностью. Постройте временные профили ATETs для каждой когорты с помощью estat atetplot. Агрегируйте ATETs в пределах когорты, времени и воздействия лечения с помощью функции estat aggregation. Изучите дополнительные возможности постоценки.
Эффекты лечения измеряют причинный эффект лечения на исход. Лечение — это новая схема приема лекарств, хирургическая операция, программа обучения или даже рекламная кампания, призванная повлиять на такой результат, как артериальное давление, мобильность, занятость или продажи. Представляет интерес оценка ATET.
Стандартная оценка разности различий (DID), реализованная в существующих командах didregress и xtdidregress, оценивает ATET, общую для всех групп во времени. Когда группы получают лечение в разные моменты времени, предположение о постоянстве ATET может быть нарушено. В новых командах реализованы методы оценки, учитывающие неоднородность ATET и позволяющие получить оценки ATET для конкретной когорты и для конкретного времени.
Основные моменты
-
Оценка
-
Гетерогенность по когортам и времени
-
Панельные данные
-
Повторные кросс-секционные данные
-
-
Четыре оценщика
-
Регрессионная корректировка (РА)
-
Обратно-вероятностное взвешивание (IPW)
-
Дополненное инверсно-вероятностное взвешивание (AIPW)
-
Двусторонняя регрессия с фиксированными эффектами (TWFE)
-
-
Графики неоднородности эффектов лечения
-
Тест параллельных направлений предварительной обработки
-
Агрегирование АТЭЦ по:
-
Когорта
-
Время
-
Подверженность лечению
-
-
Одновременные доверительные интервалы
Давайте посмотрим, как это работает
Мы хотели бы узнать, снижает ли программа «Здоровые привычки», реализуемая на уровне школьного округа, индекс массы тела (ИМТ) учащихся в школьном округе. У нас есть фиктивные данные по программе «Здоровые привычки». Эта программа предусматривает увеличение времени на физические упражнения и увеличение потребления фруктов и овощей. Наши данные представлены на уровне школьного округа и включают информацию о том, участвует ли школа в программе, hhabit, и об индексе массы тела учащихся в округе, bmi. Мы имеем повторяющиеся выборки учащихся в возрасте от 11 до 14 лет из 40 школьных округов с 2013 по 2021 год.
В модели исходов мы считаем, что образование матери, medu, является хорошим предиктором здоровых привычек детей. Мы также считаем, что участие в спортивных мероприятиях, sports, влияет на массу тела. Наконец, мы контролируем, является ли ученик девочкой, чтобы учесть поведенческие различия и различия в типах телосложения мальчиков и девочек в этом возрасте.
Для модели лечения мы используем количество парков в районе (parksd) для моделирования hhabit. Мы предполагаем, что школьные округа с большим количеством парков считают места для занятий физкультурой более важными при планировании города, чем округа с меньшим количеством парков. Поэтому такие районы более благоприятны для реализации программы «Здоровые привычки».
Мы используем оценку aipw для моделирования как результата, так и лечения. Оценщик aipw обладает свойством двойной устойчивости, что означает, что для получения устойчивых оценок необходимо правильно указать только одну из моделей исхода или лечения.
Мы построили следующую модель:
. hdidregress aipw (bmi medu i.girl i.sports) (hhabit parksd), group(schools) time(year) note: variable _did_cohort, containing cohort indicators formed by treatment variable hhabit and group variable schools, was added to the dataset. Computing ATET for each cohort and time: Cohort 2015 (8): ........ done Cohort 2017 (8): ........ done Cohort 2019 (8): ........ done Treatment and time information Time variable: year Time interval: 2013 to 2021 Control: _did_cohort = 0 Treatment: _did_cohort > 0
_did_cohort | ||
Number of cohorts | 4 | |
Number of obs | ||
Never treated | 11355 | |
2015 | 1231 | |
2017 | 2097 | |
2019 | 2042 | |
Heterogeneous treatment-effects regression Number of obs = 16,725 Estimator: Augmented IPW Treatment level: schools Control group: Never treated (Std. err. adjusted for 40 clusters in schools)
Robust | ||
Cohort | ATET std. err. z P>|z| [95% conf. interval] | |
2015 | ||
year | ||
2014 | .6544681 .5946048 1.10 0.271 -.5109359 1.819872 | |
2015 | -1.226451 .379168 -3.23 0.001 -1.969607 -.4832957 | |
2016 | -2.491842 .4169657 -5.98 0.000 -3.30908 -1.674605 | |
2017 | -2.72486 .2363878 -11.53 0.000 -3.188171 -2.261548 | |
2018 | -2.786634 .6672867 -4.18 0.000 -4.094492 -1.478776 | |
2019 | -3.980456 .2993279 -13.30 0.000 -4.567127 -3.393784 | |
2020 | -.604415 .5929199 -1.02 0.308 -1.766517 .5576866 | |
2021 | -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812 | |
2017 | ||
year | ||
2014 | .6635794 .3089663 2.15 0.032 .0580167 1.269142 | |
2015 | -1.3933 .3871204 -3.60 0.000 -2.152042 -.6345582 | |
2016 | .5947865 .4065947 1.46 0.144 -.2021245 1.391697 | |
2017 | -1.71427 .4565384 -3.75 0.000 -2.609069 -.8194714 | |
2018 | -3.170542 .5221368 -6.07 0.000 -4.193912 -2.147173 | |
2019 | -2.967701 .4247053 -6.99 0.000 -3.800108 -2.135294 | |
2020 | .0360098 .6868764 0.05 0.958 -1.310243 1.382263 | |
2021 | -.957117 .3510986 -2.73 0.006 -1.645258 -.2689763 | |
2019 | ||
year | ||
2014 | -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476 | |
2015 | 1.010288 .4808165 2.10 0.036 .067905 1.952671 | |
2016 | -.3809733 .4336764 -0.88 0.380 -1.230963 .4690169 | |
2017 | .5199519 .4849723 1.07 0.284 -.4305763 1.47048 | |
2018 | -.0315794 .5863875 -0.05 0.957 -1.180878 1.117719 | |
2019 | -3.602114 .3498692 -10.30 0.000 -4.287845 -2.916383 | |
2020 | -1.388906 .6765493 -2.05 0.040 -2.714919 -.0628943 | |
2021 | -.6222491 .5510466 -1.13 0.259 -1.70228 .4577824 | |
Note: ATET computed using covariates.
We specified the outcome model in the first set of parentheses and the treatment model in the second set of parentheses. We also specified option group(schools) to define that treatment occurs at the school level and to identify schools as the clustering variable. Finally, we specified a time variable year in option time().
The note below the command indicates that the categorical variable _did_cohort is generated with cohort information. Units in the same cohort start the treatment at the same time. We see that there are three cohorts in our data: 2015, 2017, and 2019. In addition, we see that 11,355 observations are never treated. The time variable year ranges from 2013 to 2021.
The estimation table reports the ATET for each cohort in each year. For example, for the cohort 2015 in the year 2016, the ATET estimate is –2.5, which implies the Healthy Habits program, on average, reduces BMI by 2.5 for students in a district of the 2015 cohort in 2016 relative to the scenario where the district does not participate. The other estimates can be interpreted similarly.
It is difficult to see the trends in ATETs just by looking at all the ATETs estimates. We can use estat atetplot to visualize the time profile of ATETs for each cohort. We specify option sci to show the simultaneous confidence bands guaranteed to cover the true values of ATETs across all the cohorts and time with a predefined probability level.
. estat atetplot, sci
После подгонки модели мы можем использовать агрегацию estat для агрегирования ATET в пределах когорты, времени и подверженности лечению. Это позволяет обобщить различные аспекты ATET. Например, мы используем estat aggregation, cohort для суммирования ATET каждой когорты в пределах времени. Также мы указываем опцию graph для получения графика агрегаций в дополнение к табличному результату.
. estat aggregation, cohort graph ATET over cohort Number of obs = 16,725 (Std. err. adjusted for 40 clusters in schools)
Robust | ||
Cohort | ATET std. err. z P>|z| [95% conf. interval] | |
2015 | -2.065755 .1999412 -10.33 0.000 -2.457633 -1.673877 | |
2017 | -1.7781 .4013978 -4.43 0.000 -2.564825 -.9913744 | |
2019 | -1.869405 .4650349 -4.02 0.000 -2.780857 -.9579538 | |
Наконец, если мы хотим просуммировать ATET по различным длительностям воздействия лечения, мы задаем вариант dynamic.
. estat aggregation, dynamic graph Duration of exposure ATET Number of obs = 16,725 (Std. err. adjusted for 40 clusters in schools)
Robust | ||
Exposure | ATET std. err. z P>|z| [95% conf. interval] | |
-5 | -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476 | |
-4 | 1.010288 .4808165 2.10 0.036 .067905 1.952671 | |
-3 | .1338267 .3091619 0.43 0.665 -.4721195 .739773 | |
-2 | -.4256324 .4292553 -0.99 0.321 -1.266957 .4156925 | |
-1 | .3727141 .3197563 1.17 0.244 -.2539967 .999425 | |
0 | -2.285098 .3827362 -5.97 0.000 -3.035248 -1.534949 | |
1 | -2.344265 .3829047 -6.12 0.000 -3.094744 -1.593785 | |
2 | -2.045521 .3911543 -5.23 0.000 -2.81217 -1.278873 | |
3 | -1.045601 .6840119 -1.53 0.126 -2.38624 .2950372 | |
4 | -2.145004 .5952525 -3.60 0.000 -3.311678 -.978331 | |
5 | -.604415 .5929199 -1.02 0.308 -1.766517 .5576866 | |
6 | -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812 | |
Note: Exposure is the number of periods since the first treatment time.