New In

Гетерогенная разница в различиях (DID)

Если средние эффекты лечения различаются по времени и по когортам, то для оценки неоднородных средних эффектов лечения для обработанных (ATET) теперь можно использовать новые команды hdidregress и xthdidregress. Используйте команды hdidregress для повторных кросс-секционных данных и xthdidregress для панельных данных. Выберите одну из четырех оценок, включая корректировку регрессии и взвешивание с обратной вероятностью. Постройте временные профили ATETs для каждой когорты с помощью estat atetplot. Агрегируйте ATETs в пределах когорты, времени и воздействия лечения с помощью функции estat aggregation. Изучите дополнительные возможности постоценки.

Эффекты лечения измеряют причинный эффект лечения на исход. Лечение — это новая схема приема лекарств, хирургическая операция, программа обучения или даже рекламная кампания, призванная повлиять на такой результат, как артериальное давление, мобильность, занятость или продажи. Представляет интерес оценка ATET.

Стандартная оценка разности различий (DID), реализованная в существующих командах didregress и xtdidregress, оценивает ATET, общую для всех групп во времени. Когда группы получают лечение в разные моменты времени, предположение о постоянстве ATET может быть нарушено. В новых командах реализованы методы оценки, учитывающие неоднородность ATET и позволяющие получить оценки ATET для конкретной когорты и для конкретного времени.

Основные моменты

  • Оценка

    • Гетерогенность по когортам и времени

    • Панельные данные

    • Повторные кросс-секционные данные

  • Четыре оценщика

    • Регрессионная корректировка (РА)

    • Обратно-вероятностное взвешивание (IPW)

    • Дополненное инверсно-вероятностное взвешивание (AIPW)

    • Двусторонняя регрессия с фиксированными эффектами (TWFE)

  • Графики неоднородности эффектов лечения

  • Тест параллельных направлений предварительной обработки

  • Агрегирование АТЭЦ по:

    • Когорта

    • Время

    • Подверженность лечению

  • Одновременные доверительные интервалы

Давайте посмотрим, как это работает

Мы хотели бы узнать, снижает ли программа «Здоровые привычки», реализуемая на уровне школьного округа, индекс массы тела (ИМТ) учащихся в школьном округе. У нас есть фиктивные данные по программе «Здоровые привычки». Эта программа предусматривает увеличение времени на физические упражнения и увеличение потребления фруктов и овощей. Наши данные представлены на уровне школьного округа и включают информацию о том, участвует ли школа в программе, hhabit, и об индексе массы тела учащихся в округе, bmi. Мы имеем повторяющиеся выборки учащихся в возрасте от 11 до 14 лет из 40 школьных округов с 2013 по 2021 год.

В модели исходов мы считаем, что образование матери, medu, является хорошим предиктором здоровых привычек детей. Мы также считаем, что участие в спортивных мероприятиях, sports, влияет на массу тела. Наконец, мы контролируем, является ли ученик девочкой, чтобы учесть поведенческие различия и различия в типах телосложения мальчиков и девочек в этом возрасте.

Для модели лечения мы используем количество парков в районе (parksd) для моделирования hhabit. Мы предполагаем, что школьные округа с большим количеством парков считают места для занятий физкультурой более важными при планировании города, чем округа с меньшим количеством парков. Поэтому такие районы более благоприятны для реализации программы «Здоровые привычки».

Мы используем оценку aipw для моделирования как результата, так и лечения. Оценщик aipw обладает свойством двойной устойчивости, что означает, что для получения устойчивых оценок необходимо правильно указать только одну из моделей исхода или лечения.

Мы построили следующую модель:

. hdidregress aipw (bmi medu i.girl i.sports) (hhabit parksd), group(schools) time(year)
note: variable _did_cohort, containing cohort indicators formed by treatment variable hhabit and
      group variable schools, was added to the dataset.

Computing ATET for each cohort and time:
Cohort 2015 (8): ........ done
Cohort 2017 (8): ........ done
Cohort 2019 (8): ........ done

Treatment and time information

Time variable: year
Time interval: 2013 to 2021
Control:       _did_cohort = 0
Treatment:     _did_cohort > 0
 
    _did_cohort
 
Number of cohorts   4
 
Number of obs  
Never treated   11355
2015   1231
2017   2097
2019   2042
 
Heterogeneous treatment-effects regression              Number of obs = 16,725
Estimator:       Augmented IPW
Treatment level: schools
Control group:   Never treated

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Cohort   ATET std. err. z P>|z| [95% conf. interval]
 
2015    
year    
2014   .6544681 .5946048 1.10 0.271 -.5109359 1.819872
2015   -1.226451 .379168 -3.23 0.001 -1.969607 -.4832957
2016   -2.491842 .4169657 -5.98 0.000 -3.30908 -1.674605
2017   -2.72486 .2363878 -11.53 0.000 -3.188171 -2.261548
2018   -2.786634 .6672867 -4.18 0.000 -4.094492 -1.478776
2019   -3.980456 .2993279 -13.30 0.000 -4.567127 -3.393784
2020   -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
2021   -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
 
2017    
year    
2014   .6635794 .3089663 2.15 0.032 .0580167 1.269142
2015   -1.3933 .3871204 -3.60 0.000 -2.152042 -.6345582
2016   .5947865 .4065947 1.46 0.144 -.2021245 1.391697
2017   -1.71427 .4565384 -3.75 0.000 -2.609069 -.8194714
2018   -3.170542 .5221368 -6.07 0.000 -4.193912 -2.147173
2019   -2.967701 .4247053 -6.99 0.000 -3.800108 -2.135294
2020   .0360098 .6868764 0.05 0.958 -1.310243 1.382263
2021   -.957117 .3510986 -2.73 0.006 -1.645258 -.2689763
 
2019    
year    
2014   -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
2015   1.010288 .4808165 2.10 0.036 .067905 1.952671
2016   -.3809733 .4336764 -0.88 0.380 -1.230963 .4690169
2017   .5199519 .4849723 1.07 0.284 -.4305763 1.47048
2018   -.0315794 .5863875 -0.05 0.957 -1.180878 1.117719
2019   -3.602114 .3498692 -10.30 0.000 -4.287845 -2.916383
2020   -1.388906 .6765493 -2.05 0.040 -2.714919 -.0628943
2021   -.6222491 .5510466 -1.13 0.259 -1.70228 .4577824
 
Note: ATET computed using covariates.

We specified the outcome model in the first set of parentheses and the treatment model in the second set of parentheses. We also specified option group(schools) to define that treatment occurs at the school level and to identify schools as the clustering variable. Finally, we specified a time variable year in option time().

The note below the command indicates that the categorical variable _did_cohort is generated with cohort information. Units in the same cohort start the treatment at the same time. We see that there are three cohorts in our data: 2015, 2017, and 2019. In addition, we see that 11,355 observations are never treated. The time variable year ranges from 2013 to 2021.

The estimation table reports the ATET for each cohort in each year. For example, for the cohort 2015 in the year 2016, the ATET estimate is –2.5, which implies the Healthy Habits program, on average, reduces BMI by 2.5 for students in a district of the 2015 cohort in 2016 relative to the scenario where the district does not participate. The other estimates can be interpreted similarly.

It is difficult to see the trends in ATETs just by looking at all the ATETs estimates. We can use estat atetplot to visualize the time profile of ATETs for each cohort. We specify option sci to show the simultaneous confidence bands guaranteed to cover the true values of ATETs across all the cohorts and time with a predefined probability level.

. estat atetplot, sci
 

После подгонки модели мы можем использовать агрегацию estat для агрегирования ATET в пределах когорты, времени и подверженности лечению. Это позволяет обобщить различные аспекты ATET. Например, мы используем estat aggregation, cohort для суммирования ATET каждой когорты в пределах времени. Также мы указываем опцию graph для получения графика агрегаций в дополнение к табличному результату.

. estat aggregation, cohort graph

ATET over cohort                                        Number of obs = 16,725

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Cohort   ATET std. err. z P>|z| [95% conf. interval]
 
2015   -2.065755 .1999412 -10.33 0.000 -2.457633 -1.673877
2017   -1.7781 .4013978 -4.43 0.000 -2.564825 -.9913744
2019   -1.869405 .4650349 -4.02 0.000 -2.780857 -.9579538
 

 

Наконец, если мы хотим просуммировать ATET по различным длительностям воздействия лечения, мы задаем вариант dynamic.

. estat aggregation, dynamic graph

Duration of exposure ATET                               Number of obs = 16,725

                               (Std. err. adjusted for 40 clusters in schools)
 
    Robust
Exposure   ATET std. err. z P>|z| [95% conf. interval]
 
-5   -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
-4   1.010288 .4808165 2.10 0.036 .067905 1.952671
-3   .1338267 .3091619 0.43 0.665 -.4721195 .739773
-2   -.4256324 .4292553 -0.99 0.321 -1.266957 .4156925
-1   .3727141 .3197563 1.17 0.244 -.2539967 .999425
0   -2.285098 .3827362 -5.97 0.000 -3.035248 -1.534949
1   -2.344265 .3829047 -6.12 0.000 -3.094744 -1.593785
2   -2.045521 .3911543 -5.23 0.000 -2.81217 -1.278873
3   -1.045601 .6840119 -1.53 0.126 -2.38624 .2950372
4   -2.145004 .5952525 -3.60 0.000 -3.311678 -.978331
5   -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
6   -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
 
Note: Exposure is the number of periods since the first treatment time.