New In
Многоуровневый мета-анализ
Вы хотите проанализировать результаты нескольких исследований, в которых представленные размеры эффектов вложены в группировки более высокого уровня, такие как регионы или школы. Stata 18 добавляет в набор meta две новые команды — meta meregress и meta multilevel — для выполнения многоуровневого мета-анализа и мета-регрессии. Включайте случайные перехваты и коэффициенты на разных уровнях иерархии и принимайте различные структуры ковариации случайных эффектов, в том числе сменные и неструктурированные. Провести анализ чувствительности, накладывая различные ограничения на компоненты дисперсии. Оценить гетерогенность. Прогнозировать случайные эффекты и их сравнительные и диагностические стандартные ошибки. И многое другое.
Многоуровневый мета-анализ — это мощный статистический инструмент для синтеза величин эффектов с иерархической структурой, как, например, в мета-анализе, изучающем влияние новой методики преподавания на результаты тестирования по математике в разных школьных округах. Здесь величины эффектов вложены в школы, которые сами вложены в районы. Многоуровневый мета-анализ позволяет не только определить общий эффект методики, но и оценить вариативность величин эффектов на разных уровнях иерархии. Это важно, поскольку исследования в пределах одного района, скорее всего, будут схожими и, следовательно, потенциально зависимыми, и игнорирование этой зависимости может привести к неточным результатам. Правильный учет зависимости между величинами эффектов позволяет сделать более точные выводы и лучше понять влияние методики обучения.
Основные моменты
-
Многоуровневый мета-анализ и мета-регрессия
-
Настройка для модераторов
-
Несколько уровней иерархии
-
Случайные перехваты и наклоны
-
Ковариационные структуры со случайными эффектами
-
Анализ чувствительности
-
Методы оценки REML и ML
-
Многоуровневая Q-статистика и тест
-
Heterogeneity
-
-
-
Многоуровневый коэффициент Кохрана I2
I2
статистика
-
Многоуровневый коэффициент Хиггинса-Томпсона I2
I2
статистика
-
-
Пост-оценка
-
Прогнозирование случайных эффектов
-
Сравнительные и диагностические стандартные ошибки
-
Вариационно-ковариационная матрица случайных эффектов
-
Остатки
-
Стандартизованные остатки
-
Давайте посмотрим, как это работает
-> Пример набора данных: Модифицированные данные школьного календаря -> Многоуровневый мета-анализ: Модель «только константа -> Многоуровневая неоднородность -> Многоуровневая метарегрессия и случайные наклоны: Учет модераторов -> Ковариационные структуры со случайными эффектами -> Прогнозирование случайных эффектов
Пример набора данных: Модифицированные данные школьного календаря
Многие исследования показывают, что длительные летние каникулы в конце учебного года связаны с разрывом в обучении между учащимися из-за различий в доступе учащихся к возможностям обучения в летний период.
Купер, Валентайн и Мелсон (Cooper, Valentine, Melson, 2003) провели многоуровневый метаанализ школ, изменивших свой календарный план без удлинения учебного года. Набор данных состоит из 56 исследований, проведенных в 11 школьных округах. В некоторых школах были приняты модифицированные календари, предусматривающие более короткие перерывы в течение года (например, 12 недель занятий и 4 недели отдыха), в отличие от традиционного календаря с более продолжительными летними каникулами и более короткими зимними и весенними. В исследованиях сравнивалась успеваемость студентов, обучающихся по традиционному календарю, и студентов, обучающихся по модифицированному календарю. Величина эффекта (stdmdiff) представляет собой стандартизированную среднюю разницу, положительные значения которой указывают на более высокую успеваемость в среднем в группе с модифицированным календарем. Стандартная ошибка (se) stdmdiff также указывалась в каждом исследовании. Сначала опишем наш набор данных:
. webuse schoolcal (Effect of modified school calendar on student achievement) . describe Contains data from https://www.stata-press.com/data/r18/schoolcal.dta Observations: 56 Effect of modified school calendar on student achievement Variables: 8 19 Jan 2023 21:44 (_dta has notes)
Variable Storage Display Value | name type format label Variable label | district int %12.0g District ID | school byte %9.0g School ID | study byte %12.0g Study ID | stdmdiff double %10.0g Standardized difference in means of achievement test scores | var double %10.0g Within-study variance of stdmdiff | year int %12.0g Year of the study | se double %10.0g Within-study standard-error of stdmdiff | year_c byte %9.0g Year of the study centered around 1990 |
Sorted by: district
Многоуровневый мета-анализ: Модель «только константа
Поскольку школы вложены в районы, мы используем трехуровневую модель со случайными интерцептами. Для этого необходимо задать два уравнения со случайными эффектами: одно для третьего уровня (обозначенного переменной district) и одно для второго уровня (обозначенного переменной school).
. meta meregress stdmdiff || district: || school: , essevariable(se) Performing EM optimization ... Performing gradient-based optimization: Iteration 0: Log restricted-likelihood = -104.8525 (not concave) Iteration 1: Log restricted-likelihood = -46.670529 (not concave) Iteration 2: Log restricted-likelihood = -22.871266 (not concave) Iteration 3: Log restricted-likelihood = -12.977299 Iteration 4: Log restricted-likelihood = -7.9642885 Iteration 5: Log restricted-likelihood = -7.9587271 Iteration 6: Log restricted-likelihood = -7.9587239 Iteration 7: Log restricted-likelihood = -7.9587239 Computing standard errors ... Multilevel REML meta-analysis Number of obs = 56 Grouping information
No. of Observations per group
groups Minimum Average Maximum
11 3 5.1 11
56 1 1.0 1
Group variable | district | school |
Wald chi2(0) = . Log restricted-likelihood = -7.9587239 Prob > chi2 = .
Coefficient Std. err. z P>|z| [95% conf. interval]
.1847132 .0845559 2.18 0.029 .0189866 .3504397
stdmdiff | _cons |
Test of homogeneity: Q_M = chi2(55) = 578.86 Prob > Q_M = 0.0000
Estimate
.2550724
.1809324
Random-effects parameters | district: Identity | sd(_cons) | school: Identity | sd(_cons) |
В первой таблице представлена информация о группах на разных уровнях иерархии, по одной строке для каждой группировки (уровня иерархии).
Во второй таблице представлены коэффициенты фиксированных эффектов. Здесь присутствует только перехват, соответствующий общему размеру эффекта θ^
�^
. Значение θ
�
составляет 0,185 с 95%-ным ДИ [0,019, 0,35]. Это означает, что в среднем учащиеся, придерживающиеся модифицированного школьного расписания, получили более высокие баллы, чем те, кто его не придерживался.
В третьей таблице представлены параметры случайных эффектов, традиционно называемые компонентами дисперсии в контексте многоуровневых моделей или моделей со смешанными эффектами. Оценки компонент дисперсии теперь упорядочены и помечены в соответствии с каждым уровнем. По умолчанию meta meregress выдает стандартные отклонения случайных интерцептов (и корреляций, если они существуют в модели) на каждом уровне. Однако вместо этого можно указать опцию variance, чтобы вывести в отчет дисперсии (и ковариации, если они есть в модели). Мы имеем τ3^=0,255
�3^=0.255
и τ2^=0,181
�2^=0.181
. Эти величины являются составными элементами для оценки неоднородности на различных иерархических уровнях и обычно интерпретируются в этом контексте. В общем случае, чем выше значение τl
��
тем больше ожидается неоднородность среди групп внутри уровня l
�
.
Альтернативно это можно задать с помощью команды meta multilevel следующим образом:
. meta multilevel stdmdiff, relevels(district school) essevariable(se) (output omitted)
Команда meta multilevel была разработана для подгонки метарегрессионных моделей со случайными интерцептами, которые часто используются на практике. Она представляет собой удобную обертку для meta meregress.
Многоуровневая неоднородность
Для количественной оценки многоуровневой неоднородности размеров эффектов воспользуемся командой пост-оценки estat heterogeneity.
. estat heterogeneity Method: Cochran Joint: I2 (%) = 90.50 Method: Higgins–Thompson district: I2 (%) = 63.32 school: I2 (%) = 31.86 Total: I2 (%) = 95.19
I2 Кохрана
I2
количественно оценивает степень неоднородности совместно для всех уровней иерархии. I2=90.50%
I2=90,50%</math
означает, что 90,50% вариабельности величин эффектов обусловлено истинной неоднородностью наших данных, а не вариабельностью выборки. Многоуровневый коэффициент Хиггинса-Томпсона I2
I2
оценивает вклад каждого уровня иерархии в общую неоднородность, а также их совместный вклад. Например, межшкольная неоднородность или неоднородность внутри районов (неоднородность второго уровня) является наименьшей и составляет около 32% от общей вариации наших данных, в то время как межрайонная неоднородность (неоднородность третьего уровня) составляет около 63% от общей вариации.
Многоуровневая метарегрессия и случайные наклоны: Учет модераторов
Мы будем использовать переменную year_c для проведения трехуровневой метарегрессии и включать случайные наклоны (соответствующие переменной year_c) на уровне района.
. meta meregress stdmdiff year_c || district: year_c || school: , essevariable(se) Performing EM optimization ... Performing gradient-based optimization: Iteration 0: Log restricted-likelihood = -101.95646 (not concave) Iteration 1: Log restricted-likelihood = -94.528133 (not concave) Iteration 2: Log restricted-likelihood = -29.169697 (not concave) Iteration 3: Log restricted-likelihood = -10.67081 (not concave) Iteration 4: Log restricted-likelihood = -7.5089434 (not concave) Iteration 5: Log restricted-likelihood = -7.2219899 Iteration 6: Log restricted-likelihood = -7.2085474 (not concave) Iteration 7: Log restricted-likelihood = -7.2082538 (not concave) Iteration 8: Log restricted-likelihood = -7.2079523 (not concave) Iteration 9: Log restricted-likelihood = -7.2073687 (not concave) Iteration 10: Log restricted-likelihood = -7.2067537 (not concave) Iteration 11: Log restricted-likelihood = -7.1989783 Iteration 12: Log restricted-likelihood = -7.1891619 Iteration 13: Log restricted-likelihood = -7.1815206 Iteration 14: Log restricted-likelihood = -7.1813888 Iteration 15: Log restricted-likelihood = -7.1813887 Computing standard errors ... Multilevel REML meta-regression Number of obs = 56 Grouping information
No. of Observations per group | ||||
Group variable | groups Minimum Average Maximum | |||
district | 11 3 5.1 11 | |||
school | 56 1 1.0 1 | |||
Wald chi2(1) = 0.31 Log restricted-likelihood = -7.1813887 Prob > chi2 = 0.5753
stdmdiff | Coefficient Std. err. z P>|z| [95% conf. interval] | |||||
year_c | .0059598 .0106378 0.56 0.575 -.0148899 .0268094 | |||||
_cons | .1805809 .0904865 2.00 0.046 .0032306 .3579311 | |||||
Test of homogeneity: Q_M = chi2(54) = 550.26 Prob > Q_M = 0.0000
Random-effects parameters | Estimate | |
district: Independent | ||
sd(year_c) | .0177247 | |
sd(_cons) | .219239 | |
school: Identity | ||
sd(_cons) | .1807703 | |
Оценка коэффициента регрессии переменной year_c составляет 0,006 при 95%-ном ДИ [-0,015, 0,027] . Мы не видим доказательств связи между stdmdiff и year_c (p = 0,575).
Ковариационные структуры со случайными эффектами
Хотя год_c не объяснил гетерогенность, мы продолжаем включать его в качестве модератора в целях иллюстрации.
По умолчанию случайные наклоны и случайные перехваты (на уровне района) считаются независимыми. В качестве альтернативы можно указать ковариационную структуру с возможностью обмена, используя опцию covariance(exchangeable). Мы подавляем заголовок и журнал итераций и выводим результаты с тремя десятичными точками с помощью опций noheader, nolog и cformat(%9.3f).
. meta meregress stdmdiff year_c || district: year_c, covariance(exchangeable) || school:, essevariable(se) noheader nolog cformat(%9.3f)
stdmdiff | Coefficient Std. err. z P>|z| [95% conf. interval] | |||||
year_c | 0.010 0.012 0.80 0.426 -0.014 0.033 | |||||
_cons | 0.153 0.074 2.06 0.039 0.008 0.298 | |||||
Test of homogeneity: Q_M = chi2(54) = 550.26 Prob > Q_M = 0.0000
Random-effects parameters | Estimate | |
district: Exchangeable | ||
sd(year_c _cons) | 0.032 | |
corr(year_c,_cons) | 1.000 | |
school: Identity | ||
sd(_cons) | 0.181 | |
В качестве альтернативы можно задать собственную ковариационную структуру, зафиксировав корреляцию между интерцептами и наклонами на уровне 0,5 и разрешив оценивать их стандартные отклонения по данным:
. matrix A = (.,.5 \ .5,.) . meta meregress stdmdiff year_c || district: year_c, covariance(custom A) || school:, essevariable(se) noheader nolog cformat(%9.3f)
stdmdiff | Coefficient Std. err. z P>|z| [95% conf. interval] | |||||
year_c | 0.007 0.011 0.67 0.500 -0.014 0.028 | |||||
_cons | 0.170 0.082 2.08 0.038 0.010 0.330 | |||||
Test of homogeneity: Q_M = chi2(54) = 550.26 Prob > Q_M = 0.0000
Random-effects parameters | Estimate | |
district: Custom | ||
sd(year_c) | 0.026 | |
sd(_cons) | 0.116 | |
corr(year_c,_cons) | 0.500* | |
school: Identity | ||
sd(_cons) | 0.180 | |
(*) fixed during estimation
Прогнозирование случайных эффектов
Ниже мы предскажем случайные эффекты с помощью predict, reffects и получим их диагностические стандартные ошибки, указав опцию reses(, diagnostic).
. quietly meta meregress stdmdiff || district: || school: , essevariable(se) . predict double u3 u2, reffects reses(se_u3 se_u2, diagnostic) . by district, sort: generate tolist = (_n==1) . list district u3 se_u3 if tolist
district u3 se_u3
11 -.18998595 .07071817
12 -.08467077 .13168501
18 .1407273 .11790486
27 .24064814 .13641505
56 -.1072942 .13633364
58 -.23650899 .15003184
71 .5342778 .12606073
86 -.2004695 .1499012
91 .05711692 .14284823
108 -.14168396 .13094894
644 -.01215679 .10054689
1. | 5. | 9. | 12. | 16. | 20. | 31. | 34. | 42. | 48. | 53. |
Случайные перехваты u3 представляют собой отклонения от общего среднего размера эффекта, характерные для конкретного района. Например, для округа 18 прогнозируемая стандартизированная средняя разница на 0,14 больше общего размера эффекта.
Ссылка
Cooper, H., Valentine, J. C., and Melson, A. 2003. Влияние модифицированных школьных календарей на успеваемость учащихся и на отношение к школе и обществу. Review of Educational Research 73: 1-52.