New In
Багаторівневий метааналіз
Ви хочете проаналізувати результати кількох досліджень, в яких отримані розміри ефектів вкладені в групи вищого рівня, такі як регіони або школи. Stata 18 додає до набору мета-команд дві нові команди – мета-мерегресія та мета-багаторівнева – для виконання багаторівневого мета-аналізу та мета-регресії. Включайте випадкові перехоплення та коефіцієнти на різних рівнях ієрархії та припускайте різні коваріаційні структури випадкових ефектів, включаючи взаємозамінні та неструктуровані. Проведіть аналіз чутливості, накладаючи різні обмеження на компоненти дисперсії. Оцінювати неоднорідність. Прогнозувати випадкові ефекти та їхні порівняльні та діагностичні стандартні похибки. І не тільки.
Багаторівневий мета-аналіз – це потужний статистичний інструмент для синтезу розмірів ефекту з ієрархічною структурою, як, наприклад, у мета-аналізі, що вивчає вплив нової методики викладання на результати тестування з математики в різних шкільних округах. Тут розміри ефекту вкладені в школи, які в свою чергу вкладені в райони. Багаторівневий мета-аналіз дозволяє не лише визначити загальний вплив методики, але й оцінити варіабельність між розмірами ефекту на різних рівнях ієрархії. Це важливо, оскільки дослідження в межах одного району можуть бути схожими, а отже, потенційно залежними, а ігнорування цієї залежності може призвести до неточних результатів. Належним чином враховуючи залежність між розмірами ефекту, ми можемо зробити точніші висновки і краще зрозуміти вплив методики викладання.
Основні моменти
-
Багаторівневий мета-аналіз та мета-регресія
-
Налаштувати для модераторів
-
Кілька рівнів ієрархії
-
Випадкові перехоплення та нахили
-
Коваріаційні структури з випадковими ефектами
-
Аналіз чутливості
-
Методи оцінювання REML та ML
-
Багаторівневі Q-статистики та тести
-
-
Неоднорідність
-
Багаторівневий I2 Кокрана
I2
статистика
-
Багаторівневий Хіггінса-Томпсона I2
I2
статистика
-
-
Пост-оцінка
-
Прогнозування випадкових ефектів
-
Порівняльні та діагностичні стандартні похибки
-
Дисперсійно-коваріаційна матриця випадкових ефектів
-
Залишки
-
Стандартизовані залишки
-
Подивимося, як це працює
-> Приклад набору даних: Модифіковані дані шкільного календаря -> Багаторівневий метааналіз: Модель лише з константами -> Багаторівнева гетерогенність -> Багаторівнева мета-регресія та випадкові нахили: Включення модераторів -> Коваріаційні структури з випадковими ефектами -> Прогнозування випадкових ефектів
Приклад набору даних: Модифіковані дані шкільного календаря
Багато досліджень свідчать про те, що тривалі літні канікули наприкінці навчального року пов’язані з розривом у навчанні між учнями через різний доступ учнів до навчальних можливостей влітку.
Купер, Валентайн і Мелсон (2003) провели багаторівневий мета-аналіз шкіл, які змінили свій розклад без подовження навчального року. База даних складається з 56 досліджень, проведених в 11 шкільних округах. Деякі школи прийняли модифіковані календарі, які передбачали більш короткі канікули протягом року (наприклад, 12 тижнів навчання з наступними 4 тижнями канікул) на відміну від традиційного календаря з довшими літніми канікулами і коротшими зимовими та весняними канікулами. У дослідженнях порівнювали академічну успішність учнів за традиційним календарем і за модифікованим календарем. Розмір ефекту (stdmdiff) – це стандартизована середня різниця, де позитивні значення вказують на вищу успішність у середньому в групі, що навчається за модифікованим календарем. Стандартна похибка (se) stdmdiff також була вказана в кожному дослідженні. Спочатку опишемо наш набір даних:
. webuse schoolcal (Effect of modified school calendar on student achievement) . describe Contains data from https://www.stata-press.com/data/r18/schoolcal.dta Observations: 56 Effect of modified school calendar on student achievement Variables: 8 19 Jan 2023 21:44 (_dta has notes)
Variable Storage Display Value | name type format label Variable label | district int %12.0g District ID | school byte %9.0g School ID | study byte %12.0g Study ID | stdmdiff double %10.0g Standardized difference in means of achievement test scores | var double %10.0g Within-study variance of stdmdiff | year int %12.0g Year of the study | se double %10.0g Within-study standard-error of stdmdiff | year_c byte %9.0g Year of the study centered around 1990 |
Sorted by: district
Багаторівневий метааналіз: Модель лише з константами
Оскільки школи розташовані в межах районів, ми застосували трирівневу модель випадкових перехоплень. Це вимагає, щоб ми визначили два рівняння випадкових ефектів: одне для рівня 3 (ідентифіковане за змінною району) і одне для рівня 2 (ідентифіковане за змінною школи).
. meta meregress stdmdiff || district: || school: , essevariable(se) Performing EM optimization ... Performing gradient-based optimization: Iteration 0: Log restricted-likelihood = -104.8525 (not concave) Iteration 1: Log restricted-likelihood = -46.670529 (not concave) Iteration 2: Log restricted-likelihood = -22.871266 (not concave) Iteration 3: Log restricted-likelihood = -12.977299 Iteration 4: Log restricted-likelihood = -7.9642885 Iteration 5: Log restricted-likelihood = -7.9587271 Iteration 6: Log restricted-likelihood = -7.9587239 Iteration 7: Log restricted-likelihood = -7.9587239 Computing standard errors ... Multilevel REML meta-analysis Number of obs = 56 Grouping information
No. of Observations per group
groups Minimum Average Maximum
11 3 5.1 11
56 1 1.0 1
Group variable | district | school |
Wald chi2(0) = . Log restricted-likelihood = -7.9587239 Prob > chi2 = .
Coefficient Std. err. z P>|z| [95% conf. interval]
.1847132 .0845559 2.18 0.029 .0189866 .3504397
stdmdiff | _cons |
Test of homogeneity: Q_M = chi2(55) = 578.86 Prob > Q_M = 0.0000
Estimate
.2550724
.1809324
Random-effects parameters | district: Identity | sd(_cons) | school: Identity | sd(_cons) |
Перша таблиця відображає інформацію про групи на різних рівнях ієрархії з одним рядком для кожної групи (рівня ієрархії).
Друга таблиця відображає коефіцієнти фіксованих ефектів. Тут наведено лише перехоплення, що відповідає загальному розміру ефекту θ^
�^
. Значення θ
�
становить 0,185 з 95% ДІ [0,019, 0,35]. Це означає, що в середньому учні, які дотримувалися зміненого шкільного календаря, отримали вищі бали, ніж ті, хто не дотримувався.
Третя таблиця відображає параметри випадкових ефектів, традиційно відомі як дисперсійні компоненти в контексті багаторівневих моделей або моделей зі змішаними ефектами. Оцінки компонентів дисперсії тепер організовані та позначені відповідно до кожного рівня. За замовчуванням мета-мерегресія звітує про стандартні відхилення випадкових перехоплень (і кореляцій, якщо вони існують у моделі) на кожному рівні. Але ви можете вказати опцію variance, щоб отримати дисперсії (і коваріації, якщо вони існують у моделі). Ми маємо τ3^=0.255
�3^=0.255
і τ2^=0.181
�2^=0.181
. Ці значення є будівельними блоками для оцінки неоднорідності на різних ієрархічних рівнях і зазвичай інтерпретуються в цьому контексті. Загалом, чим вище значення τl
��
тим більша неоднорідність очікується серед груп в межах рівня l
�
.
Крім того, це можна вказати за допомогою команди meta multilevel, як показано нижче:
. meta multilevel stdmdiff, relevels(district school) essevariable(se) (output omitted)
Команда мета-багаторівневої регресії була розроблена для мета-регресійних моделей з випадковими перехопленнями, які часто використовуються на практиці. Вона є зручною обгорткою для метамерегресії.
Багаторівнева гетерогенність
Ми використаємо команду пост-оцінки estat heterogeneity для кількісної оцінки багаторівневої неоднорідності між розмірами ефекту.
. estat heterogeneity Method: Cochran Joint: I2 (%) = 90.50 Method: Higgins–Thompson district: I2 (%) = 63.32 school: I2 (%) = 31.86 Total: I2 (%) = 95.19
I2 Кокрана
I2
кількісно оцінює рівень гетерогенності спільно для всіх рівнів ієрархії. I2=90.50%
I2=90.50%</math
означає, що 90,50% варіабельності між розмірами ефекту пояснюється справжньою неоднорідністю наших даних, а не варіабельністю вибірки. Багаторівневий критерій Хіггінса-Томпсона I2
I2
оцінює внесок кожного рівня ієрархії в загальну неоднорідність на додаток до їхнього спільного внеску. Наприклад, міжшкільна гетерогенність або гетерогенність у межах району (гетерогенність 2-го рівня) є найнижчою і становить близько 32% загальної варіації в наших даних, тоді як на гетерогенність між районами (гетерогенність 3-го рівня) припадає близько 63% загальної варіації.
Багаторівнева мета-регресія та випадкові нахили: Включення модераторів
Ми використаємо змінну year_c для проведення трирівневої мета-регресії та включимо випадкові нахили (що відповідають змінній year_c) на рівні районів.
. meta meregress stdmdiff year_c || district: year_c || school: , essevariable(se) Performing EM optimization ... Performing gradient-based optimization: Iteration 0: Log restricted-likelihood = -101.95646 (not concave) Iteration 1: Log restricted-likelihood = -94.528133 (not concave) Iteration 2: Log restricted-likelihood = -29.169697 (not concave) Iteration 3: Log restricted-likelihood = -10.67081 (not concave) Iteration 4: Log restricted-likelihood = -7.5089434 (not concave) Iteration 5: Log restricted-likelihood = -7.2219899 Iteration 6: Log restricted-likelihood = -7.2085474 (not concave) Iteration 7: Log restricted-likelihood = -7.2082538 (not concave) Iteration 8: Log restricted-likelihood = -7.2079523 (not concave) Iteration 9: Log restricted-likelihood = -7.2073687 (not concave) Iteration 10: Log restricted-likelihood = -7.2067537 (not concave) Iteration 11: Log restricted-likelihood = -7.1989783 Iteration 12: Log restricted-likelihood = -7.1891619 Iteration 13: Log restricted-likelihood = -7.1815206 Iteration 14: Log restricted-likelihood = -7.1813888 Iteration 15: Log restricted-likelihood = -7.1813887 Computing standard errors ... Multilevel REML meta-regression Number of obs = 56 Grouping information
No. of Observations per group | ||||
Group variable | groups Minimum Average Maximum | |||
district | 11 3 5.1 11 | |||
school | 56 1 1.0 1 | |||
Wald chi2(1) = 0.31 Log restricted-likelihood = -7.1813887 Prob > chi2 = 0.5753
stdmdiff | Coefficient Std. err. z P>|z| [95% conf. interval] | |||||
year_c | .0059598 .0106378 0.56 0.575 -.0148899 .0268094 | |||||
_cons | .1805809 .0904865 2.00 0.046 .0032306 .3579311 | |||||
Test of homogeneity: Q_M = chi2(54) = 550.26 Prob > Q_M = 0.0000
Random-effects parameters | Estimate | |
district: Independent | ||
sd(year_c) | .0177247 | |
sd(_cons) | .219239 | |
school: Identity | ||
sd(_cons) | .1807703 | |
Оцінка коефіцієнта регресії змінної year_c становить 0,006 з 95% ДІ [-0,015, 0,027] . Ми не бачимо жодних доказів зв’язку між stdmdiff та year_c (p = 0,575).
Коваріаційні структури з випадковими ефектами
Хоча year_c не пояснює неоднорідність, ми продовжуємо включати його як модератор для ілюстрації.
За замовчуванням випадкові нахили та випадкові перехоплення (на рівні району) вважаються незалежними. Крім того, ми можемо вказати взаємозамінну коваріаційну структуру за допомогою опції covariance(exchangeable). Ми придушуємо заголовок та журнал ітерацій і виводимо результати з трьома десятковими крапками за допомогою опцій noheader, nolog та cformat(%9.3f).
. meta meregress stdmdiff year_c || district: year_c, covariance(exchangeable) || school:, essevariable(se) noheader nolog cformat(%9.3f)
stdmdiff | Coefficient Std. err. z P>|z| [95% conf. interval] | |||||
year_c | 0.010 0.012 0.80 0.426 -0.014 0.033 | |||||
_cons | 0.153 0.074 2.06 0.039 0.008 0.298 | |||||
Test of homogeneity: Q_M = chi2(54) = 550.26 Prob > Q_M = 0.0000
Random-effects parameters | Estimate | |
district: Exchangeable | ||
sd(year_c _cons) | 0.032 | |
corr(year_c,_cons) | 1.000 | |
school: Identity | ||
sd(_cons) | 0.181 | |
Крім того, ми можемо вказати власну структуру коваріації, зафіксувавши кореляцію між перехопленнями та нахилами на рівні 0,5 і дозволивши оцінити їхні стандартні відхилення на основі даних:
. matrix A = (.,.5 \ .5,.) . meta meregress stdmdiff year_c || district: year_c, covariance(custom A) || school:, essevariable(se) noheader nolog cformat(%9.3f)
stdmdiff | Coefficient Std. err. z P>|z| [95% conf. interval] | |||||
year_c | 0.007 0.011 0.67 0.500 -0.014 0.028 | |||||
_cons | 0.170 0.082 2.08 0.038 0.010 0.330 | |||||
Test of homogeneity: Q_M = chi2(54) = 550.26 Prob > Q_M = 0.0000
Random-effects parameters | Estimate | |
district: Custom | ||
sd(year_c) | 0.026 | |
sd(_cons) | 0.116 | |
corr(year_c,_cons) | 0.500* | |
school: Identity | ||
sd(_cons) | 0.180 | |
(*) fixed during estimation
Прогнозування випадкових ефектів
Нижче ми прогнозуємо випадкові ефекти за допомогою функцій predict, reffects та отримуємо їхні діагностичні стандартні похибки за допомогою опції reses(, diagnostic).
. quietly meta meregress stdmdiff || district: || school: , essevariable(se) . predict double u3 u2, reffects reses(se_u3 se_u2, diagnostic) . by district, sort: generate tolist = (_n==1) . list district u3 se_u3 if tolist
district u3 se_u3
11 -.18998595 .07071817
12 -.08467077 .13168501
18 .1407273 .11790486
27 .24064814 .13641505
56 -.1072942 .13633364
58 -.23650899 .15003184
71 .5342778 .12606073
86 -.2004695 .1499012
91 .05711692 .14284823
108 -.14168396 .13094894
644 -.01215679 .10054689
1. | 5. | 9. | 12. | 16. | 20. | 31. | 34. | 42. | 48. | 53. |
Випадкові перехоплення u3 – це відхилення для окремих районів від загального середнього розміру ефекту. Наприклад, для округу 18 прогнозована стандартизована середня різниця на 0,14 вища за загальний розмір ефекту.
Посилання
Купер, Х., Валентайн, Д. К. та Мелсон, А. 2003. Вплив модифікованих шкільних календарів на успішність учнів та на ставлення до школи і громади. Огляд освітніх досліджень 73: 1-52.