New In

Víceúrovňová metaanalýza

Chcete analyzovat výsledky z více studií, v nichž jsou uváděné velikosti efektů vnořeny do skupin vyšší úrovně, jako jsou regiony nebo školy. Stata 18 přidává do sady meta dva nové příkazy meta meregress a meta multilevel, které umožňují provádět víceúrovňovou metaanalýzu a metaregresi. Zahrnují náhodné intercepty a koeficienty na různých úrovních hierarchie a předpokládají různé kovarianční struktury náhodných efektů, včetně výměnných a nestrukturovaných. Provádějte analýzu citlivosti zadáním různých omezení na složky rozptylu. Posuzujte heterogenitu. Předpovídejte náhodné efekty a jejich srovnávací a diagnostické standardní chyby. A další.

Víceúrovňová metaanalýza je mocný statistický nástroj pro syntézu velikostí účinků s hierarchickou strukturou, jako například v metaanalýze zkoumající vliv nové výukové techniky na výsledky testů z matematiky v různých školních obvodech. Zde jsou velikosti efektů vnořeny do škol, které jsou samy vnořeny do okresů. Víceúrovňová metaanalýza nám umožňuje nejen určit celkový účinek techniky, ale také posoudit variabilitu mezi velikostmi účinků na různých úrovních hierarchie. To je důležité, protože studie v rámci jednoho okresu si budou pravděpodobně podobné, a tedy potenciálně závislé, a ignorování této závislosti může vést k nepřesným výsledkům. Správným zohledněním závislosti mezi velikostmi efektů můžeme vytvořit přesnější závěry a lépe pochopit dopad výukové techniky.

Nejdůležitější informace

  • Víceúrovňová metaanalýza a metaregrese

    • Úprava pro moderátory

    • Více úrovní hierarchie

    • Náhodné intercepty a sklony

    • Kovarianční struktury s náhodnými efekty

    • Analýza citlivosti

    • Metody odhadu REML a ML

    • Víceúrovňová statistika Q a test

  • Heterogenita

    • Cochranova víceúrovňová I2

      I2

      statistika

    • Higgins-Thompsonova víceúrovňová I2

      I2

      statistika

  • Postestimation

    • Předpověď náhodných efektů

    • Srovnávací a diagnostické standardní chyby

    • Matice rozptylu a kovariance náhodných efektů

    • Zbytky

    • Standardizovaná rezidua

Podívejme se, jak to funguje

Příklad datové sady: Modifikovaná data školního kalendáře

Mnohé studie naznačují, že dlouhé letní prázdniny na konci školního roku jsou spojeny s rozdíly v učení mezi žáky, protože žáci mají v létě rozdílný přístup k možnostem učení.

Cooper, Valentine a Melson (2003) provedli víceúrovňovou metaanalýzu škol, které upravily své kalendáře bez prodloužení školního roku. Soubor dat se skládá z 56 studií, které byly provedeny v 11 školských obvodech. Některé školy přijaly modifikované kalendáře, které obsahovaly kratší přestávky častěji během roku (například 12 týdnů školy a následně 4 týdny volna) na rozdíl od tradičního kalendáře s delšími letními a kratšími zimními a jarními přestávkami. Studie porovnávaly studijní výsledky žáků s tradičním kalendářem a žáků s upraveným kalendářem. Velikost účinku (stdmdiff) je standardizovaný průměrný rozdíl, přičemž kladné hodnoty znamenají v průměru vyšší výsledky ve skupině s upraveným kalendářem. U každé studie byla uvedena také standardní chyba (se) stdmdiff. Nejprve popišme náš soubor dat:

. webuse schoolcal
(Effect of modified school calendar on student achievement)

. describe

Contains data from https://www.stata-press.com/data/r18/schoolcal.dta
 Observations:            56                  Effect of modified school calendar on student 
                                                achievement
    Variables:             8                  19 Jan 2023 21:44
                                              (_dta has notes)

 

 
Variable Storage Display Value name type format label Variable label   district int %12.0g District ID school byte %9.0g School ID study byte %12.0g Study ID stdmdiff double %10.0g Standardized difference in means of achievement test scores var double %10.0g Within-study variance of stdmdiff year int %12.0g Year of the study se double %10.0g Within-study standard-error of stdmdiff year_c byte %9.0g Year of the study centered around 1990  

 

Sorted by: district
Víceúrovňová metaanalýza: Pouze konstantní model

Vzhledem k tomu, že školy jsou vnořeny do okresů, použili jsme tříúrovňový model s náhodnými vstupy. To vyžaduje, abychom zadali dvě rovnice náhodných efektů: jednu pro úroveň 3 (identifikovanou proměnnou okres) a jednu pro úroveň 2 (identifikovanou proměnnou škola).

. meta meregress stdmdiff || district: || school: , essevariable(se)

Performing EM optimization ...

Performing gradient-based optimization: 
Iteration 0:  Log restricted-likelihood =  -104.8525  (not concave)
Iteration 1:  Log restricted-likelihood = -46.670529  (not concave)
Iteration 2:  Log restricted-likelihood = -22.871266  (not concave)
Iteration 3:  Log restricted-likelihood = -12.977299  
Iteration 4:  Log restricted-likelihood = -7.9642885  
Iteration 5:  Log restricted-likelihood = -7.9587271  
Iteration 6:  Log restricted-likelihood = -7.9587239  
Iteration 7:  Log restricted-likelihood = -7.9587239  

Computing standard errors ...

Multilevel REML meta-analysis                               Number of obs = 56

Grouping information

No. of Observations per group

groups Minimum Average Maximum

11 3 5.1 11

56 1 1.0 1

 
  Group variable   district school  
                                                            Wald chi2(0)  =  .
Log restricted-likelihood = -7.9587239                      Prob > chi2   =  .

Coefficient Std. err. z P>|z| [95% conf. interval]

.1847132 .0845559 2.18 0.029 .0189866 .3504397

 
stdmdiff   _cons  
Test of homogeneity: Q_M = chi2(55) = 578.86               Prob > Q_M = 0.0000

Estimate

.2550724

.1809324

 
Random-effects parameters   district: Identity sd(_cons)   school: Identity sd(_cons)  

První tabulka zobrazuje informace o skupinách na různých úrovních hierarchie s jedním řádkem pro každé seskupení (úroveň hierarchie).

Druhá tabulka zobrazuje koeficienty fixních efektů. Zde je uvedena pouze intercepce odpovídající celkové velikosti účinku θ^

�^

. Hodnota θ

je 0,185 s 95% CI [0,019, 0,35]. To znamená, že žáci, kteří se řídili upraveným školním kalendářem, dosáhli v průměru vyšších výsledků než ti, kteří se jím neřídili.

Třetí tabulka zobrazuje parametry náhodných efektů, tradičně známé jako složky rozptylu v kontextu víceúrovňových modelů nebo modelů se smíšenými efekty. Odhady složek rozptylu jsou nyní uspořádány a označeny podle jednotlivých úrovní. Ve výchozím nastavení meta meregress uvádí standardní odchylky náhodných interceptů (a korelací, pokud v modelu existovaly) na každé úrovni. Místo toho však můžete zadat volbu variance, aby byly uváděny rozptyly (a kovariance, pokud v modelu existovaly). Máme τ3^=0,255

�3^=0.255

a τ2^=0,181

�2^=0.181

. Tyto hodnoty jsou základními kameny pro hodnocení heterogenity na různých hierarchických úrovních a obvykle se v tomto kontextu interpretují. Obecně platí, že čím vyšší je hodnota τl

��

, tím větší heterogenita se očekává mezi skupinami v rámci úrovně l

.

Alternativně lze tuto hodnotu zadat pomocí příkazu meta multilevel následujícím způsobem:

. meta multilevel stdmdiff, relevels(district school) essevariable(se)
(output omitted)

Příkaz meta multilevel byl navržen tak, aby vyhovoval meta-regresním modelům s náhodnými vstupy, které se v praxi běžně používají. Jedná se o pohodlný obal pro meta meregress.

Víceúrovňová heterogenita

Ke kvantifikaci víceúrovňové heterogenity mezi velikostmi efektů použijeme postestimulační příkaz estat heterogeneity.

. estat heterogeneity

Method: Cochran
Joint:
  I2 (%) = 90.50

Method: Higgins–Thompson
district:
  I2 (%) = 63.32

school:
  I2 (%) = 31.86

Total:
  I2 (%) = 95.19

Cochranova I2

I2

kvantifikuje míru heterogenity společně pro všechny úrovně hierarchie. I2=90.50%

I2=90,50 %</math

znamená, že 90,50 % variability mezi velikostmi účinků je způsobeno skutečnou heterogenitou našich údajů na rozdíl od variability výběru. Víceúrovňová Higginsova-Thompsonova I2

I2

statistiky hodnotí příspěvek jednotlivých úrovní hierarchie k celkové heterogenitě kromě jejich společného příspěvku. Například heterogenita mezi školami nebo heterogenita v rámci okresů (heterogenita 2. úrovně) je nejnižší a představuje asi 32 % celkové variability našich dat, zatímco heterogenita mezi okresy (heterogenita 3. úrovně) představuje asi 63 % celkové variability.

Víceúrovňová metaregrese a náhodné sklony: Zahrnutí moderátorů

Proměnnou rok_c použijeme k provedení tříúrovňové meta-regrese a zahrneme náhodné sklony (odpovídající proměnné rok_c) na úrovni okresu.

. meta meregress stdmdiff year_c || district: year_c || school: , essevariable(se)

Performing EM optimization ...

Performing gradient-based optimization:
Iteration 0:  Log restricted-likelihood = -101.95646  (not concave)
Iteration 1:  Log restricted-likelihood = -94.528133  (not concave)
Iteration 2:  Log restricted-likelihood = -29.169697  (not concave)
Iteration 3:  Log restricted-likelihood =  -10.67081  (not concave)
Iteration 4:  Log restricted-likelihood = -7.5089434  (not concave)
Iteration 5:  Log restricted-likelihood = -7.2219899
Iteration 6:  Log restricted-likelihood = -7.2085474  (not concave)
Iteration 7:  Log restricted-likelihood = -7.2082538  (not concave)
Iteration 8:  Log restricted-likelihood = -7.2079523  (not concave)
Iteration 9:  Log restricted-likelihood = -7.2073687  (not concave)
Iteration 10: Log restricted-likelihood = -7.2067537  (not concave)
Iteration 11: Log restricted-likelihood = -7.1989783
Iteration 12: Log restricted-likelihood = -7.1891619
Iteration 13: Log restricted-likelihood = -7.1815206
Iteration 14: Log restricted-likelihood = -7.1813888
Iteration 15: Log restricted-likelihood = -7.1813887

Computing standard errors ...

Multilevel REML meta-regression                         Number of obs =     56

Grouping information
 
    No. of Observations per group
Group variable   groups Minimum Average Maximum
 
district   11 3 5.1 11
school   56 1 1.0 1
 
                                                        Wald chi2(1)  =   0.31
Log restricted-likelihood = -7.1813887                  Prob > chi2   = 0.5753
 
stdmdiff   Coefficient Std. err. z P>|z| [95% conf. interval]
 
year_c   .0059598 .0106378 0.56 0.575 -.0148899 .0268094
_cons   .1805809 .0904865 2.00 0.046 .0032306 .3579311
 
Test of homogeneity: Q_M = chi2(54) = 550.26               Prob > Q_M = 0.0000
 
Random-effects parameters   Estimate
 
district: Independent    
sd(year_c)   .0177247
sd(_cons)   .219239
 
school: Identity    
sd(_cons)   .1807703
 

Odhad regresního koeficientu proměnné rok_c je 0,006 s 95% CI [-0,015, 0,027] . Nevidíme žádný důkaz pro souvislost mezi stdmdiff a year_c (p = 0,575).

Kovarianční struktury s náhodnými efekty

Přestože rok_c nevysvětlil heterogenitu, pro ilustraci jej nadále uvádíme jako moderátor.

Ve výchozím nastavení se předpokládá, že náhodné sklony a náhodné intercepty (na úrovni okresu) jsou nezávislé. Alternativně můžeme zadat výměnnou kovarianční strukturu pomocí volby covariance(exchangeable). Pomocí voleb noheader, nolog a cformat(%9.3f) potlačíme záhlaví a iterační log a výsledky zobrazíme se třemi desetinnými místy.

. meta meregress stdmdiff year_c || district: year_c, covariance(exchangeable)
	|| school:, essevariable(se) noheader nolog cformat(%9.3f)
 
stdmdiff   Coefficient Std. err. z P>|z| [95% conf. interval]
 
year_c   0.010 0.012 0.80 0.426 -0.014 0.033
_cons   0.153 0.074 2.06 0.039 0.008 0.298
 
Test of homogeneity: Q_M = chi2(54) = 550.26               Prob > Q_M = 0.0000
 
Random-effects parameters   Estimate
 
district: Exchangeable    
sd(year_c _cons)   0.032
corr(year_c,_cons)   1.000
 
school: Identity    
sd(_cons)   0.181
 

Případně můžeme zadat vlastní kovarianční strukturu tak, že stanovíme korelaci mezi intercepty a sklony na 0,5 a umožníme odhad jejich směrodatných odchylek z dat:

. matrix A = (.,.5 \ .5,.)
. meta meregress stdmdiff year_c || district: year_c, covariance(custom A)
	|| school:, essevariable(se) noheader nolog cformat(%9.3f)
 
stdmdiff   Coefficient Std. err. z P>|z| [95% conf. interval]
 
year_c   0.007 0.011 0.67 0.500 -0.014 0.028
_cons   0.170 0.082 2.08 0.038 0.010 0.330
 
Test of homogeneity: Q_M = chi2(54) = 550.26               Prob > Q_M = 0.0000
 
Random-effects parameters   Estimate
 
district: Custom    
sd(year_c)   0.026
sd(_cons)   0.116
corr(year_c,_cons)   0.500*
 
school: Identity    
sd(_cons)   0.180
 
(*) fixed during estimation
Předpovídání náhodných efektů

Níže předpovíme náhodné efekty pomocí predict, reffects a získáme jejich diagnostické standardní chyby zadáním volby reses(, diagnostic).

. quietly meta meregress stdmdiff || district: || school: , essevariable(se)
. predict double u3 u2, reffects reses(se_u3 se_u2, diagnostic)
. by district, sort: generate tolist = (_n==1)
. list district u3 se_u3 if tolist

district u3 se_u3

11 -.18998595 .07071817

12 -.08467077 .13168501

18 .1407273 .11790486

27 .24064814 .13641505

56 -.1072942 .13633364

58 -.23650899 .15003184

71 .5342778 .12606073

86 -.2004695 .1499012

91 .05711692 .14284823

108 -.14168396 .13094894

644 -.01215679 .10054689

 

 
    1. 5. 9. 12. 16.   20. 31. 34. 42. 48.   53.  

Náhodné intercepty u3 jsou odchylky specifické pro jednotlivé okresy od celkové průměrné velikosti účinku. Například pro okres 18 je předpokládaná standardizovaná průměrná odchylka o 0,14 vyšší než celková velikost účinku.

Odkaz

Cooper, H., Valentine, J. C. a Melson, A. 2003. Vliv upravených školních kalendářů na výsledky žáků a na postoje školy a komunity. Review of Educational Research 73: 1-52.