New In

Méta-analyse à plusieurs niveaux

Vous souhaitez analyser les résultats de plusieurs études, dans lesquelles les tailles d’effet rapportées sont imbriquées dans des groupements de niveau supérieur, tels que des régions ou des écoles. Stata 18 ajoute deux nouvelles commandes, meta meregress et meta multilevel, à la suite meta pour effectuer une méta-analyse et une méta-régression à plusieurs niveaux. Incluez des intercepts et des coefficients aléatoires à différents niveaux de la hiérarchie et supposez différentes structures de covariance des effets aléatoires, y compris échangeables et non structurées. Effectuer une analyse de sensibilité en plaçant diverses contraintes sur les composantes de la variance. Évaluer l’hétérogénéité. Prévoir les effets aléatoires et leurs erreurs standard comparatives et diagnostiques. Et bien plus encore.

La méta-analyse multiniveau est un outil statistique puissant qui permet de synthétiser les valeurs de l’effet avec une structure hiérarchique, comme dans une méta-analyse explorant l’impact d’une nouvelle technique d’enseignement sur les résultats des tests de mathématiques dans différents districts scolaires. Dans ce cas, les valeurs de l’effet sont imbriquées dans les écoles, elles-mêmes imbriquées dans les districts. La méta-analyse multiniveaux nous permet non seulement de déterminer l’effet global de la technique, mais aussi d’évaluer la variabilité des valeurs de l’effet à différents niveaux de la hiérarchie. Ceci est important car les études au sein d’un même district sont susceptibles d’être similaires et donc potentiellement dépendantes, et le fait d’ignorer cette dépendance peut conduire à des résultats inexacts. En tenant compte de la dépendance entre les tailles d’effet, nous pouvons produire des inférences plus précises et mieux comprendre l’impact de la technique d’enseignement.

Points forts

  • Méta-analyse et méta-régression à plusieurs niveaux

    • Adaptation pour les modérateurs

    • Plusieurs niveaux de hiérarchie

    • Intercepts et pentes aléatoires

    • Structures de covariance à effets aléatoires

    • Analyse de sensibilité

    • Méthodes d’estimation REML et ML

    • Statistique Q multiniveau et test

  • Hétérogénéité

    • I2 de Cochran à plusieurs niveaux

      I2

      statistique

    • Higgins-Thompson multi-niveaux I2

      I2

      statistiques

  • Post-estimation

    • Prédiction des effets aléatoires

    • Erreurs standard comparatives et diagnostiques

    • Matrice de variance-covariance des effets aléatoires

    • Résidus

    • Résidus standardisés

Voyons comment cela fonctionne

Exemple de données : Données du calendrier scolaire modifié

De nombreuses études suggèrent que la longue pause estivale à la fin de l’année scolaire est liée à un écart d’apprentissage entre les élèves en raison de l’accès différentiel des élèves aux possibilités d’apprentissage pendant l’été.

Cooper, Valentine et Melson (2003) ont réalisé une méta-analyse multiniveaux sur les écoles qui ont modifié leur calendrier sans prolonger l’année scolaire. L’ensemble des données se compose de 56 études menées dans 11 districts scolaires. Certaines écoles ont adopté des calendriers modifiés comportant des pauses plus courtes et plus fréquentes tout au long de l’année (par exemple, 12 semaines d’école suivies de 4 semaines de congé), par opposition au calendrier traditionnel qui prévoit des vacances d’été plus longues et des vacances d’hiver et de printemps plus courtes. Les études ont comparé les résultats scolaires des élèves suivant un calendrier traditionnel à ceux des élèves suivant un calendrier modifié. L’ampleur de l’effet (stdmdiff) est la différence moyenne standardisée, les valeurs positives indiquant des résultats supérieurs, en moyenne, dans le groupe soumis au calendrier modifié. L’erreur standard (se) de stdmdiff a également été rapportée par chaque étude. Décrivons tout d’abord notre ensemble de données :

. webuse schoolcal
(Effect of modified school calendar on student achievement)

. describe

Contains data from https://www.stata-press.com/data/r18/schoolcal.dta
 Observations:            56                  Effect of modified school calendar on student 
                                                achievement
    Variables:             8                  19 Jan 2023 21:44
                                              (_dta has notes)

 

 
Variable Storage Display Value name type format label Variable label   district int %12.0g District ID school byte %9.0g School ID study byte %12.0g Study ID stdmdiff double %10.0g Standardized difference in means of achievement test scores var double %10.0g Within-study variance of stdmdiff year int %12.0g Year of the study se double %10.0g Within-study standard-error of stdmdiff year_c byte %9.0g Year of the study centered around 1990  

 

Sorted by: district
Méta-analyse multiniveaux : Modèle constant

Comme les écoles sont imbriquées dans les districts, nous appliquons un modèle à intervalles aléatoires à trois niveaux. Cela nécessite de spécifier deux équations à effets aléatoires : une pour le niveau 3 (identifié par la variable district) et une pour le niveau 2 (identifié par la variable école).

. meta meregress stdmdiff || district: || school: , essevariable(se)

Performing EM optimization ...

Performing gradient-based optimization: 
Iteration 0:  Log restricted-likelihood =  -104.8525  (not concave)
Iteration 1:  Log restricted-likelihood = -46.670529  (not concave)
Iteration 2:  Log restricted-likelihood = -22.871266  (not concave)
Iteration 3:  Log restricted-likelihood = -12.977299  
Iteration 4:  Log restricted-likelihood = -7.9642885  
Iteration 5:  Log restricted-likelihood = -7.9587271  
Iteration 6:  Log restricted-likelihood = -7.9587239  
Iteration 7:  Log restricted-likelihood = -7.9587239  

Computing standard errors ...

Multilevel REML meta-analysis                               Number of obs = 56

Grouping information

No. of Observations per group

groups Minimum Average Maximum

11 3 5.1 11

56 1 1.0 1

 
  Group variable   district school  
                                                            Wald chi2(0)  =  .
Log restricted-likelihood = -7.9587239                      Prob > chi2   =  .

Coefficient Std. err. z P>|z| [95% conf. interval]

.1847132 .0845559 2.18 0.029 .0189866 .3504397

 
stdmdiff   _cons  
Test of homogeneity: Q_M = chi2(55) = 578.86               Prob > Q_M = 0.0000

Estimate

.2550724

.1809324

 
Random-effects parameters   district: Identity sd(_cons)   school: Identity sd(_cons)  

Le premier tableau présente des informations sur les groupes à différents niveaux de hiérarchie, avec une ligne pour chaque groupe (niveau de hiérarchie).

Le deuxième tableau présente les coefficients à effets fixes. Ici, il n’y a qu’un intercept correspondant à la taille de l’effet global θ^

�^

. La valeur de θ

est de 0,185 avec un IC à 95 % de [0,019, 0,35]. Cela signifie qu’en moyenne, les élèves qui suivent le calendrier scolaire modifié obtiennent de meilleurs résultats que ceux qui ne le suivent pas.

Le troisième tableau présente les paramètres des effets aléatoires, traditionnellement connus sous le nom de composantes de la variance dans le contexte des modèles multiniveaux ou à effets mixtes. Les estimations des composantes de la variance sont désormais organisées et étiquetées en fonction de chaque niveau. Par défaut, meta meregress rapporte les écarts types des ordonnées aléatoires (et des corrélations si elles existent dans le modèle) à chaque niveau. Mais vous pouvez spécifier l’option variance pour rapporter les variances (et les covariances si elles existent dans le modèle). Nous avons τ3^=0.255

�3^=0.255

et τ2^=0,181

�2^=0.181

. Ces valeurs permettent d’évaluer l’hétérogénéité entre les différents niveaux hiérarchiques et sont généralement interprétées dans ce contexte. En général, plus la valeur de τl

��

plus on s’attend à ce qu’il y ait d’hétérogénéité entre les groupes au sein du niveau l

.

Il est également possible de spécifier cette valeur à l’aide de la commande meta multilevel, comme suit :

. meta multilevel stdmdiff, relevels(district school) essevariable(se)
(output omitted)

La commande meta multilevel a été conçue pour ajuster des modèles de méta-régression à intercepts aléatoires, qui sont couramment utilisés dans la pratique. Il s’agit d’une enveloppe de commodité pour meta meregress.

Hétérogénéité à plusieurs niveaux

Nous utiliserons la commande de post-stimation estat heterogeneity pour quantifier l’hétérogénéité à plusieurs niveaux entre les tailles d’effet.

. estat heterogeneity

Method: Cochran
Joint:
  I2 (%) = 90.50

Method: Higgins–Thompson
district:
  I2 (%) = 63.32

school:
  I2 (%) = 31.86

Total:
  I2 (%) = 95.19

I2 de Cochran

I2

quantifie le degré d’hétérogénéité à tous les niveaux de la hiérarchie. I2=90.50%

I2=90.50%</math

signifie que 90,50 % de la variabilité entre les tailles d’effet est due à une véritable hétérogénéité dans nos données plutôt qu’à la variabilité de l’échantillonnage. L’indice I2 de Higgins-Thompson à plusieurs niveaux

I2

évaluent la contribution de chaque niveau hiérarchique à l’hétérogénéité totale, en plus de leur contribution conjointe. Par exemple, l’hétérogénéité entre écoles ou l’hétérogénéité au sein des districts (hétérogénéité de niveau 2) est la plus faible, représentant environ 32 % de la variation totale de nos données, tandis que l’hétérogénéité entre districts (hétérogénéité de niveau 3) représente environ 63 % de la variation totale.

Méta-régression multiniveaux et pentes aléatoires : Incorporation des modérateurs

Nous utiliserons la variable année_c pour effectuer une méta-régression à trois niveaux et inclurons des pentes aléatoires (correspondant à la variable année_c) au niveau du district.

. meta meregress stdmdiff year_c || district: year_c || school: , essevariable(se)

Performing EM optimization ...

Performing gradient-based optimization:
Iteration 0:  Log restricted-likelihood = -101.95646  (not concave)
Iteration 1:  Log restricted-likelihood = -94.528133  (not concave)
Iteration 2:  Log restricted-likelihood = -29.169697  (not concave)
Iteration 3:  Log restricted-likelihood =  -10.67081  (not concave)
Iteration 4:  Log restricted-likelihood = -7.5089434  (not concave)
Iteration 5:  Log restricted-likelihood = -7.2219899
Iteration 6:  Log restricted-likelihood = -7.2085474  (not concave)
Iteration 7:  Log restricted-likelihood = -7.2082538  (not concave)
Iteration 8:  Log restricted-likelihood = -7.2079523  (not concave)
Iteration 9:  Log restricted-likelihood = -7.2073687  (not concave)
Iteration 10: Log restricted-likelihood = -7.2067537  (not concave)
Iteration 11: Log restricted-likelihood = -7.1989783
Iteration 12: Log restricted-likelihood = -7.1891619
Iteration 13: Log restricted-likelihood = -7.1815206
Iteration 14: Log restricted-likelihood = -7.1813888
Iteration 15: Log restricted-likelihood = -7.1813887

Computing standard errors ...

Multilevel REML meta-regression                         Number of obs =     56

Grouping information
 
    No. of Observations per group
Group variable   groups Minimum Average Maximum
 
district   11 3 5.1 11
school   56 1 1.0 1
 
                                                        Wald chi2(1)  =   0.31
Log restricted-likelihood = -7.1813887                  Prob > chi2   = 0.5753
 
stdmdiff   Coefficient Std. err. z P>|z| [95% conf. interval]
 
year_c   .0059598 .0106378 0.56 0.575 -.0148899 .0268094
_cons   .1805809 .0904865 2.00 0.046 .0032306 .3579311
 
Test of homogeneity: Q_M = chi2(54) = 550.26               Prob > Q_M = 0.0000
 
Random-effects parameters   Estimate
 
district: Independent    
sd(year_c)   .0177247
sd(_cons)   .219239
 
school: Identity    
sd(_cons)   .1807703
 

L’estimation du coefficient de régression de la variable year_c est de 0,006 avec un IC à 95 % de [-0,015, 0,027]. Nous ne voyons aucune preuve de l’association entre stdmdiff et year_c (p = 0,575).

Structures de covariance à effets aléatoires

Bien que l’année_c n’explique pas l’hétérogénéité, nous continuons à l’inclure comme modérateur à des fins d’illustration.

Par défaut, les pentes et les ordonnées aléatoires (au niveau du district) sont supposées indépendantes. Il est également possible de spécifier une structure de covariance échangeable à l’aide de l’option covariance(échangeable). Nous supprimons l’en-tête et le journal d’itération et affichons les résultats avec trois points décimaux à l’aide des options noheader, nolog et cformat(%9.3f).

. meta meregress stdmdiff year_c || district: year_c, covariance(exchangeable)
	|| school:, essevariable(se) noheader nolog cformat(%9.3f)
 
stdmdiff   Coefficient Std. err. z P>|z| [95% conf. interval]
 
year_c   0.010 0.012 0.80 0.426 -0.014 0.033
_cons   0.153 0.074 2.06 0.039 0.008 0.298
 
Test of homogeneity: Q_M = chi2(54) = 550.26               Prob > Q_M = 0.0000
 
Random-effects parameters   Estimate
 
district: Exchangeable    
sd(year_c _cons)   0.032
corr(year_c,_cons)   1.000
 
school: Identity    
sd(_cons)   0.181
 

Il est également possible de spécifier une structure de covariance personnalisée en fixant la corrélation entre les ordonnées et les pentes à 0,5 et en autorisant l’estimation de leurs écarts types à partir des données :

. matrix A = (.,.5 \ .5,.)
. meta meregress stdmdiff year_c || district: year_c, covariance(custom A)
	|| school:, essevariable(se) noheader nolog cformat(%9.3f)
 
stdmdiff   Coefficient Std. err. z P>|z| [95% conf. interval]
 
year_c   0.007 0.011 0.67 0.500 -0.014 0.028
_cons   0.170 0.082 2.08 0.038 0.010 0.330
 
Test of homogeneity: Q_M = chi2(54) = 550.26               Prob > Q_M = 0.0000
 
Random-effects parameters   Estimate
 
district: Custom    
sd(year_c)   0.026
sd(_cons)   0.116
corr(year_c,_cons)   0.500*
 
school: Identity    
sd(_cons)   0.180
 
(*) fixed during estimation
Prévoir les effets aléatoires

Ci-dessous, nous prédisons les effets aléatoires à l’aide de predict, reffects et obtenons leurs erreurs standard diagnostiques en spécifiant l’option reses(, diagnostic).

. quietly meta meregress stdmdiff || district: || school: , essevariable(se)
. predict double u3 u2, reffects reses(se_u3 se_u2, diagnostic)
. by district, sort: generate tolist = (_n==1)
. list district u3 se_u3 if tolist

district u3 se_u3

11 -.18998595 .07071817

12 -.08467077 .13168501

18 .1407273 .11790486

27 .24064814 .13641505

56 -.1072942 .13633364

58 -.23650899 .15003184

71 .5342778 .12606073

86 -.2004695 .1499012

91 .05711692 .14284823

108 -.14168396 .13094894

644 -.01215679 .10054689

 

 
    1. 5. 9. 12. 16.   20. 31. 34. 42. 48.   53.  

Les intercepts aléatoires u3 sont des écarts spécifiques au district par rapport à la moyenne générale de l’ampleur de l’effet. Par exemple, pour le district 18, la différence moyenne standardisée prédite est supérieure de 0,14 à l’ampleur de l’effet global.

Référence

Cooper, H., Valentine, J. C., et Melson, A. 2003. The effects of modified school calendars on student achievement and on school and community attitudes. Review of Educational Research 73 : 1-52.