New In

Estimation des systèmes de demande flexibles

Points forts

  • Générer des fonctions de base splines pour plusieurs variables à la fois

  • Fonctions de base B-spline

  • Fonctions de base polynomiales par morceaux

  • Fonctions de base spline cubique restreinte

  • Sélectionner le nombre de nœuds, fournir une liste de nœuds ou utiliser une matrice de nœuds

Souvent, nous ne voulons pas faire d’hypothèses sur la forme fonctionnelle des données que nous analysons. Nous pouvons vouloir ajuster une régression d’un résultat sur un ensemble de régresseurs sans nous soucier de la forme fonctionnelle des régresseurs. Les fonctions de base splines sont des approximations flexibles de la forme fonctionnelle des régresseurs. Nous pouvons également vouloir visualiser la relation entre un résultat et un régresseur ou entre des variables. Nous pouvons utiliser des splines pour visualiser cette relation sans prétendre à la linéarité ou à d’autres formes fonctionnelles.

Dans Stata 18, vous pouvez utiliser la nouvelle commande makespline pour générer des splines B, des splines polynomiales par morceaux et des fonctions de base splines cubiques restreintes à partir d’une liste de variables existantes. Par exemple, nous pouvons taper

. makespline bspline x1 x2 x3 x4 ...x100

pour former 100 fonctions de base B-spline du troisième ordre, une pour chaque variable de x1 à x100. Nous pouvons maintenant utiliser n’importe laquelle des fonctions de base pour ajuster un modèle et être agnostiques quant à la relation entre les covariables et un résultat d’intérêt. Nous pouvons également visualiser la relation entre le résultat d’intérêt et l’une des composantes de la fonction de base générée par makespline.

Voyons comment cela fonctionne

Nous aimerions voir l’effet du tabagisme des mères (mbsmoke) sur le poids de naissance (bweight) d’un enfant à l’aide de la commande telasso. La commande telasso nous permet de modéliser à la fois le résultat (bweight) et le traitement (mbsmoke). Nous pensons qu’il existe une relation entre le poids de naissance et l’âge de la mère (mage), le niveau d’éducation de la mère (medu) et le niveau d’éducation du père (fedu). Nous pensons également que medu est un bon indicateur du fait que la mère fume ou non pendant la grossesse.

Nous ne sommes pas convaincus de la forme fonctionnelle de la relation entre bweight et mage, medu et fedu. Nous ne savons pas non plus quelle est la relation entre mbsmoke et medu. Cela n’a pas d’importance pour telasso. La commande sélectionne un ensemble de covariables candidates et estime l’effet de traitement qui nous intéresse.

Nous utilisons makespline pour former des fonctions de base à partir de chacune des covariables d’intérêt.

. makespline bspline mage medu fedu

Nous avons généré des fonctions de base B-spline de troisième ordre, chacune composée de cinq variables, à partir de mage, medu et fedu. Les variables générées ont des noms de système génériques, commençant par _bsp. Si vous préférez, vous pouvez changer les noms de base en utilisant l’option basis(). Ci-dessous, nous montrons les variables générées :

Les composantes de la fonction de base B-spline de mage commencent par _bsp_1, celles de medu par _bsp_2 et celles de fedu par _bsp_3. À l’aide de ces fonctions de base, nous ajustons le modèle des effets du traitement :

. telasso (bweight c._bsp_1*##c._bsp_2* _bsp_3*) (mbsmoke _bsp_2*)

bweight est une fonction arbitraire de l’interaction (spécifiée en utilisant ##) des fonctions de base pour mage et medu et de la fonction de base pour l’éducation du père. mbsmoke est une fonction arbitraire de la fonction de base pour l’éducation de la mère. Voici les résultats :

Les variables de la fonction de base créées par makespline et leurs interactions ont produit 40 variables de contrôle potentielles. telasso a sélectionné 5 de ces variables de contrôle et les a utilisées pour calculer un effet de traitement de -263 grammes. En d’autres termes, le poids des bébés à la naissance serait inférieur de 263 grammes si toutes les mères fumaient par rapport à la situation contrefactuelle dans laquelle aucune mère ne fumait.