New In

Modèle probit fractionnel à variables instrumentales

Points forts

  • Résultats fractionnaires

  • Une ou plusieurs covariables endogènes continues

  • Covariance estimée de l’erreur endogène

Les résultats fractionnaires sont courants. Il peut s’agir de modéliser les taux de participation à un plan de retraite 401(k), le taux de réussite à des tests standardisés, les parts de dépenses, etc.

Les modèles de réponse fractionnaire sont un moyen souple et intuitif de modéliser les résultats qui se situent entre 0 et 1. Ils n’ont pas le problème des modèles linéaires qui produisent des prédictions en dehors de 0 et 1 ou le problème des modèles log-odds qui sont indéfinis à 0 et 1. Les modèles de réponse fractionnaire peuvent être ajustés à l’aide de la commande fracreg.

Que faire si vous craignez qu’une ou plusieurs covariables de votre modèle soient endogènes ? Avec la nouvelle commande ivfprobit, vous pouvez ajuster un modèle pour une variable dépendante fractionnaire et tenir compte de l’endogénéité d’une ou plusieurs covariables.

Voyons comment cela fonctionne

Nous voulons étudier le taux de participation aux plans 401(k) (prate). Nous pensons que la taille de l’emploi de l’entreprise (ltotemp) et son carré sont des déterminants des taux de participation, de même qu’un indicateur permettant de savoir si le 401(k) est le seul régime de retraite (sole) et le taux d’appariement du régime (mrate). Nous pensons toutefois que le taux d’appariement est endogène. En d’autres termes, il existe des déterminants non observés des taux de participation qui affectent également le taux d’appariement du plan. Par exemple, le taux d’appariement et le taux de participation peuvent être associés à des pratiques sectorielles et régionales non observables dans les données. Pour traiter l’endogénéité, nous instrumentons le taux d’appariement à l’aide de l’âge du régime (âge) et de son carré.

Nous tapons

. ivfprobit prate c.ltotemp##c.ltotemp i.sole (mrate = c.age##c.age)

Entre les parenthèses se trouve la variable endogène ainsi que les variables instrumentales que nous avons utilisées pour la modéliser. En dehors des parenthèses se trouvent les variables exogènes, qui affectent directement le taux. Nous obtenons

Nous constatons un effet positif du taux d’appariement sur le taux de participation. En outre, nous constatons que la corrélation estimée entre les variables non observables, corr(e.mrate, e.prate), est différente de zéro. Cela signifie qu’il existe des preuves pour soutenir notre conjecture d’endogénéité.