Stata est largement utilisé dans les domaines suivants:
Par discipline
- Sciences du comportement
- Biostatistiques
- Science des données
- Économie
- Éducation
- Epidémiologie
- Finance, commerce et marketing
- Recherche institutionnelle
- Médecine
- Sciences politiques
- Santé publique
- Politique publique
- Sociologie
Par catégorie
regression • censored outcomes • endogenous regressors • bootstrap, jackknife, and robust and cluster–robust variance • instrumental variables • three-stage least squares • constraints • quantile regression • GLS
Kaplan–Meier and Nelson–Aalen estimators, • Cox regression (frailty) • parametric models (frailty, random effects) • competing risks • hazards • time-varying covariates • left-, right-, and interval-censoring • Weibull, exponential, and Gompertz models
interactive sessions • large-scale development projects • optimization • matrix inversions • decompositions • eigenvalues and eigenvectors • LAPACK engine • real and complex numbers • string matrices • interface to Stata datasets and matrices • numerical derivatives • object-oriented programming
effets aléatoires et fixes avec des erreurs standard robustes – modèles mixtes linéaires – probits à effets aléatoires – GEE – Poisson à effets aléatoires et fixes – modèles dynamiques de données de panel – variables instrumentales – tests de racine unitaire de panel
menus et dialogues pour toutes les fonctionnalités – Éditeur de données – Gestionnaire de variables – Éditeur de graphiques – Gestionnaire de projets – Éditeur de fichiers à faire – Outil de prévisualisation du presse-papiers – ensembles de préférences multiples
résultats continus, binaires, de comptage et de survie – modèles à deux, trois niveaux et plus – modèles linéaires généralisés – modèles non linéaires – interceptions aléatoires – pentes aléatoires – effets aléatoires croisés – BLUP des effets et valeurs ajustées – modèles hiérarchiques – structures d’erreurs résiduelles – ajustements DDF – support pour les données d’enquête
taille des effets – effets communs, fixes et aléatoires – forêt, entonnoir et autres parcelles – analyse des sous-groupes et analyse cumulative – méta-régression – effets des petites études – biais de publication
logistique, probit, tobit – Poisson et binôme négatif – conditionnel, multinomial, imbriqué, ordonné, rangé et stéréotype logistique – probit multinomial – modèles de comptage gonflés à zéro et tronqués à gauche – modèles de sélection – effets marginaux
powpuissance – taille de l’échantillon – taille de l’effet – effet minimal détectable – largeur de l’IC – moyennes – proportions – variances – corrélations – ANOVA – régression – plans d’étude randomisés en grappes – études cas-témoins – études de cohortes – tableaux de contingence – analyse de survie – plans équilibrés ou non équilibrés – résultats sous forme de tableaux ou de graphiques
résumés – tableaux croisés – corrélations – tests z et t – tests d’égalité des variances – tests de proportions – intervalles de confiance – variables factorielles
choix discret – alternatives ordonnées par rang – logit conditionnel – probit multinomial – logit emboîté – logit mixte – données de panel – prédicteurs spécifiques au cas et à l’alternative – interprétation des résultats – probabilités attendues, effets de covariables, comparaisons entre alternatives
poids de probabilité inverse (PPI) – méthodes doublement robustes – appariement des scores de propension – ajustement de régression – appariement des covariables – traitements à plusieurs niveaux – traitements endogènes – effets moyens des traitements (ATE) – ATE sur les traités (ATET) – moyennes des résultats potentiels (POM) – résultats continus, binaires, de comptage, fractionnaires et de survie – données de panel
régression non paramétrique – tests de Wilcoxon-Mann-Whitney, de Wilcoxon signé et de Kruskal-Wallis – corrélations de Spearman et de Kendall – tests de Kolmogorov-Smirnov – IC binomiaux exacts – données de survie – analyse ROC – lissage – bootstrapping
covariables endogènes – sélection de l’échantillon – traitement non aléatoire – données de panel – prise en compte des problèmes seuls ou en combinaison – résultats continus, censurés par intervalles, binaires et ordinaux
lasso – réseau élastique – sélection de modèle – prédiction – inférence – résultats continus, binaires et de comptage – validation croisée – lasso adaptatif – double sélection – partialisation – partialisation croisée – double apprentissage machine – covariables endogènes
méthode des moments généralisés (MGM) – régression non linéaire
dix fonctions de lien – liens définis par l’utilisateur – sept distributions – estimation ML et IRLS – neuf estimateurs de variance – sept résidus
constructeur de diagrammes de cheminement graphique – estimations normalisées et non normalisées – indices de modification – effets directs et indirects – résultats continus, binaires, de comptage, ordinaux et de survie – modèles à plusieurs niveaux – pentes et interceptions aléatoires – scores factoriels, Bayes empiriques et autres prédictions – groupes et tests d’invariance – qualité de l’ajustement – traitement des données MAR par le FIML – données corrélées – données d’enquête
spécifier la vraisemblance à l’aide d’expressions simples – aucune programmation nécessaire – données d’enquête – SE standard, robuste, bootstrap et jackknife – estimateurs matriciels
fmm : préfixe pour 17 estimateurs – mélanges d’un seul estimateur – mélanges combinant plusieurs estimateurs ou distributions – résultats continus, binaires, de comptage, ordinaux, catégoriques, censurés, tronqués et de survie
éléments binaires, ordinaux, continus, de comptage, catégoriels, fractionnaires et de survie – ajout de covariables à l’appartenance à une classe modèle – combinaison avec des modèles de cheminement SEM – proportions attendues de la classe – qualité de l’ajustement – prédictions de l’appartenance à une classe
fonctions spécifiées par l’utilisateur – NR, DFP, BFGS, BHHH – OIM, OPG, robustes, bootstrap et jackknife SEs – tests de Wald – données d’enquête – dérivés numériques ou analytiques
retards spatiaux de la variable dépendante, des variables indépendantes et des erreurs autorégressives – effets fixes et aléatoires dans les données de panel – covariables endogènes – analyse des effets de débordement
neuf méthodes d’imputation univariée – imputation normale multivariée – équations enchaînées – explorer les tendances en matière d’absence de données – gérer les ensembles de données imputées – ajuster le modèle et mettre en commun les résultats – transformer les paramètres – tests conjoints des estimations de paramètres – prévisions
mesure kappa de l’accord entre les évaluateurs – alpha de Cronbach – régression par étapes – tests de normalité
dessins équilibrés et déséquilibrés – dessins factoriels, imbriqués et mixtes – mesures répétées – moyennes marginales – contrastes
plans à plusieurs étapes – bootstrap, BRR, jackknife, linéarisation et estimation de la variance DTS – poststratification – ratissage – calage – DEFF – marges prédictives – moyennes, proportions, ratios, totaux – tableaux récapitulatifs – presque tous les estimateurs pris en charge
statistique – nombre aléatoire – mathématique – chaîne de caractères – date et heure – expressions régulières – Unicode
régression logistique exacte et régression de Poisson – statistiques cas-témoins exactes – tests binomiaux – test exact de Fisher pour les tableaux r × c
regroupement hiérarchique – kmeans et kmedian regroupement non hiérarchique – dendrogrammes – règles d’arrêt – analyses extensibles à l’utilisateur
possibilité d’installer de nouvelles commandes – mise à jour web – partage de fichiers web – dernières nouvelles de Stata
standardisation des taux – cas-témoin – cohorte – cas-témoin apparié – Mantel-Haenszel – pharmacocinétique – analyse ROC – CIM-10
modèles de réponse binaires (1PL, 2PL, 3PL), ordinaux et catégoriels – courbes caractéristiques des articles – courbes caractéristiques des tests – fonctions d’information des articles – fonctions d’information des tests – modèles à groupes multiples – fonctionnement différentiel des articles (DIF)
rechercher et télécharger des milliers d’ajouts gratuits – découvrir de nouvelles fonctionnalités dans le Stata Journal – partager des commandes en les publiant sur le site de la CSE – discuter des commandes fournies par la communauté sur Statalist
spécifier algébriquement les modèles – résoudre les modèles – estimer les paramètres – identifier les diagnostics – politiques et matrices de transition – IRF – prévisions dynamiques
analyse factorielle – composantes principales – analyse discriminante – rotation – mise à l’échelle multidimensionnelle – analyse de Procruste – analyse de correspondance – biplots – dendrogrammes – analyses extensibles à l’utilisateur
Numérique par Stata
Tests de Wald – Tests de LR – combinaisons linéaires et non linéaires – prédictions et prédictions généralisées – moyennes marginales – moyennes des moindres carrés – moyennes ajustées – effets marginaux et partiels – modèles de prévision – tests de Hausman
transformations de données – cadres de données – match-merge – importation/exportation de données – ODBC – SQL – Unicode – traitement par groupes – fichiers appendus – tri – transposition lignes-colonnes – étiquetage – sauvegarde des résultats
Rapport Q pour les organismes de réglementation tels que la FDA – vérification des installations
comparer les moyennes, les interceptions ou les pentes – comparer avec la catégorie de référence, la catégorie adjacente, la grande moyenne, etc. – polynômes orthogonaux – ajustements par comparaisons multiples – graphe des moyennes et des contrastes estimés – graphiques d’interaction
rapports reproductibles – Word – Excel – PDF – HTML – documents dynamiques – Markdown – résultats et graphiques Stata – SVG – EPS – PNG – TIF – texte et tableaux formatés
Conformité à l’article 508, accessibilité pour les personnes handicapées
bootstrap – jackknife – simulation de Monte Carlo – tests de permutation
lignes – barres – surfaces – plages – contours – intervalles de confiance – graphiques d’interaction – graphiques de survie – qualité de publication – personnalisation – éditeur de graphiques
Exemple de session
Un exemple de session de Stata pour Mac, Unix ou Windows.
ARIMA – ARFIMA – ARCH/GARCH – VAR – VECM – GARCH multivarié – modèle à composantes non observées – facteurs dynamiques – modèles d’espace d’état – modèles à commutation de Markov – calendriers d’entreprise – tests de rupture structurelle – régression de seuil – prévisions – fonctions de réponse impulsionnelle – tests de racine unitaire – filtres et lisseurs – estimation roulante et récursive
ajout de nouvelles commandes – scripting – programmation orientée objet – programmation de menus et de boîtes de dialogue – documents dynamiques – Markdown – Gestionnaire de projet – intégration Python – plugins Java – plugins C/C