Stata Caractéristiques

Stata est largement utilisé dans les domaines suivants:

Par discipline

Sciences du comportement
Biostatistiques
Science des données
Économie
Éducation

Epidémiologie
Finance, commerce et marketing
Recherche institutionnelle
Médecine

Sciences politiques
Santé publique
Politique publique
Sociologie

Par catégorie

Linear models

regression • censored outcomes • endogenous regressors • bootstrap, jackknife, and robust and cluster–robust variance • instrumental variables • three-stage least squares • constraints • quantile regression • GLS

Pour en savoir plus

Survival analysis

Kaplan–Meier and Nelson–Aalen estimators, • Cox regression (frailty) • parametric models (frailty, random effects) • competing risks • hazards • time-varying covariates • left-, right-, and interval-censoring • Weibull, exponential, and Gompertz models

Pour en savoir plus

Mata—Stata’s serious programming language

interactive sessions • large-scale development projects • optimization • matrix inversions • decompositions • eigenvalues and eigenvectors • LAPACK engine • real and complex numbers • string matrices • interface to Stata datasets and matrices • numerical derivatives • object-oriented programming

Pour en savoir plus

Données de panel/ longitudinales

effets aléatoires et fixes avec des erreurs standard robustes – modèles mixtes linéaires – probits à effets aléatoires – GEE – Poisson à effets aléatoires et fixes – modèles dynamiques de données de panel – variables instrumentales – tests de racine unitaire de panel

Pour en savoir plus

Analyse bayésienne

des milliers de modèles intégrés – modèles univariés et multivariés – modèles linéaires et non linéaires – modèles à plusieurs niveaux – résultats continus, binaires, ordinaux et de comptage – bayes:préfixe pour 46 commandes d’estimation – antécédents continus univariés, multivariés et discrets – ajoutez vos propres modèles – chaînes multiples – diagnostics de convergence – résumés postérieurs – tests d’hypothèses – ajustement du modèle – comparaison des modèles – prévisions

Pour en savoir plus

Interface utilisateur graphique

menus et dialogues pour toutes les fonctionnalités – Éditeur de données – Gestionnaire de variables – Éditeur de graphiques – Gestionnaire de projets – Éditeur de fichiers à faire – Outil de prévisualisation du presse-papiers – ensembles de préférences multiples

Pour en savoir plus

Modèles à effets mixtes à plusieurs niveaux

résultats continus, binaires, de comptage et de survie – modèles à deux, trois niveaux et plus – modèles linéaires généralisés – modèles non linéaires – interceptions aléatoires – pentes aléatoires – effets aléatoires croisés – BLUP des effets et valeurs ajustées – modèles hiérarchiques – structures d’erreurs résiduelles – ajustements DDF – support pour les données d’enquête

Pour en savoir plus

Méta-analyse

taille des effets – effets communs, fixes et aléatoires – forêt, entonnoir et autres parcelles – analyse des sous-groupes et analyse cumulative – méta-régression – effets des petites études – biais de publication

Pour en savoir plus

Documentation

36 manuels – plus de 19 000 pages – navigation fluide – des milliers d’exemples travaillés – démarrage rapide – méthodes et formules – références

Pour en savoir plus

Binaire, comptage et résultats limités

logistique, probit, tobit – Poisson et binôme négatif – conditionnel, multinomial, imbriqué, ordonné, rangé et stéréotype logistique – probit multinomial – modèles de comptage gonflés à zéro et tronqués à gauche – modèles de sélection – effets marginaux

Pour en savoir plus

Puissance, précision et taille de l’échantillon

powpuissance – taille de l’échantillon – taille de l’effet – effet minimal détectable – largeur de l’IC – moyennes – proportions – variances – corrélations – ANOVA – régression – plans d’étude randomisés en grappes – études cas-témoins – études de cohortes – tableaux de contingence – analyse de survie – plans équilibrés ou non équilibrés – résultats sous forme de tableaux ou de graphiques

Pour en savoir plus

Statistiques de base

résumés – tableaux croisés – corrélations – tests z et t – tests d’égalité des variances – tests de proportions – intervalles de confiance – variables factorielles

Pour en savoir plus

Modèles de choix

choix discret – alternatives ordonnées par rang – logit conditionnel – probit multinomial – logit emboîté – logit mixte – données de panel – prédicteurs spécifiques au cas et à l’alternative – interprétation des résultats – probabilités attendues, effets de covariables, comparaisons entre alternatives

Pour en savoir plus

Effets du traitement / Inférence de cause

poids de probabilité inverse (PPI) – méthodes doublement robustes – appariement des scores de propension – ajustement de régression – appariement des covariables – traitements à plusieurs niveaux – traitements endogènes – effets moyens des traitements (ATE) – ATE sur les traités (ATET) – moyennes des résultats potentiels (POM) – résultats continus, binaires, de comptage, fractionnaires et de survie – données de panel

Pour en savoir plus

Méthodes non paramétriques

régression non paramétrique – tests de Wilcoxon-Mann-Whitney, de Wilcoxon signé et de Kruskal-Wallis – corrélations de Spearman et de Kendall – tests de Kolmogorov-Smirnov – IC binomiaux exacts – données de survie – analyse ROC – lissage – bootstrapping

Pour en savoir plus

Modèles de régression étendus (MRE)

covariables endogènes – sélection de l’échantillon – traitement non aléatoire – données de panel – prise en compte des problèmes seuls ou en combinaison – résultats continus, censurés par intervalles, binaires et ordinaux

Pour en savoir plus

Lasso

lasso – réseau élastique – sélection de modèle – prédiction – inférence – résultats continus, binaires et de comptage – validation croisée – lasso adaptatif – double sélection – partialisation – partialisation croisée – double apprentissage machine – covariables endogènes

Pour en savoir plus

MGM et régression non linéaire

méthode des moments généralisés (MGM) – régression non linéaire

Pour en savoir plus

Modèles linéaires généralisés (MLG)

dix fonctions de lien – liens définis par l’utilisateur – sept distributions – estimation ML et IRLS – neuf estimateurs de variance – sept résidus

Pour en savoir plus

SEM (modélisation d’équation structurelle)

constructeur de diagrammes de cheminement graphique – estimations normalisées et non normalisées – indices de modification – effets directs et indirects – résultats continus, binaires, de comptage, ordinaux et de survie – modèles à plusieurs niveaux – pentes et interceptions aléatoires – scores factoriels, Bayes empiriques et autres prédictions – groupes et tests d’invariance – qualité de l’ajustement – traitement des données MAR par le FIML – données corrélées – données d’enquête

Pour en savoir plus

Probabilité maximale simple

spécifier la vraisemblance à l’aide d’expressions simples – aucune programmation nécessaire – données d’enquête – SE standard, robuste, bootstrap et jackknife – estimateurs matriciels

Pour en savoir plus

Modèles de mélange fini (MMF)

fmm : préfixe pour 17 estimateurs – mélanges d’un seul estimateur – mélanges combinant plusieurs estimateurs ou distributions – résultats continus, binaires, de comptage, ordinaux, catégoriques, censurés, tronqués et de survie

Pour en savoir plus

Analyse de la classe latente

éléments binaires, ordinaux, continus, de comptage, catégoriels, fractionnaires et de survie – ajout de covariables à l’appartenance à une classe modèle – combinaison avec des modèles de cheminement SEM – proportions attendues de la classe – qualité de l’ajustement – prédictions de l’appartenance à une classe

Pour en savoir plus

Probabilité maximale programmable

fonctions spécifiées par l’utilisateur – NR, DFP, BFGS, BHHH – OIM, OPG, robustes, bootstrap et jackknife SEs – tests de Wald – données d’enquête – dérivés numériques ou analytiques

Pour en savoir plus

Modèles autorégressifs spatiaux

retards spatiaux de la variable dépendante, des variables indépendantes et des erreurs autorégressives – effets fixes et aléatoires dans les données de panel – covariables endogènes – analyse des effets de débordement

Pour en savoir plus

Imputation multiple

neuf méthodes d’imputation univariée – imputation normale multivariée – équations enchaînées – explorer les tendances en matière d’absence de données – gérer les ensembles de données imputées – ajuster le modèle et mettre en commun les résultats – transformer les paramètres – tests conjoints des estimations de paramètres – prévisions

Pour en savoir plus

Autres méthodes statistiques

mesure kappa de l’accord entre les évaluateurs – alpha de Cronbach – régression par étapes – tests de normalité

Pour en savoir plus

ANOVA/MANOVA

dessins équilibrés et déséquilibrés – dessins factoriels, imbriqués et mixtes – mesures répétées – moyennes marginales – contrastes

Pour en savoir plus

Méthodes d’enquête

plans à plusieurs étapes – bootstrap, BRR, jackknife, linéarisation et estimation de la variance DTS – poststratification – ratissage – calage – DEFF – marges prédictives – moyennes, proportions, ratios, totaux – tableaux récapitulatifs – presque tous les estimateurs pris en charge

Pour en savoir plus

Fonctions

statistique – nombre aléatoire – mathématique – chaîne de caractères – date et heure – expressions régulières – Unicode

Pour en savoir plus

Des statistiques exactes

régression logistique exacte et régression de Poisson – statistiques cas-témoins exactes – tests binomiaux – test exact de Fisher pour les tableaux r × c

Pour en savoir plus

Analyse des clusters

regroupement hiérarchique – kmeans et kmedian regroupement non hiérarchique – dendrogrammes – règles d’arrêt – analyses extensibles à l’utilisateur

Pour en savoir plus

Capacités de l’Internet

possibilité d’installer de nouvelles commandes – mise à jour web – partage de fichiers web – dernières nouvelles de Stata

Pour en savoir plus

Epidémiologie

standardisation des taux – cas-témoin – cohorte – cas-témoin apparié – Mantel-Haenszel – pharmacocinétique – analyse ROC – CIM-10

Pour en savoir plus

IRT (théorie de la réponse d’article)

modèles de réponse binaires (1PL, 2PL, 3PL), ordinaux et catégoriels – courbes caractéristiques des articles – courbes caractéristiques des tests – fonctions d’information des articles – fonctions d’information des tests – modèles à groupes multiples – fonctionnement différentiel des articles (DIF)

Pour en savoir plus

Commandes à contribution communautaire

rechercher et télécharger des milliers d’ajouts gratuits – découvrir de nouvelles fonctionnalités dans le Stata Journal – partager des commandes en les publiant sur le site de la CSE – discuter des commandes fournies par la communauté sur Statalist

Pour en savoir plus

Modèles DSGE

spécifier algébriquement les modèles – résoudre les modèles – estimer les paramètres – identifier les diagnostics – politiques et matrices de transition – IRF – prévisions dynamiques

Pour en savoir plus

Méthodes multivariées

analyse factorielle – composantes principales – analyse discriminante – rotation – mise à l’échelle multidimensionnelle – analyse de Procruste – analyse de correspondance – biplots – dendrogrammes – analyses extensibles à l’utilisateur

Pour en savoir plus

Calculs statistiques intégrés

Numérique par Stata

Tests, prévisions et effets

Tests de Wald – Tests de LR – combinaisons linéaires et non linéaires – prédictions et prédictions généralisées – moyennes marginales – moyennes des moindres carrés – moyennes ajustées – effets marginaux et partiels – modèles de prévision – tests de Hausman

Pour en savoir plus

Querelles de données

transformations de données – cadres de données – match-merge – importation/exportation de données – ODBC – SQL – Unicode – traitement par groupes – fichiers appendus – tri – transposition lignes-colonnes – étiquetage – sauvegarde des résultats

Pour en savoir plus

Qualification de l’installation

Rapport Q pour les organismes de réglementation tels que la FDA – vérification des installations

Contrastes, comparaisons par paires et marges

comparer les moyennes, les interceptions ou les pentes – comparer avec la catégorie de référence, la catégorie adjacente, la grande moyenne, etc. – polynômes orthogonaux – ajustements par comparaisons multiples – graphe des moyennes et des contrastes estimés – graphiques d’interaction

Pour en savoir plus

Rapports

rapports reproductibles – Word – Excel – PDF – HTML – documents dynamiques – Markdown – résultats et graphiques Stata – SVG – EPS – PNG – TIF – texte et tableaux formatés

Pour en savoir plus

Accessibilité

Conformité à l’article 508, accessibilité pour les personnes handicapées

Méthodes de rééchantillonnage et de simulation

bootstrap – jackknife – simulation de Monte Carlo – tests de permutation

Pour en savoir plus

Graphiques

lignes – barres – surfaces – plages – contours – intervalles de confiance – graphiques d’interaction – graphiques de survie – qualité de publication – personnalisation – éditeur de graphiques

Pour en savoir plus

Exemple de session

Un exemple de session de Stata pour Mac, Unix ou Windows.

Séries chronologiques

ARIMA – ARFIMA – ARCH/GARCH – VAR – VECM – GARCH multivarié – modèle à composantes non observées – facteurs dynamiques – modèles d’espace d’état – modèles à commutation de Markov – calendriers d’entreprise – tests de rupture structurelle – régression de seuil – prévisions – fonctions de réponse impulsionnelle – tests de racine unitaire – filtres et lisseurs – estimation roulante et récursive

Pour en savoir plus

Caractéristiques de la programmation

ajout de nouvelles commandes – scripting – programmation orientée objet – programmation de menus et de boîtes de dialogue – documents dynamiques – Markdown – Gestionnaire de projet – intégration Python – plugins Java – plugins C/C

Pour en savoir plus

Nouveau dans Stata 19

Moyenne de modèle bayésienne – Analyse de médiation causale – Tableaux de statistiques descriptives – DID hétérogène – Plans séquentiels de groupe – Méta-analyse multi-niveaux – Méta-analyse pour la prévalence – Inférence robuste pour les modèles linéaires – Bootstrap en grappes sauvages – Projections locales pour les IRF – Systèmes de demande flexibles – TVC avec modèle de Cox censuré par intervalles – Lasso pour le modèle de Cox – RERI – Régression quantile IV – Alias de variables à travers les cadres – Tout nouveau style de graphique – et bien plus encore.

Stata est largement utilisé dans les domaines suivants:

Par discipline

Par catégorie

Exemple de session

Suisse

Roumanie

Hongrie

Bulgarie

République tchèque

Ukraine