Nouveau dans

Intégration H2O

Dans Stata 17, nous avons expérimenté la connexion à H2O. H2O est une plateforme open-source évolutive et distribuée d’apprentissage automatique et d’analyse prédictive. Vous pouvez en savoir plus sur H2O à docs.h2o.ai.
Avec l’intégration de H2O, vous pouvez démarrer un nouveau cluster H2O à partir de Stata sur votre machine locale via la commande

. h2o init

ou se connecter à un cluster H2O local ou distant via

. h2o connect [, ip(#,#,#,#) port(#)]

Vous pouvez accéder à l’interface utilisateur web de H2O, Flow, avec

. h2o flow

Stata fournit d’autres commandes utilitaires pour interagir avec le cluster ; voir Démarrer, connecter et interroger un cluster H2O pour plus de détails.

Points forts

  • Démarrez un nouveau cluster H2O ou connectez-vous à un cluster H2O existant depuis Stata
  • Manipuler les données (trames H2O) sur le cluster H2O depuis Stata
    • Créer de nouveaux cadres H2O
    • Importez ou téléchargez des fichiers de données vers de nouvelles trames H2O
    • Placez l’ensemble de données actuel de Stata dans une nouvelle trame H2O ou chargez les trames H2O dans Stata
    • Diviser, combiner et interroger des trames H2O
  • Accédez aux capacités de H2O en utilisant diverses commandes utilitaires directement à partir de Stata.

Une fois le cluster démarré ou connecté, vous pouvez manipuler les données (cadres H2O) sur le cluster à l’aide d’une suite de commandes _h2oframe. Par exemple, vous pouvez créer de nouvelles trames H2O, importer ou télécharger des fichiers de données vers de nouvelles trames H2O, placer l’ensemble de données actuel de Stata dans une nouvelle trame H2O, charger des trames H2O dans Stata et les enregistrer localement, ou diviser, combiner et interroger des trames H2O à partir de Stata. Vous pouvez également combiner les capacités de ces commandes _h2oframe avec les vastes commandes de gestion des données de Stata pour obtenir davantage d’outils de manipulation des données. Voir Travailler avec les cadres H2O pour une liste complète des commandes.

Bien que cette fonctionnalité soit encore au stade expérimental pour nous, nous voulons la mettre à la disposition de nos utilisateurs pour qu’ils l’essaient. D’autre part, comme il s’agit d’une fonctionnalité expérimentale, la syntaxe et les fonctionnalités sont susceptibles d’être modifiées. Lorsque vous utilisez des commandes Stata qui donnent accès à une fonctionnalité donnée de H2O, gardez à l’esprit qu’il s’agit d’une fonctionnalité de H2O. Une commande Stata peut y accéder, mais ce qu’elle fait relève de H2O et est extérieur à Stata.

Références

H20.ai. (2021) H2O: Scalable Machine Learning Platform. Version 3.32.1.1.
https://github.com/h2oai/h2o-3