Újdonságok a -ben

Csatlakozás adatbázisokhoz a JDBC használatával

A Stata és az adatbázisok összekapcsolása még könnyebbé vált. A jdbc lehetővé teszi számunkra, hogy adatokat cseréljünk a legnépszerűbb adatbázis-gyártókkal, mint például az Oracle, a MySQL, az Amazon Redshift, a Snowflake, a Microsoft SQL Server és még sok más. A jdbc-ben az a nagyszerű, hogy ez egy több platformon átívelő megoldás, így a JDBC-telepítésünk ugyanúgy működik Windows, Mac és Unix rendszereken. Miután telepítette a JDBC illesztőprogramot, csak arra az illesztőprogramra és a Stata kódra van szüksége, hogy áttérjen mondjuk a Mac laptopjáról a vállalat Windows felhőrendszereire.

Kiemelt

  • Hozzáférés az adatokhoz számos adatbázisból, beleértve az Oracle, a MySQL, az Amazon Redshift, a Snowflake, a Microsoft SQL Server és így tovább
  • Teljesen több platformon kompatibilis
  • Töltsön be egy teljes adatbázis-táblázatot a Statába. vagy SQL SELECT segítségével egyszerűen töltsön be egy adott oszlopot egy táblából a Statába
  • Helyezze be az összes változót egy adatbázis-táblába, vagy csak az adatok egy részhalmazát
  • Végezzen SQL utasításokat a Stata alkalmazásból
  • A kapcsolati beállítások tárolása adatforrás névként (DSN)

Lássuk hogyan működik

Az Amazon Web Services szolgáltatáson tárolt e-mail adatait egy Redshift fürtben tároljuk, és ezeket az adatokat be kell töltenünk a Statába. Először bejelentkezünk az AWS-be, és elmegyünk az Amazon Redshift konfigurációs oldalra, hogy letöltsük a megfelelő JDBC illesztőprogramot, és megkapjuk a megfelelő kapcsolati információkat. Ezután elhelyezzük a letöltött JDBC JAR fájlt a Stata adopátusunk mentén. Most a Stata Do-file Editorban gépeléssel tároljuk a kapcsolati információkat

. local jar "redshift-jdbc42-2.0.0.0.jar"
. local driverc "com.amazon.redshift.jdbc42.Driver"
. local url "jdbc:redshift://redshift-cluster-1.cziajbxjzi3e.us-west-2.redshift.amazonaws.com:5439/emails"
. local user "admin"
. local pass "secret"

. jdbc connect,  jar("`jar'") driverclass("`driverc'") url("`url'")
        user("`user'") password("`pass'")

Ha ezeket az adatbázis-beállításokat másoknak kell használniuk, vagy csak könnyebbé akarja tenni az emlékezésüket, akkor gépeléssel tárolhatjuk őket

. local jar "redshift-jdbc42-2.0.0.0.jar"
. local driverc "com.amazon.redshift.jdbc42.Driver"
. local url "jdbc:redshift://redshift-cluster-1.cziajbxjzi3e.us-west-2.redshift.amazonaws.com:5439/emails"
. local user "admin"
. local pass "secret"

. jdbc add MyRed,  jar("`jar'") driverclass("`driverc'") url("`url'")
        user("`user'") password("`pass'")

Most hozzáadhatjuk a fenti parancsokat a profile.do fájlhoz, hogy ezeket a kapcsolati beállításokat elmenthessük a Stata munkamenetek közé, és most beírhatjuk a Redshift adatbázisunkat a

. jdbc connect MyRed

Írjuk be, hogy megnézzük, milyen táblák tölthetők be a kapcsolatunkból

. jdbc showtables

Database: emails
Tables
category
response_info
employees

Gépeléssel leírhatunk egy táblázatot

. jdbc describe response_info

Table: response_info
Column name Column type
id BIGINT UNSIGNED filename VARCHAR category_id BIGINT UNSIGNED employee_id BIGINT UNSIGNED datein TIMESTAMP dateout DATE screendate TIMESTAMP rid TEXT keywords TEXT assigntime TIMESTAMP resptime TIMESTAMP timeadded TIMESTAMP sversion DOUBLE correct BIT timetouched TIMESTAMP timemailed TIMESTAMP

Az adatok betöltéséhez beírjuk

. jdbc load, table("response_info") clear
(128 observations loaded)

Most van egy Stata adatkészletünk, és elvégezhetjük elemzésünket!