Újdonságok a -ben

Nulla felfújt rendezett logit modell

A Stata új ziologit parancsa nulla felfújt rendezett logit modellekhez illeszkedik.
A rendezett logit regressziót a rendezett kategorikus válaszok modellezésére használják, például a tünetek súlyosságát nem rögzítettként, enyhe, közepes vagy súlyos. Az ilyen rendezett eredmények nagyobb értékei magasabb szinteket képviselnek, de a numerikus érték nem releváns.
Bizonyos helyzetekben több nulla (vagy több érték a legalacsonyabb kategóriában) figyelhető meg az adatokban, mint azt egy hagyományos rendezett logit modell elvárná. A nulla a tulajdonság hiányát jelentheti, míg a fennmaradó érték a tulajdonság növekvő szintjét. Sok nulla figyelhető meg, némelyik azért, mert az egyénnek nincs vonása, más pedig azért, mert az egyén rendelkezik a vonással, de a legalacsonyabb szinten.
Például, az alkoholfogyasztás vizsgálatában egyesek nem fogyasztanak, mert soha nem isznak alkoholt, míg mások azt jelenthetik, hogy nem fogyasztanak alkoholt, mert nem fogyasztottak a felmérési időszakban.
A daganatok visszaszorítására szánt kezelés klinikai vizsgálatában az eredmények nem jelentenek javulást, részleges vagy teljes választ. Az egyén nem mutathat javulást, mert a daganat ellenáll a kezelésnek, vagy mert a daganat kezelhető volt, de a mérés idején nem zsugorodott. A megkülönböztetés azért fontos, mert a kezelhető daganatok alkalmasak magasabb dózisra.
Ilyen körülmények között használhat egy nulla felfújt rendezett logit (ZIOL) modellt. A ZIOL modellek azt feltételezik, hogy a legkevésbé értékelt eredmények mind a logit modellből, mind a rendezett logit modellből származnak, lehetővé téve az egyes modellek számára különböző előrejelző készleteket.

Kiemelt

  • Modellálja a rendes adatokat a válaszok túlteljesítésével a legalacsonyabb kategóriában
  • Használjon logit modellt a nulla infláció és a rendezett válasz sorrendű logit modelljének azonosítására
  • Használjon potenciálisan eltérő prediktorokat a logit és a rendezett logit modellhez
  • Könnyen értelmezheti a megállapításokat az esélyhányadosok és a marginális valószínűségek felhasználásáva
  • A Bayes-becslés támogatása
  • Robusztus, klaszter – robusztus és bootstrap szabványos hibákR
  • Komplex felmérési tervek támogatása

Lássuk hogyan működik

Ebben a példában kitalált adatokat fogunk használni a cigarettafogyasztásról.

. use https://www.stata-press.com/data/r17/tobacco

Az érdeklődés, tobacco, a napi cigarettafogyasztást rendes válaszként jeleníti meg, négy szinttel:

. codebook tobacco

tobacco Tobacco usage
Type: Numeric (byte)
Label: tobaclbl
Range: [0,3] Units: 1
Unique values: 4 Missing .: 0/15,000
Tabulation: Freq. Numeric Label
9,469 0 0 cigarettes
3,806 1 1–7 cigarettes/day
1,050 2 8–12 cigarettes/day
675 3 >12 cigarettes/day

A válaszadók több mint fele nem számolt be cigarettafogyasztásról. Úgy gondoljuk, hogy ezek a válaszadók a két csoport egyikébe tartoznak: nemdohányzók és leendő dohányosok, akik jelenleg nem végeznek dohányzási tevékenységet. A hagyományos rendezett logit regresszió modellezheti a cigarettafogyasztás mértékét a dohányosok körében, de nem tehet különbséget a válaszadók két csoportja között, akik nem számoltak be cigarettafogyasztással. A ZIOL modell bevezeti a dohányzásra való hajlam fogalmát, ahol a dohányosok (aktívak és leendőek egyaránt) hajlamosak a dohányzásra, míg az eredeti dohányzók nem hajlamosak a dohányzásra. A valódi nemdohányzók lehetőségének lehetővé tétele érdekében a ZIOL modellt választjuk a hagyományos megrendelt logit modell helyett.
A ziologit segítségével egyszerre modellezzük a cigarettafogyasztás szintjét és a dohányos lét valószínűségé. A cigarettafogyasztás szintjének modellezéséhez a prediktorokat beépítjük a ziologit parancsba közvetlenül a függő változó tobacco után. A dohányos valószínűségének modellezéséhez az inflate() opcióba beépítünk előrejelzőket, így nevezzük el, mert nulla infláció modellezésére használják. Az inflate() opcióra azért van szükség, mert annak kizárása egyenértékű lenne egy hagyományos rendezett logit modell illesztésével.
Tegyük fel, hogy szeretnénk visszaszorítani a cigarettafogyasztás szintjét az oktatás (education), a jövedelem 10 000 dollárban (income), és a nem (female), tekintetében, miközben szeretnénk modellezni annak valószínűségét, hogy dohányosok vagyunk, független változókkal, education és income, valamint egy változó, amely jelzi, hogy a válaszadó szülei dohányoztak-e (parent).
A következő paranccsal illeszthettük ezt a modellt:

. ziologit tobacco education income i.female, inflate(income education i.parent)

Iteration 0:   log likelihood = -15977.364  (not concave)
Iteration 1:   log likelihood =  -13149.83  (not concave)
Iteration 2:   log likelihood = -12467.245
Iteration 3:   log likelihood = -11039.218
Iteration 4:   log likelihood = -9929.2298
Iteration 5:   log likelihood = -9715.1143
Iteration 6:   log likelihood = -9703.2464
Iteration 7:   log likelihood = -9703.2168
Iteration 8:   log likelihood = -9703.2168

Zero-inflated ordered logit regression                 Number of obs =  15,000
                                                       Wald chi2(3)  = 3147.70
Log likelihood = -9703.2168                            Prob > chi2   =  0.0000

tobacco Coefficient Std. err. z P>|z| [95% conf. interval]
tobacco
education .5090816 .0094838 53.68 0.000 .4904938 .5276695
income .583636 .0114401 51.02 0.000 .5612139 .6060581
female
Female -.5307721 .0580736 -9.14 0.000 -.6445943 -.4169499
inflate
income -.1279677 .00705 -18.15 0.000 -.1417856 -.1141499
education -.1412459 .0049693 -28.42 0.000 -.1509855 -.1315062
parent
Smoking 1.187864 .0529432 22.44 0.000 1.084097 1.29163
_cons 2.617219 .1156891 22.62 0.000 2.390473 2.843966
/cut1 5.85957 .104449 5.654853 6.064286
/cut2 11.14187 .1945483 10.76056 11.52318
/cut3 14.3632 .2495117 13.87417 14.85224

Az eredménytáblázatnak három szakasza van. Az első szakasz, a címkézett tobacco, a rendezett logit modell együtthatóit tartalmazza a cigarettafogyasztás szintjére vonatkozóan. A második szakasz, az inflate, feliratú, a logit modell együtthatóit tartalmazza a dohányos lét valószínűségére vonatkozóan. A harmadik szakasz a rendezett logit modell vágási pontjait tartalmazza.
Az eredménytábla első két szakaszának értelmezéséhez az együtthatók hatványozhatók, és a vagy opcióval szorzó arányként jelenthetők.

. ziologit, or

Zero-inflated ordered logit regression                 Number of obs =  15,000
                                                       Wald chi2(3)  = 3147.70
Log likelihood = -9703.2168                            Prob > chi2   =  0.0000

tobacco Odds ratio Std. err. z P>|z| [95% conf. interval]
tobacco
education 1.663763 .0157788 53.68 0.000 1.633122 1.694978
income 1.792544 .0205068 51.02 0.000 1.752799 1.833191
female
Female .5881507 .034156 -9.14 0.000 .5248755 .659054
inflate
income .8798818 .0062032 -18.15 0.000 .8678073 .8921242
education .8682758 .0043147 -28.42 0.000 .8598602 .8767738
parent
Smoking 3.280066 .1736572 22.44 0.000 2.956768 3.638714
_cons 13.69758 1.584661 22.62 0.000 10.91866 17.18378
/cut1 5.85957 .104449 5.654853 6.064286
/cut2 11.14187 .1945483 10.76056 11.52318
/cut3 14.3632 .2495117 13.87417 14.85224
Note: Estimates are transformed only in the first 2 equations. Note: _cons estimates baseline odds.

Itt azt látjuk, hogy az éves jövedelem 10 000 dolláros növekedése 0,88-szorosára csökkenti a dohányzás esélyét (az esélyek 12% -os csökkenése), de a dohányosok körében 1,79-szeresére (79% -kal) növeli a nagyobb cigarettafogyasztás esélyét. esélyek növekedése). Ez azt sugallja, hogy a gazdagabb egyének ritkábban dohányoznak, de ha mégis úgy döntenek, hogy dohányoznak, inkább több cigarettát szívnak.
De mit is jelentenek ezek az eredmények valójában a különböző dohányzási viselkedés valószínűségének szempontjából? margins válaszolhatunk különböző kérdésekre modellünk paramétereinek felhasználásával. Tegyük fel, hogy érdekel bennünket a cigarettafogyasztás és a jövedelem szintje. Az alábbiakban megbecsüljük a cigarettafogyasztás minden szintjének valószínűségét 0, 50 000, 100 000, 150 000 és 200 000 USD éves jövedelmek esetén.

. margins, at(income=(0(5)20))

Predictive margins                                       Number of obs = 15,000
Model VCE: OIM

1._predict : Pr(tobacco=0), predict(pmargin outcome(0))
2._predict : Pr(tobacco=1), predict(pmargin outcome(1))
3._predict : Pr(tobacco=2), predict(pmargin outcome(2))
4._predict : Pr(tobacco=3), predict(pmargin outcome(3))

1._at: income =  0
2._at: income =  5
3._at: income = 10
4._at: income = 15
5._at: income = 20

Delta-method
Margin std. err. z P>|z| [95% conf. interval]
_predict#_at
1 1 .7428698 .0044443 167.15 0.000 .7341591 .7515805
1 2 .6190759 .0038733 159.83 0.000 .6114843 .6266675
1 3 .5168462 .0052057 99.29 0.000 .5066433 .5270492
1 4 .526699 .0092168 57.15 0.000 .5086344 .5447636
1 5 .6340465 .0138387 45.82 0.000 .6069232 .6611697
2 1 .2121431 .0034296 61.86 0.000 .2054211 .2188651
2 2 .2792459 .0033861 82.47 0.000 .2726092 .2858826
2 3 .3042245 .0040212 75.65 0.000 .2963431 .312106
2 4 .2226386 .0050478 44.11 0.000 .2127452 .232532
2 5 .0633686 .0047963 13.21 0.000 .0539681 .0727692
3 1 .0372614 .0014098 26.43 0.000 .0344983 .0400245
3 2 .0737865 .0019981 36.93 0.000 .0698702 .0777027
3 3 .1146585 .0029075 39.44 0.000 .1089599 .1203572
3 4 .1351544 .0041403 32.64 0.000 .1270395 .1432693
3 5 .138638 .0052133 26.59 0.000 .1284201 .1488559
4 1 .0077257 .0005647 13.68 0.000 .0066189 .0088324
4 2 .0278917 .0011614 24.01 0.000 .0256153 .030168
4 3 .0642707 .002228 28.85 0.000 .0599038 .0686376
4 4 .115508 .0045623 25.32 0.000 .1065661 .12445
4 5 .1639469 .0085572 19.16 0.000 .147175 .1807188

Itt kiszámítjuk a cigarettafogyasztás minden szintjének várható valószínűségét 0, 50 000, 100 000, 150 000 és 200 000 USD éves jövedelemre.
A kibocsátási táblázatban a jövedelem és a cigarettafogyasztási szint számos kombinációja szerepel. Ilyen esetekben hatékonyabb az eredményeket grafikusan bemutatni. A marginsplot segítségével vizualizálhatjuk a várható valószínűségeket az összes income felett.

A 0 cigaretta elszívásának valószínűsége csökken, amikor az éves jövedelem 100 000 dollárig növekszik, majd a valószínűség fokozatosan ismét növekszik. Az 1–7 cigaretta / nap dohányzás valószínűsége akkor a legmagasabb, ha a kereset évi 100 000 USD, és a legkisebb, ha a kereset évi 200 000 USD.
Az egyes eredmények általános valószínűségének áttekintése után meg akarjuk vizsgálni a jövedelem és a dohányzásra való hajlam összefüggését. margins használunk a ps, az érzékenység valószínűségének kiszámításához ugyanazon öt income. szinten.

. quietly margins, predict(ps) at(income=(0(5)20))

. marginsplot

Ha a jövedelem nulla, a válaszadók négyötöde vagy dohányos, vagy pedig dohányzik. A dohányzó valószínűsége csökken a jövedelem növekedésével, a válaszadók alig több mint egyharmada hajlamos a dohányzásra, ha a kereset évi 200 000 dollár. Ez alátámasztja azt az értelmezést, miszerint a jövedelem az egészségtudatosság helyettesítője lehet. Ezután margins koncentrálunk a dohányzásra hajlamos alanyokra. A pcond1 statisztika és az egyes kimeneti szintek megadásával kiszámítjuk az egyes tobacco,-szintek valószínűségét, az érzékenység függvényében. A korábbiakhoz hasonlóan a számításokat a income öt szintjén hajtják végre, és a marginsplot ábrázolják.

. quietly margins, predict(pcond1 outcome(0)) predict(pcond1 outcome(1))
 predict(pcond1 outcome(2)) predict(pcond1 outcome(3)) at(income=(0(5)20))

A leendő dohányosok jóval több mint fele, amikor az éves jövedelem nulla, 0 cigarettafogyasztást jelent, és azok, akik cigarettát fogyasztanak, nagy valószínűséggel csak néhány cigarettát szívnak el naponta. A jövedelem növekedésével csökken a 0 fogyasztás valószínűsége, és gyakorlatilag minden dohányos várhatóan pozitív cigarettafogyasztással számol, ha a kereset évi 200 000 USD.
A magasabb éves jövedelem nagyobb valószínűséggel jár együtt erős dohányosként: a napi 1–7 cigaretta elfogyasztásának valószínűsége csökken, mivel az éves jövedelem meghaladja a 100 000 dollárt, míg a napi> 12 cigaretta fogyasztásának valószínűsége növekszik a jövedelemmel income , a leggyakoribb dohányzási eredmény, ha a jövedelem magasabb. Ez arra utal, hogy a dohányosok körében a cigarettákat úgy kezelik, mint amit a közgazdászok normális jószágnak neveznek; vagyis valami, amire a kereslet növekszik, amikor a jövedelem növekszik.
Ebből a példából láthatjuk, hogy a income a cigarettafogyasztásra gyakorolt hatása sokrétű. A ziologit parancs lehetővé teszi a dohányzásra való hajlam és a dohányzás intenzitásának modellezését, ami a dohányzási magatartást befolyásoló tényezők jobb megértéséhez vezet.