Újdonságok a -ben

A kezelés-hatás becslése lasszóval

A kezelés-hatás becslők segítségével ok-okozati következtetéseket von le a megfigyelési adatokból.
Talán meg szeretné becsülni a gyógyszeres kezelés vérnyomásra gyakorolt hatását, a sebészeti beavatkozás mobilitásra gyakorolt hatását, egy képzési program foglalkoztatásra gyakorolt hatását vagy egy hirdetési kampány értékesítésre gyakorolt hatását.
Akkor használ laszó következtetésbecslőket, ha néhány kovariáns következtetése érdekli, miközben sok más lehetséges kovariátust kontrollál. (És amikor sokakat mondunk, akkor százakat, ezereket vagy még többet értünk!)
Most ezeket a becsléseket egyszerre használhatja. Az új telasso paranccsal megbecsülheti a kezelés hatásait, miközben számos lehetséges kovariátust kontrollálhat.
Például beírhat

. telasso (y1 x1-x100) (treat w1-w100)

megbecsülni a bináris treat kezelésének hatását a folyamatos y1 eredményre, miközben az eredménymodellben kontrolláljuk az y1 – x100 prediktorokat, a kezelési modellben pedig a w1 – w100 értékeket. A kapott becslések mind a kezelés-hatás becslők, mind a lasszó robusztussági tulajdonságaiból profitálnak.
A telasso, segítségével mindent megkap, amit elvárhat a kezelési hatásoktól és a lasszótól. Megbecsülheti az átlagos kezelési hatást, az átlagos kezelési hatást a kezeltre és a lehetséges kimenetel átlagát. Modellezheti a folyamatos, bináris és számlálási eredményeket, és választhat logit vagy probit kezelési modell között. A vezérlők kiválasztásához választhat a lasso vagy a négyzetgyökös lasso becslés között, és választhat számos kiválasztási módszer közül, például BIC és keresztellenőrzés.

Kiemelt

Becsülje meg a kezelés hatásait nagy dimenziós kontrollokkal

  • Nagydimenziós kontrollok az eredménymodellben
  • Nagydimenziós kontrollok az eredménymodellben

Rugalmas modell specifikáció

  • Kimeneti modell lehet linear, logit, probit, vagy poisson
  • A kezelés kiosztási modellje lehet logit vagy probit

A kezelési hatások különböző mértékei

  • ATE: átlagos kezelési hatások
  • A véletlenszerű hatások variancia – kovariancia mátrixa
  • ATET: átlagos kezelési hatás a kezeltre
  • POM: potenciális-kimeneti átlag

Robusztus becslés

  • Kettős robusztusság: csak az egyik modellt kell pontosan megadni
  • Neyman ortogonalitás: véd a lasso által elkövetett modellválasztási hibák ellen

Kettős gépi tanulás

  • Keresztbeillesztés és újramintavétel

Lássuk hogyan mükődik

Kétféle tüdőtranszplantációt szeretnénk összehasonlítani: a bilaterális tüdőtranszplantációt (BLT) és az egyszeri tüdőtranszplantációt (SLT). A BLT általában a műtét után rövid távon magasabb halálozási arányhoz kapcsolódik, de az SLT-nél jelentősebb az életminőség javulása. Ennek eredményeként a betegek számára, akiknek dönteniük kell a két kezelési lehetőség között, elengedhetetlen a BLT (szemben az SLT) életminőségre gyakorolt hatásának ismerete. Ezért meg akarjuk becsülni a kezelés transtype a fev1p. eredményre gyakorolt hatását. Ez az eredmény a kényszerű kilégzési térfogat egy másodpercben (FEV1) képviseli a páciens egészséges emberhez viszonyított arányát.
Adataink 29 változót tartalmaznak, amelyek rögzítik a betegek és a donorok jellemzőit. Ezeket a változókat és a közöttük lévő kölcsönhatásokat használjuk kontrollként a modellünkben.Ezeket a változókat és a közöttük lévő kölcsönhatásokat használjuk, mint a modellünkben. A vl parancssor, amely leegyszerűsíti ezt a folyamatot. A következő kód létrehozza a vezérlőváltozók listáját és elmenti a globális $allvars makróba.

. quietly vl set

. vl create cvars = vlcontinuous - (fev1p)
note: $cvars initialized with 12 variables.

. vl create fvars = vlcategorical - (transtype)
note: $fvars initialized with 17 variables.

. vl sub allvars = c.cvars i.fvars c.cvars#i.fvars

Most készen állunk a telasso használatára az átlagos kezelési hatások becsléséhez. Feltételezünk lineáris kimeneti modellt és logit kezelési modellt, az alapértelmezéseket. Beírjuk

. telasso (fev1p $allvars) (transtype $allvars)

Estimating lasso for outcome fev1p if tran~e = 0 using plugin method ...
Estimating lasso for outcome fev1p if tran~e = 1 using plugin method ...
Estimating lasso for treatment tran~e using plugin method ...
Estimating ATE ...

Treatment-effects lasso estimation    Number of observations      =        937
Outcome model:   linear               Number of controls          =        454
Treatment model: logit                Number of selected controls =          8

Robust
fev1p Coefficient std. err. z P>|z| [95% conf. interval]
ATE
transtype
(BLT
vs
SLT) 37.51841 .1606703 233.51 0.000 37.20351 37.83332
POmean
transtype
SLT 46.4938 .2021582 229.99 0.000 46.09757 46.89002

Ha az összes beteg BLT-t választana, a FEV1% várhatóan 38 százalékponttal magasabb, mint a várható 46% -os átlag, ha minden beteg SLT-t választana. A 454 kontrollváltozó közül a telasso csak 8-at választ ki közülük. Gyakran becsülik az átlagos kezelési hatást, hogy meghatározzuk a hatást azokra, akik valóban részesültek a kezelésben. Ennek az értéknek a becsléséhez hozzáadjuk az atet opciót.

. telasso (fev1p $allvars) (transtype $allvars), atet

Estimating lasso for outcome fev1p if tran~e = 0 using plugin method ...
Estimating lasso for outcome fev1p if tran~e = 1 using plugin method ...
Estimating lasso for treatment tran~e using plugin method ...
Estimating ATET ...

Treatment-effects lasso estimation    Number of observations      =        937
Outcome model:   linear               Number of controls          =        454
Treatment model: logit                Number of selected controls =          8

Robust
fev1p Coefficient std. err. z P>|z| [95% conf. interval]
ATET
transtype
(BLT
vs
SLT) 35.78157 .1831478 195.37 0.000 35.42261 36.14053
POmean
transtype
SLT 43.35214 1.268976 34.16 0.000 40.86499 45.83929

Azoknál a betegeknél, akiknek BLT-je van, azt várjuk, hogy az átlagos FEV1% 36 százalékponttal magasabb, mint ha valamennyien SLT-t választanának.
A fentiekben kapott becslések a lasszó kulcsfontosságú feltételezésére, a ritkaság feltételezésére támaszkodtak, amely megköveteli, hogy a potenciális kovariánsok közül csak kis szám legyen az „igaz” modellben. Kettős gépi tanulási technikát használhatunk annak érdekében, hogy az igazi modellben több kovariáns jöjjön létre. Ehhez hozzáadjuk az xfold(5) opciót, hogy a mintát öt csoportra oszthassuk, és elvégezzük a keresztillesztést, és hozzáadjuk a resample(3) opciót, hogy megismételjük a keresztillesztési eljárást három mintával.
Annak garantálása érdekében, hogy a becslési eredményeket később reprodukálni tudjuk, beállítottuk a véletlenszámú magot is. Beírjuk

. set seed 12345671

. telasso (fev1p $allvars) (transtype $allvars), xfolds(5) resample(3) nolog

Treatment-effects lasso estimation    Number of observations       =       937
                                      Number of controls           =       454
                                      Number of selected controls  =        16
Outcome model:   linear               Number of folds in cross-fit =         5
Treatment model: logit                Number of resamples          =         3

Robust
fev1p Coefficient std. err. z P>|z| [95% conf. interval]
ATE
transtype
(BLT
vs
SLT) 37.52837 .1683194 222.96 0.000 37.19847 37.85827
POmean
transtype
SLT 46.4941 .2040454 227.86 0.000 46.09418 46.89402

A becsült kezelési hatás nagyon hasonlít az első telasso parancs által jelentetthez, de a kiválasztott modell 8 kontroll helyett 16 kontrollt tartalmazott. A becslések hasonlósága a különböző specifikációk között arra utal, hogy első modellünk nem szenvedett a ritkaság feltételezésének megsértésétől.