Újdonságok a
-ben
A kezelés-hatás becslése lasszóval
A kezelés-hatás becslők segítségével ok-okozati következtetéseket von le a megfigyelési adatokból.
Talán meg szeretné becsülni a gyógyszeres kezelés vérnyomásra gyakorolt hatását, a sebészeti beavatkozás mobilitásra gyakorolt hatását, egy képzési program foglalkoztatásra gyakorolt hatását vagy egy hirdetési kampány értékesítésre gyakorolt hatását.
Akkor használ laszó következtetésbecslőket, ha néhány kovariáns következtetése érdekli, miközben sok más lehetséges kovariátust kontrollál. (És amikor sokakat mondunk, akkor százakat, ezereket vagy még többet értünk!)
Most ezeket a becsléseket egyszerre használhatja. Az új telasso paranccsal megbecsülheti a kezelés hatásait, miközben számos lehetséges kovariátust kontrollálhat.
Például beírhat
. telasso (y1 x1-x100) (treat w1-w100)
megbecsülni a bináris treat kezelésének hatását a folyamatos y1 eredményre, miközben az eredménymodellben kontrolláljuk az y1 – x100 prediktorokat, a kezelési modellben pedig a w1 – w100 értékeket. A kapott becslések mind a kezelés-hatás becslők, mind a lasszó robusztussági tulajdonságaiból profitálnak.
A telasso, segítségével mindent megkap, amit elvárhat a kezelési hatásoktól és a lasszótól. Megbecsülheti az átlagos kezelési hatást, az átlagos kezelési hatást a kezeltre és a lehetséges kimenetel átlagát. Modellezheti a folyamatos, bináris és számlálási eredményeket, és választhat logit vagy probit kezelési modell között. A vezérlők kiválasztásához választhat a lasso vagy a négyzetgyökös lasso becslés között, és választhat számos kiválasztási módszer közül, például BIC és keresztellenőrzés.
Kiemelt
Becsülje meg a kezelés hatásait nagy dimenziós kontrollokkal
- Nagydimenziós kontrollok az eredménymodellben
- Nagydimenziós kontrollok az eredménymodellben
Rugalmas modell specifikáció
- Kimeneti modell lehet linear, logit, probit, vagy poisson
- A kezelés kiosztási modellje lehet logit vagy probit
A kezelési hatások különböző mértékei
- ATE: átlagos kezelési hatások
- A véletlenszerű hatások variancia – kovariancia mátrixa
- ATET: átlagos kezelési hatás a kezeltre
- POM: potenciális-kimeneti átlag
Robusztus becslés
- Kettős robusztusság: csak az egyik modellt kell pontosan megadni
- Neyman ortogonalitás: véd a lasso által elkövetett modellválasztási hibák ellen
Kettős gépi tanulás
- Keresztbeillesztés és újramintavétel
Lássuk hogyan mükődik
Kétféle tüdőtranszplantációt szeretnénk összehasonlítani: a bilaterális tüdőtranszplantációt (BLT) és az egyszeri tüdőtranszplantációt (SLT). A BLT általában a műtét után rövid távon magasabb halálozási arányhoz kapcsolódik, de az SLT-nél jelentősebb az életminőség javulása. Ennek eredményeként a betegek számára, akiknek dönteniük kell a két kezelési lehetőség között, elengedhetetlen a BLT (szemben az SLT) életminőségre gyakorolt hatásának ismerete. Ezért meg akarjuk becsülni a kezelés transtype a fev1p. eredményre gyakorolt hatását. Ez az eredmény a kényszerű kilégzési térfogat egy másodpercben (FEV1) képviseli a páciens egészséges emberhez viszonyított arányát.
Adataink 29 változót tartalmaznak, amelyek rögzítik a betegek és a donorok jellemzőit. Ezeket a változókat és a közöttük lévő kölcsönhatásokat használjuk kontrollként a modellünkben.Ezeket a változókat és a közöttük lévő kölcsönhatásokat használjuk, mint a modellünkben. A vl parancssor, amely leegyszerűsíti ezt a folyamatot. A következő kód létrehozza a vezérlőváltozók listáját és elmenti a globális $allvars makróba.
. quietly vl set . vl create cvars = vlcontinuous - (fev1p) note: $cvars initialized with 12 variables. . vl create fvars = vlcategorical - (transtype) note: $fvars initialized with 17 variables. . vl sub allvars = c.cvars i.fvars c.cvars#i.fvars
Most készen állunk a telasso használatára az átlagos kezelési hatások becsléséhez. Feltételezünk lineáris kimeneti modellt és logit kezelési modellt, az alapértelmezéseket. Beírjuk
. telasso (fev1p $allvars) (transtype $allvars) Estimating lasso for outcome fev1p if tran~e = 0 using plugin method ... Estimating lasso for outcome fev1p if tran~e = 1 using plugin method ... Estimating lasso for treatment tran~e using plugin method ... Estimating ATE ... Treatment-effects lasso estimation Number of observations = 937 Outcome model: linear Number of controls = 454 Treatment model: logit Number of selected controls = 8
Robust | ||
fev1p | Coefficient std. err. z P>|z| [95% conf. interval] | |
ATE | ||
transtype | ||
(BLT | ||
vs | ||
SLT) | 37.51841 .1606703 233.51 0.000 37.20351 37.83332 | |
POmean | ||
transtype | ||
SLT | 46.4938 .2021582 229.99 0.000 46.09757 46.89002 | |
Ha az összes beteg BLT-t választana, a FEV1% várhatóan 38 százalékponttal magasabb, mint a várható 46% -os átlag, ha minden beteg SLT-t választana. A 454 kontrollváltozó közül a telasso csak 8-at választ ki közülük. Gyakran becsülik az átlagos kezelési hatást, hogy meghatározzuk a hatást azokra, akik valóban részesültek a kezelésben. Ennek az értéknek a becsléséhez hozzáadjuk az atet opciót.
. telasso (fev1p $allvars) (transtype $allvars), atet Estimating lasso for outcome fev1p if tran~e = 0 using plugin method ... Estimating lasso for outcome fev1p if tran~e = 1 using plugin method ... Estimating lasso for treatment tran~e using plugin method ... Estimating ATET ... Treatment-effects lasso estimation Number of observations = 937 Outcome model: linear Number of controls = 454 Treatment model: logit Number of selected controls = 8
Robust | ||
fev1p | Coefficient std. err. z P>|z| [95% conf. interval] | |
ATET | ||
transtype | ||
(BLT | ||
vs | ||
SLT) | 35.78157 .1831478 195.37 0.000 35.42261 36.14053 | |
POmean | ||
transtype | ||
SLT | 43.35214 1.268976 34.16 0.000 40.86499 45.83929 | |
Azoknál a betegeknél, akiknek BLT-je van, azt várjuk, hogy az átlagos FEV1% 36 százalékponttal magasabb, mint ha valamennyien SLT-t választanának.
A fentiekben kapott becslések a lasszó kulcsfontosságú feltételezésére, a ritkaság feltételezésére támaszkodtak, amely megköveteli, hogy a potenciális kovariánsok közül csak kis szám legyen az „igaz” modellben. Kettős gépi tanulási technikát használhatunk annak érdekében, hogy az igazi modellben több kovariáns jöjjön létre. Ehhez hozzáadjuk az xfold(5) opciót, hogy a mintát öt csoportra oszthassuk, és elvégezzük a keresztillesztést, és hozzáadjuk a resample(3) opciót, hogy megismételjük a keresztillesztési eljárást három mintával.
Annak garantálása érdekében, hogy a becslési eredményeket később reprodukálni tudjuk, beállítottuk a véletlenszámú magot is. Beírjuk
. set seed 12345671 . telasso (fev1p $allvars) (transtype $allvars), xfolds(5) resample(3) nolog Treatment-effects lasso estimation Number of observations = 937 Number of controls = 454 Number of selected controls = 16 Outcome model: linear Number of folds in cross-fit = 5 Treatment model: logit Number of resamples = 3
Robust | ||
fev1p | Coefficient std. err. z P>|z| [95% conf. interval] | |
ATE | ||
transtype | ||
(BLT | ||
vs | ||
SLT) | 37.52837 .1683194 222.96 0.000 37.19847 37.85827 | |
POmean | ||
transtype | ||
SLT | 46.4941 .2040454 227.86 0.000 46.09418 46.89402 | |
A becsült kezelési hatás nagyon hasonlít az első telasso parancs által jelentetthez, de a kiválasztott modell 8 kontroll helyett 16 kontrollt tartalmazott. A becslések hasonlósága a különböző specifikációk között arra utal, hogy első modellünk nem szenvedett a ritkaság feltételezésének megsértésétől.