New In
Robustní inference pro lineární modely
Stata 18 nabízí přesnější standardní chyby a intervaly spolehlivosti (CI) pro tři běžně používané lineární modely v programu Stata: regress, areg a xtreg, fe.
Nejdůležitější informace
-
Vícecestné standardní chyby založené na shlukové robustnosti
- Standardní chyby HC2:
-
- Nastavení stupňů volnosti
-
-
Cluster-robust
-
Cluster-robust a úprava stupňů volnosti
-
-
Zaváděcí pásmo divokého klastru intervaly spolehlivosti a p-hodnoty
Malý počet klastrů? Nerovnoměrný počet pozorování na shluk? Použijte HC2 s úpravou stupňů volnosti, možnost vce(hc2 …, dfadjust), nebo bootstrap pro divoké shluky, abyste získali platné závěry.
Více nevložených shluků? Použijte vícecestné shlukování, volba vce(cluster group1 group2 … groupk), abyste zohlednili potenciální korelaci pozorování v rámci různých shluků.
Podívejme se, jak to funguje
Máme panel jednotlivců a rádi bychom studovali vliv členství v odborech na logaritmus mezd ln_mzda. Kontrolujeme, zda má jedinec vysokoškolský titul collgrad, délku trvání zaměstnání a časové fixní efekty.
Porovnáváme několik metod výpočtu standardních chyb: robustní, shlukově robustní, shlukově robustní HC2 s úpravou o stupně volnosti a obousměrné shlukování. Druhá a třetí metoda zohledňuje korelaci na úrovni odvětví. Poslední metoda zohledňuje korelaci na úrovni odvětví i povolání. V našem příkladu používáme pouze 12 shluků, což porušuje předpoklad asymptotické aproximace, že počet shluků roste s velikostí vzorku. Omezíme náš vzorek na pozorování, u nichž je k dispozici kód odvětví ind_code. Výsledky odhadu rovněž ukládáme. Zadáme
. webuse nlswork (National Longitudinal Survey of Young Women, 14-24 years old in 1968) . keep if ind_code!=. (341 observations deleted) . quietly regress ln_wage tenure union collgrad i.year, vce(robust) . estimates store robust . quietly regress ln_wage tenure union collgrad i.year, vce(cluster ind_code) . estimates store cluster . quietly regress ln_wage tenure union collgrad i.year, vce(hc2 ind_code, dfadjust) . estimates store HC2 . quietly regress ln_wage tenure union collgrad i.year, vce(cluster idcode ind_code) . estimates store multiway
Místo toho, abychom se dívali na všechny tabulky regresních výstupů, spojíme je do tabulky odhadů pomocí etable.
Požádali jsme etable, aby použil námi uložené odhady a prezentoval pouze CI, cstat(_r_ci, …), pro koeficient union, keep(union). Poté jsme tabulku exportovali do tabulky .html, kterou vidíte na této stránce, export(setable.html, replace).
CI jsou nejužší s robustními standardními chybami. Nejširší jsou se standardními chybami upravenými o stupně volnosti HC2. V druhém případě je 0 uvnitř CI, což naznačuje, že bychom měli být opatrní při interpretaci vlivu členství v odborech na mzdy. To je v rozporu se závěrem, který bychom učinili, kdybychom použili pouze robustní standardní chyby. A konečně se zdá, že je malý rozdíl mezi shlukováním na úrovni odvětví a shlukováním na úrovni odvětví i povolání.
K zohlednění malého počtu shluků a nerovnoměrného počtu pozorování na jeden shluk můžeme také použít divoký shlukový bootstrap. Je implementován v novém příkazu wildbootstrap. Tuto funkci podrobně popisujeme v článku Wild cluster bootstrap, ale pro srovnání ji použijeme i zde.
. wildbootstrap regress ln_wage tenure union collgrad i.year, cluster(ind_code) coefficients(union) rseed(111)
wildbootstrap volá regress. Takže i po jeho dokončení máte přístup k výsledkům regress. Wildbootstrap však navíc zkonstruuje divoké klastrové bootstrap CI pro nulovou hypotézu, že koeficient je 0. Ve výchozím nastavení používá všechny koeficienty, ale můžete si vybrat, které chcete zkoumat. My se zaměříme na unii. Protože provádíme převzorkování na úrovni shluku, zadáme proměnnou ind_code do funkce cluster() a nastavíme semeno pro reprodukovatelnost.
CI udávaný wildbootstrapem je téměř stejně široký jako CI udávaný při použití standardních chyb HC2. Ačkoli 0 není v CI, naznačuje to, že existuje velká variabilita bodového odhadu.