New In 
Zaváděcí pásmo divokého klastru
Mají vaše data malý počet shluků nebo nestejný počet pozorování na jeden shluk? Chcete vyvodit závěry o parametrech lineárního modelu? S novým příkazem wildbootstrap můžete nyní v těchto situacích použít wild cluster bootstrap (WCB).
Nejdůležitější informace
-
P-hodnoty a intervaly spolehlivosti pro testy hypotéz o parametrech lineárních regresních modelů na základě bootstrapu pro divoké shluky
-
Podpora pro areg, regress a xtreg, fe
-
Podpora pro Rademacherovo, Mammenovo, Webbovo, gama a normální rozdělení pro váhy chyb
-
Podpora pro symetrická a rovnoměrná kritéria p-hodnoty
Přehled
WCB navržený Cameronem, Gelbachem a Millerem (2008) poskytuje alternativu ke shlukově robustnímu odhadu rozptylu, pokud máte buď malý počet shluků, nebo nerovnoměrný počet pozorování v jednotlivých shlucích.
Při fitování modelů se shlukovými pozorováními často používáme shlukově robustní odhad rozptylu, který zmírňuje předpoklad nezávislosti pozorování v rámci každého shluku. Tento odhad funguje dobře, pokud máme mnoho shluků a pokud se shluky příliš neliší počtem pozorování. Pokud tomu tak však není, můžeme získat lepší odhady pomocí WCB.
Nový příkaz wildbootstrap programu Stata odhaduje p-hodnoty a intervaly spolehlivosti (CI) WCB pro testy jednoduchých a složených lineárních hypotéz o parametrech lineárních regresních modelů. Tyto statistiky lze získat při fitování lineárních regresních modelů, jako jsou modely fitované příkazem regress, modelů s velkou sadou indikátorových proměnných, jako jsou modely fitované příkazem areg, a modelů s pevnými efekty, jako jsou modely fitované příkazy xtreg, fe.
Podívejme se, jak to funguje
Rádi bychom zjistili vliv délky zaměstnání na mzdy a zohlednili klastry na úrovni odvětví. Zde používáme soubor údajů o mzdách z roku 1988, který obsahuje pouze 12 shluků se značně rozdílnou velikostí shluků, od 4 do 817, což se odchyluje od předpokladů potřebných pro spolehlivý odhad rozptylu pomocí shluků. Vhodíme lineární regresi a vypočítáme statistiku WCB pro test, zda je koeficient držby nulový. Kvůli reprodukovatelnosti nastavujeme semeno pomocí funkce rseed().

Odkaz
Cameron, C. A., J.B. Gelbach a D.L. Miller. 2008. Zlepšení na základě Bootstrapu pro inferenci se shlukovanými chybami. The Review of Economics and Statistics 90: 417-427.