New In

Robusztus következtetés lineáris modellekhez

A Stata 18 pontosabb standard hibákat és konfidenciaintervallumokat (CI) kínál a Stata három gyakran használt lineáris modelljéhez: regress, areg és xtreg, fe.

 

Kiemelt információk

  • Multiway cluster-robust standard hibák

  • HC2 standard hibák:

    • Szabadságfok-beállítás

    • Cluster-robuszt

    • Klaszter-robuszt és szabadságfok-kiigazítás

  • Vad klaszter bootstrap konfidenciaintervallumok és p-értékek

Kis számú klaszter? Klaszterenként páratlan számú megfigyelés? Használja a HC2-t szabadságfok-kiigazítással, a vce(hc2 …, dfadjust) opciót, vagy a vad klaszteres bootstrap-et az érvényes következtetés érdekében.

Több nem egymásba ágyazott klaszter? Használjon többirányú klaszterezést, vce(cluster group1 group2 … groupk) opciót, hogy figyelembe vegye a különböző klasztereken belüli megfigyelések lehetséges korrelációját.

Lássuk, hogyan működik

Egyénekből álló panellel rendelkezünk, és szeretnénk megvizsgálni a szakszervezethez való tartozás hatását a bérek ln_bér naplójára. Ellenőrizzük, hogy az egyénnek van-e főiskolai végzettsége, a munkahelyen töltött idő hosszára és az időbeli fix hatásokra.

A standard hibák kiszámításának több módszerét hasonlítjuk össze: robusztus, klaszter-robuszt, klaszter-robuszt HC2 szabadságfok-kiigazítással és kétirányú klaszterezés. A második és a harmadik módszer figyelembe veszi az iparági szintű korrelációt. Az utolsó módszer mind az ágazati, mind a foglalkozási szintű korrelációt figyelembe veszi. Példánkban csak 12 klasztert használunk, ami sérti az aszimptotikus közelítés azon feltételezését, hogy a klaszterek száma a minta méretével nő. A mintánkat azokra a megfigyelésekre korlátozzuk, ahol az ind_code iparági kód rendelkezésre áll. A becslési eredményeket is tároljuk. Beírjuk

. webuse nlswork
(National Longitudinal Survey of Young Women, 14-24 years old in 1968)

. keep if ind_code!=.
(341 observations deleted)

. quietly regress ln_wage tenure union collgrad i.year, vce(robust)

. estimates store robust

. quietly regress ln_wage tenure union collgrad i.year, vce(cluster ind_code)

. estimates store cluster

. quietly regress ln_wage tenure union collgrad i.year, vce(hc2 ind_code, dfadjust)

. estimates store HC2

. quietly regress ln_wage tenure union collgrad i.year, vce(cluster idcode ind_code)

. estimates store multiway

Ahelyett, hogy az összes regressziós kimeneti táblázatot megnéznénk, az etable segítségével egy becslési táblázatba foglaljuk őket.

Megkértük az etable-t, hogy használja az általunk tárolt becsléseket, és csak a CI-ket, cstat(_r_ci, …), az unióra vonatkozó együtthatóra, keep(union), mutassa be. Ezután exportáljuk a táblázatot az ezen az oldalon látható .html táblázatba, export(setable.html, replace).

A CI-k a legszűkebbek robusztus standard hibákkal. A legszélesebbek a HC2 szabadságfokokkal korrigált standard hibákkal. Az utóbbi esetben a 0 a CI-n belül van, ami arra utal, hogy óvatosnak kell lennünk a szakszervezethez való tartozás bérekre gyakorolt hatásának értelmezésekor. Ez ellentétben áll azzal a következtetéssel, amelyet akkor vontunk volna le, ha csak robusztus standard hibákat használtunk volna. Végezetül úgy tűnik, hogy kevés különbség van az iparági szintű klaszteresedés és az iparági és foglalkozási szintű klaszteresedés között.

A vad klaszteres bootstrap segítségével figyelembe vehetjük a klaszterek kis számát és a klaszterenkénti egyenlőtlen számú megfigyelést is. Ezt az új wildbootstrap parancsban valósítjuk meg. Ezt a funkciót részletesen a Wild cluster bootstrap című részben ismertetjük, de itt is használjuk az összehasonlítás kedvéért.

. wildbootstrap regress ln_wage tenure union collgrad i.year,
	cluster(ind_code) coefficients(union) rseed(111)

A wildbootstrap a regress-t hívja. Így miután elkészült, még mindig hozzáférhet a regress eredményeihez. De ezen felül a wildbootstrap vad klaszteres bootstrap CI-ket készít arra a nullhipotézisre, hogy egy együttható 0. Alapértelmezés szerint az összes együtthatót használja, de kiválaszthatja, melyeket szeretné megvizsgálni. Mi az unióra összpontosítunk. Mivel klaszterszinten végzünk újramintázást, a cluster()-ben megadjuk az ind_code változót, és beállítunk egy magot a reprodukálhatóság érdekében.

A wildbootstrap által jelentett CI majdnem olyan széles, mint a HC2 standard hibák használatakor jelentett. Bár a 0 nem szerepel a CI-ben, ez arra utal, hogy a pontbecslésben nagy a szórás.