New In
Надежден извод за линейни модели
Stata 18 предлага по-точни стандартни грешки и доверителни интервали (CI) за три често използвани линейни модела в Stata: regress, areg и xtreg, fe.
Акценти
-
Многопосочни стандартни грешки, основани на клъстери
-
Стандартни грешки на HC2:
-
Регулиране на степените на свобода
-
Клъстерно надежден
-
Корекция на степените на свобода и клъстерна устойчивост
-
-
Бутафорна лента за диви клъстери доверителни интервали и p-стойности
Малък брой клъстери? Неравномерен брой наблюдения за всеки клъстер? Използвайте HC2 с корекция на степените на свобода, опция vce(hc2 …, dfadjust), или бутстрап за диви клъстери, за да получите валиден извод.
Многобройни невъвлечени клъстери? Използвайте многопосочно клъстериране, опция vce(cluster group1 group2 … groupk), за да отчетете потенциалната корелация на наблюденията в рамките на различните клъстери.
Нека видим как работи
Разполагаме с панел от лица и бихме искали да изследваме ефекта от принадлежността към профсъюз върху логаритма на заплатите ln_wage. Контролираме дали индивидът има колежанска степен collgrad, продължителността на трудовия стаж и фиксираните ефекти на времето.
Сравняваме няколко метода за изчисляване на стандартните грешки: стабилна, клъстерна, клъстерна HC2 с корекция на степените на свобода и двупосочно клъстериране. Вторият и третият метод отчитат корелацията на ниво отрасъл. Последният метод отчита корелацията както на ниво отрасъл, така и на ниво професия. В нашия пример използваме само 12 клъстера, което нарушава предположението на асимптотичното приближение, че броят на клъстерите расте с размера на извадката. Ограничаваме нашата извадка до наблюдения, при които е наличен код на отрасъла ind_code. Съхраняваме и резултатите от оценките. Въвеждаме
. webuse nlswork (National Longitudinal Survey of Young Women, 14-24 years old in 1968) . keep if ind_code!=. (341 observations deleted) . quietly regress ln_wage tenure union collgrad i.year, vce(robust) . estimates store robust . quietly regress ln_wage tenure union collgrad i.year, vce(cluster ind_code) . estimates store cluster . quietly regress ln_wage tenure union collgrad i.year, vce(hc2 ind_code, dfadjust) . estimates store HC2 . quietly regress ln_wage tenure union collgrad i.year, vce(cluster idcode ind_code) . estimates store multiway
Вместо да разглеждаме всички изходни таблици на регресията, ги обединяваме в таблица с оценки с помощта на etable.
Помолихме etable да използва запаметените оценки и да представи само CI, cstat(_r_ci, …), за коефициента на обединение, keep(union). След това експортираме таблицата в .html таблицата, която виждате на тази страница, export(setable.html, replace).
CI са най-тесните със стабилни стандартни грешки. Те са най-широки при стандартните грешки, коригирани с HC2 степени на свобода. В последния случай 0 е вътре в CI, което предполага, че трябва да сме внимателни, когато интерпретираме ефекта от принадлежността към профсъюз върху заплатите. Това е в контраст със заключението, което щяхме да направим, ако бяхме използвали само стабилни стандартни грешки. И накрая, изглежда, че има малка разлика между клъстерирането на ниво отрасъл и клъстерирането на ниво отрасъл и професия.
Можем също така да използваме бутстрап за диви клъстери, за да отчетем малкия брой клъстери и неравномерния брой наблюдения за всеки клъстер. Това е реализирано в новата команда wildbootstrap. Описваме тази функция подробно в Wild cluster bootstrap, но нека я използваме и тук за сравнение.
. wildbootstrap regress ln_wage tenure union collgrad i.year, cluster(ind_code) coefficients(union) rseed(111)
wildbootstrap призовава regress. Така че и след приключването му ще имате достъп до резултатите от regress. Но освен това wildbootstrap конструира див клъстер bootstrap CI за нулевата хипотеза, че даден коефициент е 0. По подразбиране той използва всички коефициенти, но вие можете да изберете кои от тях искате да изследвате. Ние се фокусираме върху съюза. Тъй като правим повторна извадка на ниво клъстер, посочваме променливата ind_code в cluster() и задаваме семе за възпроизводимост.
Информационният интервал, отчетен от wildbootstrap, е почти толкова широк, колкото този, отчетен при използването на стандартните грешки на HC2. Въпреки че 0 не е в КИ, това предполага, че има голяма вариативност в точковата оценка.