New In
Надійний висновок для лінійних моделей
Stata 18 пропонує більш точні стандартні похибки та довірчі інтервали (ДІ) для трьох найпоширеніших лінійних моделей у Stata: regression, areg та xtreg, fe.
Основні моменти
-
Багатосторонні кластерно-стійкі стандартні похибки
-
Стандартні похибки HC2:
-
Налаштування ступенів свободи
-
Стійкість до кластерів
-
Кластерна стійкість і регулювання ступенів свободи
-
-
Дикий кластерний бутстрап довірчі інтервали та p-значення
Мала кількість кластерів? Нерівномірна кількість спостережень у кластері? Використовуйте HC2 з коригуванням ступенів свободи, опцію vce(hc2 …, dfadjust) або бутстреп дикого кластера, щоб отримати достовірні висновки.
Кілька не вкладених кластерів? Використовуйте багатосторонню кластеризацію, опція vce(cluster group1 group2 … groupk), щоб врахувати потенційну кореляцію спостережень у різних кластерах.
Подивимося, як це працює
У нас є група осіб, і ми хочемо дослідити вплив членства в профспілці на логарифм заробітної плати ln_wage. Ми контролюємо, чи має людина вищу освіту, стаж роботи та фіксовані в часі ефекти.
Ми порівнюємо кілька методів обчислення стандартних похибок: робастний, кластерно-робастний, кластерно-робастний HC2 з поправкою на ступінь свободи та двостороння кластеризація. Другий та третій методи враховують кореляцію на рівні галузі. Останній метод враховує кореляцію як на рівні галузі, так і на рівні професії. У нашому прикладі ми використовуємо лише 12 кластерів, що порушує припущення асимптотичної апроксимації про те, що кількість кластерів зростає зі збільшенням розміру вибірки. Ми обмежуємо вибірку спостереженнями, в яких доступний код галузі ind_code. Ми також зберігаємо результати оцінки. Ми вводимо
. webuse nlswork (National Longitudinal Survey of Young Women, 14-24 years old in 1968) . keep if ind_code!=. (341 observations deleted) . quietly regress ln_wage tenure union collgrad i.year, vce(robust) . estimates store robust . quietly regress ln_wage tenure union collgrad i.year, vce(cluster ind_code) . estimates store cluster . quietly regress ln_wage tenure union collgrad i.year, vce(hc2 ind_code, dfadjust) . estimates store HC2 . quietly regress ln_wage tenure union collgrad i.year, vce(cluster idcode ind_code) . estimates store multiway
Замість того, щоб переглядати всі таблиці результатів регресії, ми об’єднуємо їх у таблицю оцінок за допомогою etable.
Ми попросили etable використовувати оцінки, які ми зберегли, і представити лише ДІ, cstat(_r_ci, …), для коефіцієнта при об’єднанні, keep(union). Потім ми експортуємо таблицю в .html-таблицю, яку ви бачите на цій сторінці, export(setable.html, replace).
ДІ є найвужчими з надійними стандартними похибками. Вони є найширшими зі стандартними похибками, скоригованими на ступінь свободи HC2. В останньому випадку 0 знаходиться всередині ДІ, що свідчить про те, що ми повинні бути обережними при інтерпретації впливу членства в профспілці на заробітну плату. Це суперечить висновку, якого ми б дійшли, якби використовували лише надійні стандартні похибки. Нарешті, схоже, немає великої різниці між кластеризацією на рівні галузі та кластеризацією як на рівні галузі, так і на рівні професії.
Ми також можемо використовувати дикий кластерний бутстрап, щоб врахувати невелику кількість кластерів і нерівну кількість спостережень у кожному кластері. Це реалізовано в новій команді wildbootstrap. Ми детально описуємо цю функцію в розділі Дикий кластерний бутстрап, але також використаємо її тут для порівняння.
. wildbootstrap regress ln_wage tenure union collgrad i.year, cluster(ind_code) coefficients(union) rseed(111)
wildbootstrap викликає регрес. Отже, після його завершення ви все ще можете отримати доступ до результатів регресії. Але, крім того, wildbootstrap будує дикі кластерні бутстрап-коефіцієнти для нульової гіпотези про те, що коефіцієнт дорівнює 0. За замовчуванням він використовує всі коефіцієнти, але ви можете вибрати, які саме ви хочете дослідити. Ми зосередимося на об’єднанні. Оскільки ми робимо повторну вибірку на рівні кластерів, ми вказуємо змінну ind_code в cluster() і встановлюємо початкову вибірку для відтворюваності.
ДІ, отриманий за допомогою wildbootstrap, майже такий самий широкий, як і при використанні стандартних похибок HC2. Хоча 0 не входить до ДІ, це свідчить про широку варіабельність точкової оцінки.