New In 
Дикий кластерний бутстрап
Ваші дані мають невелику кількість кластерів або нерівномірну кількість спостережень у кожному кластері? Ви хочете зробити висновки про параметри лінійної моделі? Завдяки новій команді wildbootstrap ви можете використовувати дикий кластерний бутстрап (WCB) в таких ситуаціях.
Основні моменти
-
Дикі кластерні бутстреп р-значення та довірчі інтервали для перевірки гіпотез про параметри лінійних регресійних моделей
Підтримка areg, regress та xtreg, fe
Підтримка розподілів Радемахера, Маммена, Вебба, гамма та нормального для ваг помилок
Підтримка симетричних та рівнохвостих критеріїв p-значення
Overview
WCB, запропонований Кемероном, Гелбахом та Міллером (2008), є альтернативою кластерно-стійкій дисперсійній оцінці, коли у вас є або невелика кількість кластерів, або нерівномірна кількість спостережень у кластерах.
Коли ми підбираємо моделі з кластерними спостереженнями, ми часто використовуємо кластерно-стійку дисперсійну оцінку, яка послаблює припущення про незалежність спостережень у кожному кластері. Ця оцінка добре працює, якщо ми маємо багато кластерів і якщо кластери не надто відрізняються за кількістю спостережень. Однак, якщо це не так, ми можемо отримати кращі оцінки за допомогою WCB.
Нова команда wildbootstrap в Stata оцінює p-значення та довірчі інтервали (ДІ) WCB для перевірки простих та складених лінійних гіпотез про параметри лінійних регресійних моделей. Цю статистику можна отримати при підгонці лінійних регресійних моделей, таких як моделі fit with regress, моделей з великим набором індикаторних змінних, таких як моделі fit with areg, і моделей з фіксованими ефектами, таких як моделі fit with xtreg, fe.
Подивимося, як це працює
Ми хотіли б побачити вплив тривалості перебування на посаді на заробітну плату та врахувати кластери на галузевому рівні. Для цього ми використовуємо набір даних про заробітну плату за 1988 рік, який містить лише 12 кластерів із суттєво різним розміром від 4 до 817, що відхиляється від припущень, необхідних для надійної оцінки дисперсії, стійкої до кластерів. Ми підібрали лінійну регресію та обчислили статистику WCB для перевірки того, що коефіцієнт на володіння дорівнює нулю. Для відтворюваності ми встановлюємо початкову вибірку за допомогою rseed().

Посилання
Камерон, К. А., Я. Б. Гельбах та Д. Л. Міллер. 2008. Покращення на основі бутстрапу для виведення з кластерними помилками. Огляд економіки та статистики 90: 417-427.