New In 
Дикий кластерный бутстрап
Ваши данные имеют небольшое количество кластеров или неравномерное количество наблюдений в каждом кластере? Вы хотите сделать выводы о параметрах линейной модели? С помощью новой команды wildbootstrap теперь можно использовать бутстрап с диким кластером (WCB) в подобных ситуациях.
Основные моменты
-
Бутстреп p-значений и доверительных интервалов для проверки гипотез о параметрах линейных регрессионных моделей
Поддержка areg, regress и xtreg, fe
Поддержка распределений Радемахера, Маммена, Вебба, гамма и нормального распределения для весов ошибок
Поддержка симметричных и равнохвостых критериев p-значений
Обзор
WCB, предложенный Камероном, Гелбахом и Миллером (2008), представляет собой альтернативу кластерной оценке дисперсии, когда имеется либо небольшое количество кластеров, либо неравномерное количество наблюдений по кластерам.
При подгонке моделей с кластеризованными наблюдениями часто используется оценка дисперсии cluster-robust, в которой ослабляется предположение о независимости наблюдений внутри каждого кластера. Эта оценка хорошо работает, если у нас много кластеров и если кластеры не слишком сильно различаются по количеству наблюдений. Однако если это не так, мы можем получить лучшие оценки, используя WCB.
Новая команда wildbootstrap в Stata оценивает p-значения и доверительные интервалы (ДИ) WCB для проверки простых и составных линейных гипотез о параметрах линейных регрессионных моделей. Эта статистика может быть получена при подгонке моделей линейной регрессии, например, с помощью команды regress, моделей с большим набором переменных-индикаторов, например, с помощью команды areg, и моделей с фиксированными эффектами, например, с помощью команд xtreg, fe.
Давайте посмотрим, как это работает
Мы хотели бы увидеть влияние стажа на заработную плату и учесть кластеры на отраслевом уровне. Здесь мы используем данные по заработной плате за 1988 год, содержащие только 12 кластеров с существенно различающимися размерами кластеров — от 4 до 817, что является отклонением от допущений, необходимых для надежности кластерной оценки дисперсии. Мы настраиваем линейную регрессию и рассчитываем статистику WCB для проверки того, что коэффициент на стаж равен нулю. Для воспроизводимости мы задаем семена с помощью функции rseed().

Ссылка
Cameron, C. A., J.B. Gelbach, and D.L. Miller. 2008. Улучшения на основе бутстрепа для выводов с кластеризованными ошибками. Обзор экономики и статистики 90: 417-427.