New In 
Бутафорна лента за диви клъстери
Данните ви имат ли малък брой клъстери или неравномерен брой наблюдения за всеки клъстер? Искате ли да направите изводи за параметрите на линеен модел? С новата команда wildbootstrap вече можете да използвате wild cluster bootstrap (WCB) в тези ситуации.
Акценти
-
Wild cluster bootstrap p-стойности и доверителни интервали за тестове на хипотези за параметри от линейни регресионни модели
-
Поддръжка за areg, regress и xtreg, fe
-
Поддръжка на разпределенията на Радемахер, Мамен, Уеб, гама и нормално разпределение за теглата на грешките
-
Поддръжка на симетрични и равностойни критерии за p-стойност
Преглед
Предложената от Камерън, Гелбах и Милър (2008 г.) WCB представлява алтернатива на оценката на дисперсията, базирана на клъстери, когато имате малък брой клъстери или неравномерен брой наблюдения в клъстерите.
Когато подхождаме към модели с клъстерирани наблюдения, често използваме клъстерно-оптимистична оценка на дисперсията, която облекчава допускането за независимост на наблюденията в рамките на всеки клъстер. Тази оценка работи добре, ако имаме много клъстери и ако клъстерите не се различават твърде много по отношение на броя на наблюденията си. Ако обаче случаят не е такъв, можем да получим по-добри оценки, като използваме WCB.
Новата команда wildbootstrap на Stata оценява p-стойностите и доверителните интервали (CI) на WCB за тестове на прости и съставни линейни хипотези за параметрите от линейни регресионни модели. Тези статистики могат да се получат при напасване на линейни регресионни модели, като например тези, напаснати с regress, модели с голям набор от индикаторни променливи, като например тези, напаснати с areg, и модели с фиксирани ефекти, като например тези, напаснати с xtreg, fe
.
Нека видим как работи
Бихме искали да видим влиянието на продължителността на трудовия стаж върху заплатите и да отчетем клъстерите на ниво отрасъл. Тук използваме набор от данни за заплатите от 1988 г., съдържащ само 12 клъстера със значително различаващи се размери на клъстерите – от 4 до 817, което се отклонява от предположенията, необходими за надеждността на оценката на дисперсията, базирана на клъстери. Приготвяме линейна регресия и изчисляваме статистиката на WCB за проверка, че коефициентът на заетост е нула. За възпроизводимост задаваме семето, като използваме rseed().

Справка
Камерън, К. А., Дж.Б. Гелбах и Д.Л. Милър. 2008. Подобрения, базирани на Bootstrap, за изводи с клъстерирани грешки. The Review of Economics and Statistics 90: 417-427.