New In 
Групповые последовательные конструкции для клинических испытаний
Разрабатываете клиническое исследование? В Stata 18 можно использовать новые команды gsbounds и gsdesign для расчета границ остановки для групповых последовательных испытаний. Какой объем выборки требуется для каждого промежуточного анализа? Используйте команду gsdesign, чтобы узнать это.
Основные моменты
-
Границы остановки
-
Эффективность, бесперспективность или и то и другое
-
Семь методов расчета границ
-
-
Расчеты объема выборки
-
Одно- и двухвыборочные тесты средних значений
-
Одно- и двухвыборочные тесты пропорций
-
Лог-ранговые тесты
-
-
Добавление собственных методов и расчет объемов выборки и границ остановки
-
Границы графика для визуального контроля
-
См. подробнее Групповые последовательные конструкции особенности
Групповые последовательные схемы (ГПС) представляют собой класс адаптивных схем клинических исследований. В GSD размер выборки не фиксируется заранее; вместо этого проводятся заранее спланированные промежуточные анализы, позволяющие досрочно прекратить исследование в случае его эффективности или бесперспективности. Для этого определяются границы остановки, которые контролируют коэффициент семейной ошибки. gsdesign рассчитывает границы остановки и размеры выборки для промежуточных анализов с проверкой средних, пропорций, функций выживания и даже методов, задаваемых пользователем.
Комплект gs
Набор gs содержит две команды: gsbounds и gsdesign.
Команда gsbounds рассчитывает границы эффективности и бесперспективности в зависимости от количества анализов, называемых также просмотрами, желаемой общей ошибки первого типа и желаемой мощности.
Можно выбрать один из семи методов расчета границ:
- Классический О’Брайен-Флеминг
- Классический Покок
- Классический Ванг-Циатис
- Стиль Покока, допускающего ошибки
- Стиль О’Брайена-Флеминга, допускающий ошибки
- Ким-ДеМетс, совершающий ошибки
- Ошибочное расходование средств Хван Ши де Кани
Для расчета, например, границ эффективности и бесполезности по О’Брайену-Флемингу для исследования с 5 наблюдениями, мощностью 0,9 и ошибкой первого типа 0,05, тип
. gsbounds, efficacy(obfleming) futility(obfleming) nlooks(5) power(0.9) alpha(0.05)
Хотите визуализировать эти границы? Добавьте опцию graphbounds к приведенной выше команде.
Команда gsdesign рассчитывает границы эффективности и бесполезности и предоставляет размеры выборки для каждого вида испытаний. gsdesign задается с одной из перечисленных ниже подкоманд, в зависимости от типа испытания, которое будет проводиться.

Давайте посмотрим, как это работает
Предположим, что мы заинтересованы в разработке группового последовательного испытания новой педиатрической вакцины COVID-19 (наш экспериментальный метод), которую мы будем сравнивать с вакциной первого поколения (наш контрольный метод). Мы будем измерять логарифм титров нейтрализующих антител участников и сравнивать средний логарифм титров в экспериментальной группе с таковым в контрольной группе. Мы можем использовать gsdesign twomeans для расчета границ остановки и необходимого объема выборки для такого испытания.
Допустим, мы ожидаем, что средний лог-титр в контрольной группе составит 5,5 при известном стандартном отклонении 2, а в экспериментальной группе — 6,5 при известном стандартном отклонении 3. Мы рассчитаем объем выборки для одностороннего теста на уровне 2,5% с мощностью 90% и распределим в два раза больше участников в экспериментальную группу, чем в контрольную.
Мы рассчитаем объемы выборок для пяти анализов (четырех промежуточных и окончательного), которые планируется провести при 50%, 65%, 80%, 90% и 100% данных. Границы эффективности и необязательной бесполезности рассчитываются с помощью аппроксимации классических границ О’Брайена-Флеминга по методу «ошибка-расход».

Если это исследование будет продолжено до окончательного анализа, то потребуется 305 участников. Однако ожидаемый размер выборки будет меньше — 179, если нулевая гипотеза верна, и 213, если верна альтернативная гипотеза. В эквивалентном фиксированном исследовании, не предусматривающем возможности досрочного прекращения, потребуется 269 участников.
В таблице в нижней части выходных данных представлены границы остановки в виде критических z-значений и p-значений, а также размер выборки, необходимый для каждого анализа. Первый анализ проводится после сбора данных от 51 участника в контрольной группе и 102 участников в экспериментальной группе. Если статистика z больше или равна 2,96, то H0 отвергается и исследование прекращается. Если статистика z меньше 0,38, то H0 может быть принята, и испытание может быть прекращено за бесперспективностью. Однако, поскольку граница бесперспективности не является обязательной, даже если статистика z меньше 0,38, испытание можно продолжать, не выходя за пределы семейной ошибки первого типа. Если статистика z при первой проверке находится в диапазоне от 0,38 до 2,96, то исследование должно продолжать сбор данных до второй проверки.
Процедура тестирования при второй, третьей и четвертой проверках аналогична первой проверке, с той лишь разницей, что границы эффективности и бесполезности постепенно сближаются. На пятом, заключительном этапе, который проводится после сбора данных от 102 участников контрольной группы и 203 участников экспериментальной группы, критическое значение эффективности равно критическому значению бесполезности, и дальнейшая работа невозможна. Если статистика z при окончательном рассмотрении больше или равна 2,08, то H0 отвергается, в противном случае H0 принимается.
График, получаемый при указании опции graphbounds, позволяет наглядно представить границы остановки и необходимые действия при каждом просмотре.

Если статистика z попадает в синюю область отклонения, испытание прекращается по причине эффективности. Если статистика z попадает в красную область принятия, испытание может быть остановлено в связи с бесполезностью. Если статистика z попадает в зеленую область продолжения, испытание продолжается до следующего вида.