New In

Групповые последовательные конструкции для клинических испытаний

Разрабатываете клиническое исследование? В Stata 18 можно использовать новые команды gsbounds и gsdesign для расчета границ остановки для групповых последовательных испытаний. Какой объем выборки требуется для каждого промежуточного анализа? Используйте команду gsdesign, чтобы узнать это.

 

Основные моменты

  • Границы остановки

    • Эффективность, бесперспективность или и то и другое

    • Семь методов расчета границ

  • Расчеты объема выборки

    • Одно- и двухвыборочные тесты средних значений

    • Одно- и двухвыборочные тесты пропорций

    • Лог-ранговые тесты

  • Добавление собственных методов и расчет объемов выборки и границ остановки

  • Границы графика для визуального контроля

  • См. подробнее Групповые последовательные конструкции особенности

Групповые последовательные схемы (ГПС) представляют собой класс адаптивных схем клинических исследований. В GSD размер выборки не фиксируется заранее; вместо этого проводятся заранее спланированные промежуточные анализы, позволяющие досрочно прекратить исследование в случае его эффективности или бесперспективности. Для этого определяются границы остановки, которые контролируют коэффициент семейной ошибки. gsdesign рассчитывает границы остановки и размеры выборки для промежуточных анализов с проверкой средних, пропорций, функций выживания и даже методов, задаваемых пользователем.

Комплект gs

Набор gs содержит две команды: gsbounds и gsdesign.

Команда gsbounds рассчитывает границы эффективности и бесперспективности в зависимости от количества анализов, называемых также просмотрами, желаемой общей ошибки первого типа и желаемой мощности.

Можно выбрать один из семи методов расчета границ:

  • Классический О’Брайен-Флеминг
  • Классический Покок
  • Классический Ванг-Циатис
  • Стиль Покока, допускающего ошибки
  • Стиль О’Брайена-Флеминга, допускающий ошибки
  • Ким-ДеМетс, совершающий ошибки
  • Ошибочное расходование средств Хван Ши де Кани

 

Для расчета, например, границ эффективности и бесполезности по О’Брайену-Флемингу для исследования с 5 наблюдениями, мощностью 0,9 и ошибкой первого типа 0,05, тип

. gsbounds, efficacy(obfleming) futility(obfleming) nlooks(5)
  power(0.9) alpha(0.05)

Хотите визуализировать эти границы? Добавьте опцию graphbounds к приведенной выше команде.

Команда gsdesign рассчитывает границы эффективности и бесполезности и предоставляет размеры выборки для каждого вида испытаний. gsdesign задается с одной из перечисленных ниже подкоманд, в зависимости от типа испытания, которое будет проводиться.

Давайте посмотрим, как это работает

Предположим, что мы заинтересованы в разработке группового последовательного испытания новой педиатрической вакцины COVID-19 (наш экспериментальный метод), которую мы будем сравнивать с вакциной первого поколения (наш контрольный метод). Мы будем измерять логарифм титров нейтрализующих антител участников и сравнивать средний логарифм титров в экспериментальной группе с таковым в контрольной группе. Мы можем использовать gsdesign twomeans для расчета границ остановки и необходимого объема выборки для такого испытания.

Допустим, мы ожидаем, что средний лог-титр в контрольной группе составит 5,5 при известном стандартном отклонении 2, а в экспериментальной группе — 6,5 при известном стандартном отклонении 3. Мы рассчитаем объем выборки для одностороннего теста на уровне 2,5% с мощностью 90% и распределим в два раза больше участников в экспериментальную группу, чем в контрольную.

Мы рассчитаем объемы выборок для пяти анализов (четырех промежуточных и окончательного), которые планируется провести при 50%, 65%, 80%, 90% и 100% данных. Границы эффективности и необязательной бесполезности рассчитываются с помощью аппроксимации классических границ О’Брайена-Флеминга по методу «ошибка-расход».

Если это исследование будет продолжено до окончательного анализа, то потребуется 305 участников. Однако ожидаемый размер выборки будет меньше — 179, если нулевая гипотеза верна, и 213, если верна альтернативная гипотеза. В эквивалентном фиксированном исследовании, не предусматривающем возможности досрочного прекращения, потребуется 269 участников.

В таблице в нижней части выходных данных представлены границы остановки в виде критических z-значений и p-значений, а также размер выборки, необходимый для каждого анализа. Первый анализ проводится после сбора данных от 51 участника в контрольной группе и 102 участников в экспериментальной группе. Если статистика z больше или равна 2,96, то H0 отвергается и исследование прекращается. Если статистика z меньше 0,38, то H0 может быть принята, и испытание может быть прекращено за бесперспективностью. Однако, поскольку граница бесперспективности не является обязательной, даже если статистика z меньше 0,38, испытание можно продолжать, не выходя за пределы семейной ошибки первого типа. Если статистика z при первой проверке находится в диапазоне от 0,38 до 2,96, то исследование должно продолжать сбор данных до второй проверки.

Процедура тестирования при второй, третьей и четвертой проверках аналогична первой проверке, с той лишь разницей, что границы эффективности и бесполезности постепенно сближаются. На пятом, заключительном этапе, который проводится после сбора данных от 102 участников контрольной группы и 203 участников экспериментальной группы, критическое значение эффективности равно критическому значению бесполезности, и дальнейшая работа невозможна. Если статистика z при окончательном рассмотрении больше или равна 2,08, то H0 отвергается, в противном случае H0 принимается.

График, получаемый при указании опции graphbounds, позволяет наглядно представить границы остановки и необходимые действия при каждом просмотре.

Если статистика z попадает в синюю область отклонения, испытание прекращается по причине эффективности. Если статистика z попадает в красную область принятия, испытание может быть остановлено в связи с бесполезностью. Если статистика z попадает в зеленую область продолжения, испытание продолжается до следующего вида.