New In 
Групові послідовні дизайни для клінічних досліджень
Плануєте клінічне дослідження? У Stata 18 ви можете використовувати нові команди gsbounds і gsdesign для розрахунку меж зупинки для групових послідовних досліджень. Який розмір вибірки необхідний для кожного проміжного аналізу? Скористайтеся gsdesign, щоб дізнатися це.
Основні моменти
-
Межі зупинки
-
Ефективність, марність або і те, і інше
-
Сім методів розрахунку границь
-
-
Розрахунок обсягу вибірки
-
Одновибіркові та двовибіркові середні тести
-
Тести пропорцій для однієї та двох вибірок
-
Логарифмічні тести
-
-
Додавайте власні методи та обчислюйте розміри вибірки і межі зупинки
-
Межі графіка для візуального огляду
-
Побачити більше Згрупуйте послідовні конструкції особливості
Груповий послідовний дизайн (ГПД) – це клас адаптивних дизайнів клінічних випробувань. У РКД розмір вибірки не фіксується заздалегідь; натомість проводяться заздалегідь заплановані проміжні аналізи, які дають змогу достроково зупинити дослідження через його ефективність або безперспективність. Це робиться шляхом визначення меж зупинки, які контролюють сімейний рівень помилок. gsdesign розраховує межі зупинки і розміри вибірки для проміжних аналізів за допомогою тестів середніх значень, пропорцій, функцій виживання і навіть визначених користувачем методів.
Люкс “gs
Пакет gs містить дві команди: gsbounds і gsdesign.
Команда gsbounds обчислює межі ефективності та марності на основі кількості аналізів, які також називаються виглядами, бажаної загальної помилки типу I та бажаної потужності.
Ви можете вибрати один із семи методів обчислення меж:
- Класичний О’Брайен-Флемінг
- Класичний Покок
- Класичний Ван-Ціатіс
- Помилкові витрати в стилі Покока
- Витрати з помилками в стилі О’Брайена-Флемінга
- Кім-ДеМетс, що витрачає помилки
- Помилкові витрати Hwang-Shih-de Cani
Щоб розрахувати, наприклад, межі ефективності та марності за О’Брайеном-Флемінгом для дослідження з 5 видами, потужністю 0,9 та помилкою I типу 0,05, введіть
. gsbounds, efficacy(obfleming) futility(obfleming) nlooks(5) power(0.9) alpha(0.05)
Хочете візуалізувати ці межі? Додайте опцію graphbounds до наведеної вище команди.
Команда gsdesign обчислює межі ефективності та марності і надає розміри вибірки для різних тестів. gsdesign задається за допомогою однієї з підкоманд, перелічених нижче, залежно від типу тесту, який потрібно виконати для дослідження.

Подивимося, як це працює
Уявімо, що ми зацікавлені в розробці групового послідовного дослідження нової дитячої вакцини проти COVID-19 (наш експериментальний метод лікування), яку ми порівняємо з вакциною першого покоління (наш контрольний метод лікування). Ми виміряємо лог титрів нейтралізуючих антитіл учасників і порівняємо середній лог-титр в експериментальній групі з титром в контрольній групі. Ми можемо використати gsdesign twomeans для розрахунку меж зупинки та необхідного розміру вибірки для такого дослідження.
Припустимо, що ми очікуємо середній лог-титр 5,5 з відомим стандартним відхиленням 2 в контрольній групі і середній лог-титр 6,5 з відомим стандартним відхиленням 3 в експериментальній групі. Ми розрахуємо розміри вибірки для одностороннього тесту на рівні 2,5% з потужністю 90% і розподілимо вдвічі більше учасників в експериментальній групі, ніж у контрольній групі.
Ми розрахуємо обсяги вибірки для п’яти аналізів (чотири проміжні аналізи та фінальний аналіз), які заплановано провести з 50%, 65%, 80%, 90% та 100% даних. Ми розраховуємо межі ефективності та необов’язкової марності, використовуючи апроксимацію класичних меж О’Брайена-Флемінга з витратами на помилку.

Якщо дослідження продовжиться до фінального аналізу, знадобиться 305 учасників. Однак очікуваний розмір вибірки буде меншим – 179, якщо нульова гіпотеза є вірною, і 213, якщо альтернативна гіпотеза є вірною. Еквівалентний фіксований дизайн дослідження, який не передбачає можливості дострокового припинення, потребував би 269 учасників.
У таблиці внизу результату представлені межі зупинки як критичні z-значення та p-значення, а також розмір вибірки, необхідний для кожного аналізу. Перший погляд відбувається після того, як зібрано дані від 51 учасника контрольної групи та 102 учасників експериментальної групи. Якщо z-статистика більша або дорівнює 2,96, то H0 відхиляється і дослідження зупиняється. Якщо z-статистика менша за 0,38, то H0 може бути прийнята, і випробування може бути припинене через безперспективність. Однак, оскільки межа марності не є обов’язковою, навіть якщо статистика z менша за 0,38, випробування дозволяється продовжувати без перевищення сімейної помилки I типу. Якщо z-статистика при першому аналізі становить від 0,38 до 2,96, випробування повинно продовжувати збір даних до другого аналізу.
Процедура тестування на другому, третьому і четвертому етапах подібна до процедури першого етапу; різниця полягає в тому, що межі ефективності та марності поступово зближуються. На п’ятому, останньому етапі, який відбувається після збору даних від 102 учасників контрольної групи та 203 учасників експериментальної групи, критичне значення ефективності дорівнює критичному значенню безрезультатності, і немає можливості продовжувати дослідження. Якщо z-статистика в остаточному вигляді більша або дорівнює 2,08, то H0 відхиляється; в іншому випадку H0 приймається.
Графік, який створюється за допомогою опції graphbounds, дозволяє легко візуалізувати межі зупинки та необхідні дії, які потрібно виконати на кожному прогляді.

Якщо z-статистика потрапляє в синю область відхилення, випробування зупиняється через неефективність. Якщо статистика z потрапляє в червону область прийнятності, випробування може бути зупинене через марність. Якщо z-статистика потрапляє в зелену область продовження, випробування продовжується до наступного дослідження.