New In

Sequenzielle Gruppendesigns für klinische Studien

Planen Sie eine klinische Studie? In Stata 18 können Sie die neuen Befehle gsbounds und gsdesign verwenden, um Abbruchgrenzen für gruppensequenzielle Studien zu berechnen. Welcher Stichprobenumfang ist für jede Zwischenanalyse erforderlich? Verwenden Sie gsdesign, um das herauszufinden.

 

Höhepunkte

  • Grenzen aufhalten

    • Wirksamkeit, Nutzlosigkeit oder beides

    • Sieben Techniken der Grenzwertberechnung

  • Berechnungen des Stichprobenumfangs

    • Mittelwerttests mit einer und zwei Stichproben

    • Proportionstests mit einer und zwei Stichproben

    • Log-Rank-Tests

  • Fügen Sie Ihre eigenen Methoden hinzu und berechnen Sie Stichprobengrößen und Unterbrechungsgrenzen

  • Graphische Begrenzungen für die visuelle Kontrolle

  • Mehr sehen Sequentielle Gruppenmuster Merkmale

Gruppensequenzielle Designs (GSD) sind eine Klasse von adaptiven Designs für klinische Studien. Bei einem GSD wird der Stichprobenumfang nicht im Voraus festgelegt; stattdessen werden im Voraus geplante Zwischenanalysen durchgeführt, um ein frühzeitiges Abbrechen bei Wirksamkeit oder Vergeblichkeit zu ermöglichen. Dies geschieht durch die Definition von Abbruchgrenzen, die die familienweise Fehlerrate kontrollieren. gsdesign berechnet Abbruchgrenzen und Stichprobengrößen für Zwischenanalysen mit Tests von Mittelwerten, Proportionen, Überlebensfunktionen und sogar benutzerdefinierten Methoden.

Die gs-Suite

Die gs-Suite bietet zwei Befehle: gsbounds und gsdesign.

Der Befehl gsbounds berechnet Wirksamkeits- und Vergeblichkeitsgrenzen auf der Grundlage der Anzahl der Analysen, auch Looks genannt, des gewünschten Gesamt-Typ-I-Fehlers und der gewünschten Power.

Sie können aus sieben Methoden zur Grenzwertberechnung wählen:

  • Klassisch O’Brien-Fleming
  • Klassischer Pocock
  • Klassischer Wang-Tsiatis
  • Fehlerverzehr im Pocock-Stil
  • Fehlerverzehr im Stil von O’Brien-Fleming
  • Fehlerausgebende Kim-DeMets
  • Fehlerausgebende Hwang-Shih-de Cani

 

Um beispielsweise die Grenzen der Wirksamkeit und Vergeblichkeit nach O’Brien-Fleming für eine Studie mit 5 Blicken, einer Aussagekraft von 0,9 und einem Fehler vom Typ I von 0,05 zu berechnen, muss der Typ

. gsbounds, efficacy(obfleming) futility(obfleming) nlooks(5)
  power(0.9) alpha(0.05)

Möchten Sie diese Grenzen visualisieren? Fügen Sie dem obigen Befehl die Option graphbounds hinzu.

Der Befehl gsdesign berechnet die Grenzen der Wirksamkeit und Vergeblichkeit und liefert die Stichprobengrößen bei jeder Betrachtung für eine Vielzahl von Tests. gsdesign wird mit einem der unten aufgeführten Unterbefehle angegeben, je nach Art des Tests, der für die Studie durchgeführt werden soll.

Wir wollen sehen, wie es funktioniert

Angenommen, wir möchten eine sequenzielle Gruppenstudie für einen neuen pädiatrischen COVID-19-Impfstoff (unsere Versuchsbehandlung) konzipieren, den wir mit dem Impfstoff der ersten Generation (unsere Kontrollbehandlung) vergleichen. Wir werden den logarithmischen Wert der neutralisierenden Antikörpertiter der Teilnehmer messen und den mittleren logarithmischen Titer in der Versuchsgruppe mit dem der Kontrollgruppe vergleichen. Mit gsdesign twomeans können wir die Abbruchgrenzen und den erforderlichen Stichprobenumfang für eine solche Studie berechnen.

Angenommen, wir erwarten einen mittleren Log-Titer von 5,5 mit einer bekannten Standardabweichung von 2 in der Kontrollgruppe und einen mittleren Log-Titer von 6,5 mit einer bekannten Standardabweichung von 3 in der Versuchsgruppe. Wir berechnen die Stichprobengrößen für einen einseitigen Test auf dem 2,5 %-Niveau mit einer Aussagekraft von 90 % und teilen der Versuchsgruppe doppelt so viele Teilnehmer zu wie der Kontrollgruppe.

Wir berechnen die Stichprobengrößen für fünf Looks (vier Zwischenanalysen und eine Abschlussanalyse), die mit 50 %, 65 %, 80 %, 90 % und 100 % der Daten durchgeführt werden sollen. Wir berechnen die Grenzen der Wirksamkeit und der nicht bindenden Vergeblichkeit unter Verwendung der Error-Spending-Approximation der klassischen O’Brien-Fleming-Grenzen.

Wenn diese Studie bis zur endgültigen Analyse fortgesetzt wird, sind 305 Teilnehmer erforderlich. Der erwartete Stichprobenumfang ist jedoch geringer – 179, wenn die Nullhypothese zutrifft, und 213, wenn die Alternativhypothese zutrifft. Ein äquivalentes festes Studiendesign, das nicht die Möglichkeit eines vorzeitigen Abbruchs vorsieht, würde 269 Teilnehmer erfordern.

In der Tabelle unten in der Ausgabe werden die Abbruchgrenzen als kritische z-Werte und p-Werte sowie der für jede Analyse erforderliche Stichprobenumfang angegeben. Der erste Blick erfolgt, sobald Daten von 51 Teilnehmern im Kontrollarm und 102 Teilnehmern im Versuchsarm gesammelt wurden. Wenn die z-Statistik größer oder gleich 2,96 ist, wird H0 verworfen und der Versuch abgebrochen. Wenn die z-Statistik kleiner als 0,38 ist, kann H0 akzeptiert und die Studie wegen Vergeblichkeit abgebrochen werden. Da die Vergeblichkeitsgrenze jedoch nicht bindend ist, kann der Versuch auch dann fortgesetzt werden, wenn die z-Statistik kleiner als 0,38 ist, ohne dass der familienbezogene Fehler vom Typ I überschritten wird. Liegt die z-Statistik beim ersten Look zwischen 0,38 und 2,96, muss der Versuch bis zum zweiten Look fortgesetzt werden.

Das Testverfahren beim zweiten, dritten und vierten Look entspricht dem des ersten Looks; der Unterschied besteht darin, dass sich die Grenzen der Wirksamkeit und der Vergeblichkeit immer mehr annähern. Beim fünften und letzten Look, der stattfindet, wenn die Daten von 102 Teilnehmern im Kontrollarm und 203 Teilnehmern im Versuchsarm gesammelt wurden, ist der kritische Wert für die Wirksamkeit gleich dem kritischen Wert für die Vergeblichkeit, und es gibt keine Möglichkeit, weiterzumachen. Wenn die z-Statistik bei der letzten Betrachtung größer oder gleich 2,08 ist, wird H0 verworfen; andernfalls wird H0 angenommen.

Das Diagramm, das bei Angabe der Option graphbounds erstellt wird, erleichtert die Visualisierung der Abbruchgrenzen und der erforderlichen Maßnahmen, die bei jedem Look zu ergreifen sind.

Wenn eine z-Statistik in den blauen Ablehnungsbereich fällt, wird die Prüfung wegen Wirksamkeit abgebrochen. Wenn die z-Statistik in den roten Annahmebereich fällt, kann die Prüfung wegen Vergeblichkeit abgebrochen werden. Fällt die z-Statistik in den grünen Fortsetzungsbereich, wird die Prüfung mit dem nächsten Look fortgesetzt.