Neu in

Differenz-in-Differenzen (DID)- und DDD-Modelle

Die neuen Stata-Befehle didregress und xtdidregress passen DID- und DDD-Modelle an, die für unbeobachtete Gruppen- und Zeiteffekte kontrollieren. didregress kann mit wiederholten Querschnittsdaten verwendet werden, bei denen wir verschiedene Einheiten von Beobachtungen zu verschiedenen Zeitpunkten stichprobenartig erfassen. xtdidregress ist für die Verwendung mit Paneldaten (Längsschnittdaten) vorgesehen. Diese Befehle bieten einen einheitlichen Rahmen, um Inferenzen zu erhalten, die für eine Vielzahl von Studiendesigns geeignet sind.
Differenz in Differenzen (DID) bietet eine nicht-experimentelle Technik zur Schätzung des durchschnittlichen Behandlungseffekts auf die Behandelten (ATET), indem die Differenz über die Zeit in den Unterschieden zwischen den Ergebnismitteln in der Kontroll- und Behandlungsgruppe verglichen wird. Daher auch der Name Differenz in Differenzen. Diese Technik kontrolliert für unbeobachtbare Zeit- und Gruppencharakteristika, die den Effekt der Behandlung auf das Ergebnis verwirren.
Differenz in Differenz in Differenzen (DDD) fügt dem DID-Rahmen eine Kontrollgruppe hinzu, um unbeobachtbare gruppen- und zeitcharakteristische Interaktionen zu berücksichtigen, die möglicherweise nicht von DID erfasst werden. Sie erweitert die DID um eine weitere Differenz für die neue Kontrollgruppe. Daher auch der Name Differenz in Differenz in Differenzen.
Beispiele für Behandlungseffekte sind die Untersuchung der Auswirkungen eines Medikamentenschemas auf den Blutdruck, eines chirurgischen Eingriffs auf die Mobilität, eines Schulungsprogramms auf die Beschäftigung oder einer Werbekampagne auf den Umsatz.

Höhepunkte

  • DID- und DDD-ATET-Schätzer für wiederholte Querschnitte und Paneldaten
  • Wild-Bootstrap p-Werte und Konfidenzintervalle
  • Bias-korrigierte Standardfehler unter Verwendung der Bell- und McCaffrey-Freiheitsgradanpassung
  • ATET-Schätzungen und Standardfehler unter Verwendung der Methode von Donald und Lang
  • Grafische Diagnose von Mittelwert-Ergebnissen und Paralleltrends
  • Granger-Typ- und Paralleltrend-Tests

Zeigen Sie, wie es funktioniert

Ein Gesundheitsdienstleister möchte die Auswirkung eines neuen Krankenhausaufnahmeverfahrens auf die Patientenzufriedenheit untersuchen, indem er monatliche Daten über Patienten vor und nach der Implementierung des neuen Verfahrens in einigen seiner Krankenhäuser verwendet. Der Gesundheitsdienstleister wird eine DID-Regression verwenden, um den Effekt des neuen Aufnahmeverfahrens auf die Krankenhäuser zu analysieren, die an dem Programm teilgenommen haben. Das Ergebnis von Interesse ist die Patientenzufriedenheit, satis, und die Behandlungsvariable ist das Verfahren. Wir können dieses Modell mit didregress anpassen.

. didregress (satis) (procedure), group(hospital) time(month)

Der erste Satz von Klammern wird verwendet, um das Ergebnis von Interesse zu spezifizieren, gefolgt von den Kovariaten im Modell. In diesem Fall gibt es keine Kovariablen. Der zweite Satz von Klammern wird verwendet, um die binäre Variable zu spezifizieren, die die behandelten Beobachtungen anzeigt, Prozedur. Die Optionen group() und time() werden verwendet, um feste Gruppen- und Zeiteffekte zu konstruieren, die in das Modell einbezogen werden. Die in group() angegebene Variable definiert die Ebene der Clusterung für die standardmäßigen clusterrobusten Standardfehler. Für dieses Beispiel wird auf der Ebene des Krankenhauses geclustert. Die Ergebnisse dieses Befehls sind

Number of groups and treatment time

Time variable: month
Control:       procedure = 0
Treatment:     procedure = 1
Control Treatment
Group
hospital 28 18
Time
Minimum 1 4
Maximum 1 4
Difference in differences regression Number of obs = 7,368 Data type: Repeated cross-sectional (Std. err. adjusted for 46 clusters in hospital)
Robust
stais Coefficient std. err. t P>|t| [95% conf. interval]
ATET
procedure
(New
vs
Old) .8479879 .0321121 26.41 0.000 .7833108 .912665
Note: ATET estimate adjusted for group effects and time effects.

Die erste Tabelle gibt Auskunft über die Kontroll- und Behandlungsgruppen und über den Behandlungszeitpunkt. Der erste Abschnitt sagt uns, dass 28 Krankenhäuser weiterhin das alte Verfahren verwendeten und 18 Krankenhäuser auf das neue Verfahren umstellten. Der zweite Abschnitt sagt uns, dass alle Krankenhäuser, die das neue Verfahren einführten, dies im 4. Zeitraum taten. Wenn einige Krankenhäuser das Verfahren später eingeführt hätten, würden sich die minimale und maximale Zeit der ersten Behandlung unterscheiden.
Die zweite Tabelle gibt die geschätzte ATET an, 0,85 (95% CI [0,78,0,91]). Die behandelnden Krankenhäuser hatten einen Anstieg der Patientenzufriedenheit um 0,85 Punkte im Vergleich dazu, wenn sie das neue Verfahren nicht eingeführt hätten.
Eine der Annahmen dieses Modells ist, dass die Trajektorien der Zufriedenheit für die Kontroll- und Behandlungsgruppen vor der Implementierung des neuen Verfahrens parallel sind. Eine visuelle Überprüfung dieser Trajektorien kann man erhalten, indem man die Mittelwerte des Ergebnisses über die Zeit für beide Gruppen aufträgt oder indem man die Ergebnisse des Modells mit linearen Trends visualisiert. Wir können beide diagnostischen Überprüfungen mit estat-Trendplots durchführen.

Vor der Implementierung der Richtlinie folgten die Kontroll- und Behandlungskrankenhäuser einem parallelen Pfad. Wir können diese Annahme weiter evaluieren, indem wir einen Parallel-Trends-Test mit estat ptrends durchführen.

. estat ptrends

Parallel-trends test (pretreatment time period)
H0: Linear trends are parallel

F(1, 45) =   0.55
Prob > F = 0.4615

Wir haben keine ausreichenden Beweise, um die Nullhypothese der parallelen Trends zu verwerfen. Dieser Test und die grafische Analyse unterstützen die Annahme paralleler Trends.
Ein weiterer Test, der durchgeführt werden sollte, ist, ob die Kontroll- oder Behandlungsgruppen ihr Verhalten in Erwartung der Behandlung ändern. Dies wird mit dem Granger-Kausalitätstest unter Verwendung von estat granger ausgewertet.

. estat granger

Granger causality test
H0: No effect in anticipation of treatment

F(2, 45) =   0.33
Prob > F = 0.7239

Wir haben keine ausreichende Evidenz, um die Nullhypothese, dass es vor der Behandlung keine Verhaltensänderung gab, zu verwerfen. Zusammen mit unserer vorherigen Diagnose legen diese Ergebnisse nahe, dass wir der Gültigkeit unserer ATET-Schätzung vertrauen sollten.
In diesem Beispiel hatten wir eine ausreichende Anzahl von Krankenhäusern (46), um zuverlässige Rückschlüsse auf unseren Behandlungseffekt zu ziehen. Hätten wir jedoch nur Daten von 15 Krankenhäusern gehabt, hätten wir alternative Methoden in Betracht ziehen können.
Um bias-korrigierte Standardfehler mit der Freiheitsgrad-Anpassung von Bell und McCaffrey (2002) zu verwenden, können wir die Option vce(hc2) hinzufügen.

. didregress (satis) (procedure), group(hospital) time(month) vce(hc2)

To use the aggregation method proposed by Donald and Lang (2007), we can add the aggregate(dlang) option.

. didregress (satis) (procedure), group(hospital) time(month) aggregate(dlang)

Wir können die Option „Variieren“ hinzufügen, wenn wir möchten, dass einige der Koeffizienten zwischen den Gruppen variieren.

. didregress (satis) (procedure), group(hospital) time(month) aggregate(dlang, varying)

Wir können auch den Wild-Cluster-Bootstrap verwenden, um p-Werte und Konfidenzintervalle zu erhalten. Wie bei allen Bootstrap-Methoden müssen wir einen Seed setzen, um unsere Ergebnisse replizierbar zu machen.

. didregress (satis) (procedure), group(hospital) time(month) wildbootstrap(rseed(111))

computing 1000 replications

Finding p-value
.................................................. 50%
................................................. 100%
Confidence interval lower bound
...
Confidence interval upper bound
...

Number of groups and treatment time

Time variable: month
Control:       procedure = 0
Treatment:     procedure = 1
Control Treatment
Group
hospital 7 8
Time
Minimum 1 4
Maximum 1 4
DID with wild-cluster bootstrap inference Number of obs = 2,192 No. of clusters = 15 Replications = 1,000 Data type: Repeated cross-sectional Error weight: rademacher
stais Coefficient t P>|t| [95% conf. interval]
ATET
procedure
(New vs Old) .860162 19.72 0.000 .7714875 .9587552
Note: ATET estimate adjusted for group effects and time effects.

Das obige Konfidenzintervall und der p-Wert bieten eine zuverlässige Inferenz für Fälle, in denen die Anzahl der Gruppen klein ist. Diese Ergebnisse können auf die gleiche Weise wie unser ursprüngliches Modell interpretiert werden.