Vertrauensintervall zwischen Gruppen: Wilcoxon und t-Test

  • Kopieren Sie die Spalten wie oben in eine extra Seite von Excel.
  • In der ersten Spalte steht der Gruppenname, am besten als Textkürzel; in der zweiten die gemessenen Werten.
  • Spaltenüberschriften müssen vorhanden sein.
  • Nehmen Sie die Daten mit Spaltenüberschriften in die Zwischenablage (Strg-C)
  • Pasten Sie die Daten in das Feld oben rechts (Strg-V).
  • Sie können auch nur eine Spalte mit Spaltenüberschrift eingeben. Dann wird ein Einstichproben-Wilcoxon-Test ausgeführt, es wird also die Nullhypothese getestet, dass die Werte aus einer Stichprobe stammen, die nicht gegen Null verschoben sind.
  • Wenn Sie Daten mit drei Spalten eingeben, dann wird die Differenz von Spalte 3 zu Spalte 4 gebildet und ein Tests zwischen den Gruppen ausgeführt; dieser Fall ist hier beschrieben. Ein Beispiel erhalten Sie, wenn Sie den Button Beispiel Diff klicken.
Source on github Version 2018_02_22_01
Excel-Daten mit 1, 2 oder 3 Spalten in der Zwischenablage mit STRG-V hier eingeben

        
        
        
        
        Bevor Sie Ihre eigenen Daten auswerten, erzeugen Sie bitte durch Klick auf die Schaltfläche "Beispiel" simulierte Daten eines Experiments. Versuchen Sie, das Ergebnis zu interpretieren. Wie das geht, steht unter der Grafik. Klicken Sie dann noch einmal und interpretieren Sie das Experiment wieder. Bei jedem Klick simulieren Sie, wie die Daten der gleichen Studie bei mehrfachen Wiederholungen herauskommen könnten. Wenn Sie nur auf Signifikanzen schielen, werden Sie entsetzt sein, wie unterschiedlich die Ergebnisse sind. Die Breite der Intervalle, also die Vertrauensbereiche, variieren dagegen nicht so stark. Glauben Sie also nie blind an "signifikante Ergebnisse", schauen Sie auf Vertrauensintervalle und damit auf Effektgrößen. Und lesen Sie diesen Artikel wenn Ihr Chef den Spruch loslässt: Mich interessiert nur, ob das Ergebnis signifikant ist; grummel: die Details verstehe ich sowieso nicht..
        
  • Jeder Balken repräsentiert das 95%-Konfidenzintervall einer Gruppendifferenz.
  • Wenn ein Konfidenzbalken den Wert 0 NICHT kreuzt, ist diese Differenz signifikant von Null verschieden mit p<0.05.
  • Wenn ein Balken den Wert 0 kreuzt, dann ist die Differenz für dieses Paar NICHT SIGNIFIKANT von Null verschieden. Schreiben Sie bitte nicht: "Beide Behandlungsmethoden haben die gleiche Wirkung auf ...", sondern etwa: "Mit den Daten konnte ein Unterschied zwischen den beiden Behandlungsmethoden nicht nachgewiesen werden"; in Gedanken: ein Unterschied könnnte aber durchaus bestehen.
  • Wenn alle Balken den Wert 0 kreuzen, wurde für keine Paarung ein signifikanter Unterschied gefunden.
  • p-Werte werden hier bewusst nicht ausgegeben, da die Konfidenzintervalle aussagekräftiger sind. Falls der Betreuer der Arbeit andere Meinung ist, geben Sie ihm den Artikel in Nature und das Editorial im American Statistician.
  • Eine Korrektur für multiples Testen - Stichwort: Bonferroni - wurde nicht durchgeführt; ob man eine Korrektor anbringen sollte, oder ob es dem Leser überlassen bleibt, Ergebnisse zu bewerten, ist in der statistischen Literatur umstritten. Mein Vorschlag: Verzichten Sie darauf, von mehr als drei Gruppen die Differenzen zu bilden. Oder verwenden Sie ein Mixed-Model, sodass die Korrektur auf multiples Testen implizit vorgenommen wird.
  • Um die Graphik zu speichern, verwenden Sie im Browser das Menü, das nach Rechtsklick erscheint.
  • In der Tabelle unten ist "estimate" die geschätzte Differenz für den Paarvergleich; "lower" und "upper" sind die 95% Konfidenzgrenzen. Für den Wilcoxon-Test ist es die "difference in location", bestimmt mit dem Hodges-Lehman Schätzer; näherungsweise ist dies die Differenz der Mediane. Für den t-Test ist es die Differenz der Mittelwerte und deren Konfidenzintervall, unter der Annahme ungleicher Varianzen.
Zum Einfügen in Word: Copy klicken, dann STRG-V in Word. Dort den Tabellenteil ohne Titel anwählen, dann Einfügen/Tabelle/Text in Tabelle umwandeln. Formatvorlagen für Tabelle verwenden. Gute Typographie verwendet wenige vertikale und horizontale Linien, schauen Sie in Büchern oder Publikationen nach, wie eine saubere Tabelle gesetzt wird.

Beispiele für die Formulierung

Angenommen, in der ersten Zeile steht b-a 2.3 1.0 4.5 für Muskelkraftwerte in kg. Dann könnte der Text lauten: "Bei der Gruppe mit Behandlung b ist die Muskelkraft im Mittel um 2.3 kg höher als bei Behandlung a, bei einem 95% Konfidenzintervall (KI) der Differenz von 1.0 bis 4.5 kg. Der Unterschied ist signifikant auf dem 5% Niveau." Warum: weil der Bereich nicht mit 0 überlappt. Beim zweiten Mal können Sie die Kurzform "KI(1.0 bis 4.5) kg" verwenden und das Signifikanzniveau (95%) weglassen; alternativ die englische Form CI.
Steht dort: b-a 0.22 -1.15 1.57, dann schreiben Sie: "Bei der Behandlung (mit) b ist die Muskelkraft im Mittel um 0.22 kg höher als bei Behandlung (mit) a, KI(-1.15 bis 1.57) kg; der Unterschied ist nicht signifikant." Warum: weil der Bereich mit Null überlappt.

Median und Quartile, die in den Boxplots dargestellt werden.
  • Im unten stehende Diagramm ist die vertikale Achse gespreizt. Es kann sein, dass einige Ausreißer deshalb nicht sichtbar sind, aber der zentrale Bereich deutlicher dargestellt wird. Falls Sie diese Darstellung verwenden, bitte fügen Sie in der Bildunterschrift hinzu:'xx Punkte liegen oberhalb des dargestellten Bereichs.'
  • Im Box-Whiskers-Plot werden Mediane, Quartile und Ausreißer (outliers) dargestellt. Wenn Sie sehr viele Ausreißer sehen, sollten Sie vielleicht besser nicht den t-Test anwenden; wenn Sie den Datensatz mit dem Beispiel-Button erzeugt haben, bekommen Sie absichtlich viele Ausreißer. Siehe den Artikel in Wikipedia.
  • Um die Graphik zu speichern, verwenden Sie im Browser das Menü, das nach Rechtsklick erscheint.