Technische Vorbemerkung

[1] The jamovi project (2021). jamovi (Version 1.6) [Computer Software]. Retrieved from https://www.jamovi.org


Inferenzstatistik

Exkurs: Die t-Verteilung

William S. Gosset, Pseudonym: Student hatte festgestellt, dass die standardisierte Schätzfunktion des Stichproben-Mittelwerts normalverteilter Daten nicht mehr normalverteilt, sondern t-verteilt ist, wenn die zur Standardisierung des Mittelwerts benötigte Varianz des Merkmals unbekannt ist und mit der Stichprobenvarianz geschätzt werden muss. Seine t-Verteilung erlaubt – insbesondere für kleine Stichprobenumfänge – die Berechnung der Verteilung der Differenz vom Mittelwert der Stichprobe zum wahren Mittelwert der Grundgesamtheit.

Die t-Werte hängen vom Signifikanzniveau sowie von der Stichprobengröße n ab und bestimmen das Vertrauensintervall und damit die Aussagekraft der Schätzung des Mittelwertes. Die t-Verteilung wird mit wachsendem Stichprobenumfang schmaler und geht für grosse Stichprobenumfänge in die Normalverteilung über (siehe Grafik unten). Hypothesentests, bei denen die t-Verteilung Verwendung findet, bezeichnet man als t-Tests. mod. nach Wikipedia

Merke:

  • Für die praktische Arbeit gilt, dass die t-Verteilung als Anpassung der Normalverteilung für kleine Stichprobenumfänge aufgefasst werden kann. Ab einem Stichprobenumfang von n > 30 entspricht sie annähernd der Normalverteilung. Der \(t\)-Wert, den Statistikprogramme berechnen, kann analog zu den \(Z\)-Werten interpretiert werden.
  • Die Form der t-Verteilung ist abhängig vom Stichprobenumfang n. Dieser wird in Freiheitsgraden (degrees of freedom, \(df\) angegeben), wobei \(df = n - 1\).

Praxis: Hypothesentests für quantitative Daten

Vorgehen

  1. Hypothesen \(H_0\) und \(H_A\) formulieren. Sind diese einseitig oder zweiseitig formuliert?
  2. Signifikanzniveau festlegen. I.d.R. \(\alpha < .05\)
  3. Sind die Daten gepaart (paired) oder unabhängig (independent)?
  4. Prüfgrösse bestimmen:
    • für unabhängige Daten: \(\mu_2 - \mu_1\) (Differenz der Mittelwerte)
    • für gepaarte Daten: \(\mu_{diff}\) (Mittelwert der paarweisen Differenzen)
    • wenn Sie sich für nicht-parametrische Tests entscheiden, ersetzen sie \(\mu\) durch \(Md\) (Median)
  5. Stichprobenumfang prüfen
    • \(n < 30\): nichparametrischen Test (Wilcoxon) wählen
    • unterschiedliche Stichprobenumfänge bei unabhängigen Daten: nichtparametrischen Test (Wilcoxon) wählen
  6. Verteilung der Prüfgrösse untersuchen
    • Daten sind annähernd normalverteilt: t-Test wählen
    • Daten sind nicht normalverteilt: nichtparametrischen Test (Wilcoxon) wählen
    • Unterschiedliche Varianzen bei unabhängigen Daten: nichtparametrischen Test (Wilcoxon) wählen.
  7. Vertrauensintervalle für die Prüfgrösse berechnen (jamovi: T-Tests: Additional Statistics: Mean Difference)
  8. Gewählten Test durchführen: t- und p-Wert bestimmen (jamovi: T-Tests)
  9. Schlussfolgerung ziehen und das Ergebnis im Zusammenhang mit der Forschungsfrage interpretieren.

Hinweis zu jamovi

  • Der Wilcoxon Rangsummen-Test für unabhängige Daten heisst hier Man-Whitney-U.
  • Der Wilcoson Vorzeichenrang-Test für gepaarte Daten heist in jamovi Wilcoxon Rank.

Übung 1

Aufgabe

Diese Übung machen wir von Hand, um das Prinzip zu verstehen.

Eine Kaffeekette betreibt eine Filiale in Basel und eine Filiale in Bern. Die Berner Kolleginnen erzählen, dass sie mehr Caffè Latte (mittlere Grösse) in Bern als in Basel für das gleiche Geld erhalten. Sie können das nicht glauben und wollen der Sache auf den Grund gehen. Ihre Frage ist: Unterscheiden sich die Kaffeemengen an den Standorten Basel und Bern?

Als erstes sammeln Sie Daten: Sie kaufen an beiden Standorten 20 Becher Caffè Latte mittlerer Grösse. Sie messen jeweils die Mengen in ml. Ihre Auswertung kommt zu folgendem Ergebnis:

Ort n m s
Bern 20 311.7 22.8
Basel 20 301.9 8.4


  1. Formulieren Sie ihre Hypothese.
  2. Berechnen sie die Vertrauensintervalle für die Kaffeemengen von Bern und Basel
  3. Berechnen sie den t-Wert für den Mittelwertsvergleich.
  4. Formulieren Sie ihr Resultat in ein bis zwei Sätzen.

Hinweise:

  • Signifikanzniveau \(\alpha = .05\)

  • Das Vorgehen ist vergleichbar mit den Übungen zu den Einstichproben-Tests. Allerdings haben Sie jetzt zwei Mittelwerte und zwei Standardabweichungen. Für die Berechnung von SE müssen sie deshalb aus diesen beiden Standardabweichungen den gemeinsamen Standardfehler \(SE_{pooled}\) berechnen nach der (etwas vereinfachten) Formel:

\[SE_{pooled} = \sqrt{\frac{s_{Bern}^2}{n_{Bern}} + \frac{s_{Basel}^2}{n_{Basel}}}\]

  • Die Berechnung des t-Werts erfolgt nach der Formel

\[t = \frac{\bar{x}_{Bern} - \bar{x}_{Basel}}{SE_{pooled}}\]

  • Die Anzahl Freiheitsgrade \(df\) ist

\[df = n_1 + n_2 - 2 = n_{Bern} + n_{Basel} - 2\]


Lösung

  1. Formulieren Sie ihre Hypothese.
  • \(H_0\) : Die Kaffeemengen von Bern und Basel unterscheiden sich nicht. \(\mu_{Basel} = \mu_{Bern}\).
  • \(H_A\) : Die Kaffeemengen von Bern und Basel unterscheiden sich. \(\mu_{Basel} \neq \mu_{Bern}\).
  1. Berechnen sie die Vertrauensintervalle für die Kaffeemengen von Bern und Basel.

Wenn Sie die Vertrauensintervalle nicht von Hand rechnen wollen, können Sie diesen Code kopieren und in jamovi: Rj-Editor eingeben.

# Kennzahlen in Variablen erfassen
n <- 20
m_Bern <- 311.7
s_Bern <- 22.8
m_Basel <- 301.9
s_Basel <- 8.4

# CI für Bern
se_Bern <- s_Bern/sqrt(n)  # SE für Bern
ci_Bern <- m_Bern + c(-2, 2) * se_Bern

# CI für Basel
se_Basel <- s_Basel/sqrt(n) # SE für Basel
ci_Basel <- m_Basel + c(-2, 2) * se_Basel

# Output
paste("95%-Vertrauensintervall für Bern: [", ci_Bern[1], ",", ci_Bern[2], "]")
## [1] "95%-Vertrauensintervall für Bern: [ 301.503530022601 , 321.896469977399 ]"
paste("95%-Vertrauensintervall für Basel: [", ci_Basel[1], ",", ci_Basel[2], "]")
## [1] "95%-Vertrauensintervall für Basel: [ 298.1434057978 , 305.6565942022 ]"

In Bern beinhaltet ein Becher Kaffee im Durchschnitt 311.7 [301.5, 321.9] ml, in Basel im Durchschnitt 301.9 [298.1, 305.7] ml. Mit Blick auf die Mittelwerte scheint die Aussage ihrer Berner Kollegin zu stimmen. Wenn wir allerdings die Vertrauensintervalle betrachten, sehen wir, dass sich diese Überschneiden. Daher besteht keine Evidenz dafür, dass die Kaffeemengen in Bern und Basel unterschiedlich sind und wir können die \(H_0\) nicht verwerfen.


  1. Berechnen sie den t-Wert für den Mittelwertsvergleich.
# gemeinsamen Standardfehler berechnen (vereinfacht)
se_pooled <- sqrt((s_Bern^2/n) + (s_Basel^2/n))

paste("gemeinsamer Standardfehler =", se_pooled)
## [1] "gemeinsamer Standardfehler = 5.43323108288245"
# t-Wert berechnen
t_Wert <- (m_Basel - m_Bern)/se_pooled
paste("t =", t_Wert)
## [1] "t = -1.80371492588916"

Der t-Wert für die Differenz der Kaffeemengen beträgt -1.804. Damit ist der Wert kleiner als +2/-2 Standardfehler und liegt im Nicht-Verwerfungsbereich für die \(H_0\).

p_value <- 2 * pt(t_Wert, df = 38)
paste("p =", p_value)
## [1] "p = 0.0792084035239142"

Der p-Wert ist mit 0.079 > 0.05. Wir haben keine Evidenz dafür, dass sich die Kaffeemengen in Bern und Basel signifikant unterscheiden und verwerfen \(H_0\) nicht.


  1. Formulieren Sie ihr Resultat in ein bis zwei Sätzen.

Die durchschnittliche Kaffeemenge in der Filiale in Bern (311.7 [301.5, 321.9] ml) und in der Filiale in Basel (301.9 [298.1, 305.7] ml) unterscheiden sich nicht, t = -1.804, df = 38, p = 0.079.


Übung 2

Bearbeiten Sie die Übung 1 in jamovi. Laden Sie die Datei caffe.csv hier herunter.

Der Datensatz umfasst zwei Variablen:

Variable Beschreibung
Ort Ort der Datenerhebung: Bern, Basel
Menge Kaffeemenge in ml

Aufgabe

  1. Laden Sie den Datensatz in jamovi.
  2. Formulieren Sie ihre Hypothese.
  3. Beschreiben Sie die Daten deskriptiv. Erstellen Sie ein Boxplot für den Vergleich der Kaffeemengen in Bern und Basel.
  4. Wählen Sie den richtigen t-Test aus (gemäss der Entscheidungskriterien müssten wir hier einen Man-Whitney-U-Test wählen, da n < 30, wir wählen aber den t-Test um das Ergebnis mit der Übung 1 zu vergleichen). Erstellen Sie auch eine Grafik für den Vergleich der 95%-Vertrauensintervalle.
  5. Kopieren Sie den jamovi-Output in ein Word-Dokument und beschriften Sie die Tabellen und Grafiken so, dass sie selbsterklärend sind. Formulieren Sie ihr Resultat in ein bis zwei Sätzen.


Lösung

  1. Formulieren Sie ihre Hypothese.
  • \(H_0\) : Die Kaffeemengen von Bern und Basel unterscheiden sich nicht. \(\mu_{Basel} = \mu_{Bern}\).
  • \(H_A\) : Die Kaffeemengen von Bern und Basel unterscheiden sich. \(\mu_{Basel} \neq \mu_{Bern}\).
  1. Beschreiben Sie die Daten deskriptiv und erstellen Sie ein Boxplot für den Vergleich der Kaffeemengen in Bern und Basel.
 DESCRIPTIVES

 Descriptives                                
 ------------------------------------------- 
                         Ort      Menge      
 ------------------------------------------- 
   N                     Basel          20   
                         Bern           20   
   Missing               Basel           0   
                         Bern            0   
   Mean                  Basel    301.9167   
                         Bern     311.6981   
   Std. error mean       Basel    1.886762   
                         Bern     5.101277   
   Median                Basel    302.8347   
                         Bern     313.4055   
   Standard deviation    Basel    8.437858   
                         Bern     22.81360   
   Minimum               Basel    281.8530   
                         Bern     276.2918   
   Maximum               Basel    317.6032   
                         Bern     349.8080   
 ------------------------------------------- 

Der korrekt beschriftete Plot könnte etwa so aussehen:


  1. Wählen Sie den richtigen t-Test aus. Erstellen Sie auch eine Grafik für den Vergleich der 95%-Vertrauensintervalle.
  • Es handelt sich um unabhängige Daten, daher wählen wir den independent samples t-test.
  • Wählen sie den Student’s Test und unter Additional Statistics > Descriptive plots.
  • Gegenüber der Berechnung von Hand ergeben sich geringfügige Rundungsfehler.
 INDEPENDENT SAMPLES T-TEST

 Independent Samples T-Test                                       
 ---------------------------------------------------------------- 
                           Statistic      df          p           
 ---------------------------------------------------------------- 
   Menge    Student's t    -1.798387     38.00000    0.0800633   
 ---------------------------------------------------------------- 
    Levene's test is significant (p < .05), suggesting a
   violation of the assumption of equal variances


  1. Formulieren Sie ihr Resultat in ein bis zwei Sätzen.

Die durchschnittliche Kaffeemenge in Bern (311.7 [301.5, 321.9] ml) und in Basel (301.9 [298.1, 305.7] ml) unterscheiden sich nicht signifikant, t = -1.798, df = 38, p = 0.080.



Übung 3

Arbeiten Sie mit dem Datensatz physio.csv bzw. physio.omv, den Sie bereits früher erstellt haben.


Aufgabe

Untersuchen Sie, ob sich Studentinnen und Studenten in ihrer Körpergrösse unterscheiden.

  1. Laden Sie den Datensatz physio.omv in jamovi.
  2. Formulieren Sie ihre Hypothesen.
  3. Beschreiben Sie die Daten deskriptiv. Erstellen Sie ein Boxplot für den Vergleich der Körpergrössen von Studentinnen und Studenten.
  4. Prüfen Sie die Testvoraussetzungen und wählen Sie einen statistischen Test. Erstellen Sie auch eine Grafik für den Vergleich der 95%-Vertrauensintervalle.
  5. Kopieren Sie den jamovi-Output in ein Word-Dokument und beschriften Sie die Tabellen und Grafiken so, dass sie selbsterklärend sind. Formulieren Sie ihr Resultat.

Lösung

  1. Formulieren Sie ihre Hypothese.
  • \(H_0\) : Die Körpergrössen von Studentinnen (w) und Studenten (m) unterscheiden sich nicht. \(\mu_{w} = \mu_{m}\).
  • \(H_A\) : Die Körpergrössen von Studentinnen (w) und Studenten (m) unterscheiden sich. \(\mu_{w} \neq \mu_{m}\).
  1. Beschreiben Sie die Daten deskriptiv. Erstellen Sie ein Boxplot für den Vergleich der Körpergrössen von Studentinnen und Studenten.
 DESCRIPTIVES

 Descriptives                                     
 ------------------------------------------------ 
                         Geschlecht    Groesse    
 ------------------------------------------------ 
   N                     m                   45   
                         w                  183   
   Missing               m                    0   
                         w                    0   
   Mean                  m             179.8667   
                         w             166.9235   
   Median                m             180.0000   
                         w             167.0000   
   Standard deviation    m             6.387488   
                         w             5.664100   
   Minimum               m             169.0000   
                         w             148.0000   
   Maximum               m             198.0000   
                         w             183.0000   
 ------------------------------------------------ 


  1. Prüfen Sie die Testvoraussetzungen und wählen Sie einen statistischen Test. Erstellen Sie auch eine Grafik für den Vergleich der 95%-Vertrauensintervalle.
  • Die Daten sind unabhängig.
  • Die Hypothesen sind zweiseitig formuliert.
  • Median und Mittelwert unterscheiden sich in beiden Gruppen kaum > spricht für Normalverteilung
  • Die Boxplots sind weitgehend symmetrisch (vielleicht leicht rechtssteil) > spricht für Normalverteilung
  • Die QQ-Plots sind weitgehend linear > spricht für Normalverteilung
 DESCRIPTIVES

 Descriptives                   
 ------------------------------ 
        Geschlecht    Groesse   
 ------------------------------ 
   N    m                  45   
        w                 183   
 ------------------------------ 

  • Die Stichprobenumfänge in den beiden Gruppen (\(n_w\) = 183, \(n_m\) = 45) unterscheiden sich stark.

Testentscheid: Auf Grund der Unterschiede in den Stichprobenumfängen entscheiden wir uns für den Wilcoxon-Rangsummen-Test (Man-Whitney-U). Zum Vergleich führen wir aber auch den Zwei-Stichproben-t-Test durch.

Output lesen und verstehen:

  1. Student’s t

    • Statistic = t-Wert = t = 13.38
    • df = degrees of freedom = \(n_w + n_m - 2\) = 228 - 2 = 226
    • p = p-Wert < .001
    • Mean difference = \(\mu_m - \mu_w\) = 12.94
    • SE difference = Standardfehler für die Differenz der Mittelwerte = .9671
    • Lower = Untere Grenze des 95%-CI für die Differenz der Mittelwerte = 11.04
    • Upper = Obere Grenze des 95%-CI für die Differenz der Mittelwerte = 14.85
  2. Man-Whitney-U

    • Statistic: Teststatistik U = 486.5, interpretieren wir nicht!
    • p = p-Wert < .001
    • Mean difference = \(Md_m - Md_w\) (Differenz der Mediane)
    • Lower: Untere Grenze des 95%-CI für die Differenz der Mediane = 13
    • Upper: Obere Grenze des 95%-CI für die Differenz der Mediane = 15
  3. Grafik 95% CI

    • zeigt die Vertrauensintervalle für \(\mu_m\) und \(\mu_w\).
    • Die Vertrauensintervalle überschneiden sich nicht.
    • Warum ist das Vertrauensintervall für \(\mu_w\) schmaler als für \(\mu_m\)?
  • Mit diesen Resulten besteht Evidenz dafür, dass sich Studentinnen und Studenten in der druchschnittlichen Körpergrösse unterscheiden. Da p < .05 ist, verwerfen Sie \(H_0\) zugunsten von \(H_A\).
  1. Kopieren Sie den jamovi-Output in ein Word-Dokument und beschriften Sie die Tabellen und Grafiken so, dass sie selbsterklärend sind. Formulieren Sie ihr Resultat.

Merke: Wir haben uns auf Grund der Entscheidungskriterien für den Wilcoxon-Test entschieden, daher werden in einem Bericht nur diese Ergebnisse präsentiert. Zu Übungszwecken wird unten zusätzlich das Ergebnis für den t-Test formuliert!

für den Wilcoxon-Test: Geprüft wurde die Frage, ob sich Physiotherapie-Studentinnen und -Studenten in ihrer Körpergrösse unterscheiden. In Stichproben aus den Studienjahrgängen PHY13 - PHY17 (\(n_w\) = 183, \(n_m\) = 45) wurde die Körpergrösse gemessen. Studenten sind im Durchschnitt (Median) um 13 [11, 15] cm grösser als Studentinnen, Man-Whitney-\(U\) = 486.5, \(p\) < .001.

für den \(t\)-Test: Geprüft wurde die Frage, ob sich Physiotherapie-Studentinnen und -Studenten in ihrer Körpergrösse unterscheiden. In Stichproben aus den Studienjahrgängen PHY13 - PHY17 (\(n_w\) = 183, \(n_m\) = 45) wurde die Körpergrösse gemessen. Studenten sind im Durchschnitt um 12.94 [11.04, 14.85] cm grösser als Studentinnen, \(t\) = 13.38, \(df\) = 226, \(p\) < .001.



Übung 4

Ein Gefängnisaufenthalt ist mit psychischem Stress verbunden. Eine Möglichkeit, diesen Stress abzubauen ist sportliche Betätigung. Ein Studie hat den Stresslevel von 26 Gefängnissinsassen bei Ein- und Austritt mittels Fragebogen untersucht. Ein Teil der Gefangenen erhielt ein sportliches Training.

Bearbeiten Sie die Übung 4 in jamovi. Laden Sie die Datei prisonStress.csv hier herunter.

Der Datensatz umfasst 5 Variablen

Variable Beschreibung
Subject anonyme ID
Group Gruppe sport oder control
PSSbefore Stresslevel (Assessment-Score) bei Eintritt
PSSafter Stresslevel (Assessment-Score) bei Austritt
Diff Paarweise Differenzen (PSSafter - PSSbefore)

Aufgabe

  1. Laden Sie den Datensatz in jamovi und kategorisieren Sie die Variablen.
  2. Frage: Haben beide Gruppen bei Eintritt den gleichen Stresslevel?
  3. Frage: Haben beide Gruppen bei Austritt den gleichen Stresslevel?
  4. Frage: Besteht ein Unterschied im Stresslevel zwischen Ein- und Austritt in der Kontrollgruppe?
  5. Frage: Besteht ein Unterschied im Stresslevel zwischen Ein- und Austritt in der Sportgruppe?
  6. Frage: Hat Sport einen Effekt auf den Stresslevel im Vergleich zu einer Kontrollgruppe, die keinen Sport macht?

Führen Sie für alle Fragen sowohl einen Wilcoxon- als auch einen t-Test durch.

Lösung 1

Fragestellung: Haben beide Gruppen bei Eintritt den gleichen Stresslevel?

  1. Hypothesen

    • \(H_0\) Es besteht kein Unterschied im Stresslevel der Gruppen Sport und Kontrolle bei Eintritt, \(\mu_{con,before} = \mu_{sport,before}\)
    • \(H_A\) Es besteht ein Unterschied im Stresslevel der Gruppen Sport und Kontrolle bei Eintritt, \(\mu_{con,before} \neq \mu_{sport,before}\)
  2. Das Signifikanzniveau legen wir bei \(\alpha = .05\) fest.

  3. Die Daten sind unabhängig.

  4. Die Prüfgrösse ist \(\mu_{con,before} - \mu_{sport,before}\)

  5. Der Stichprobenumfang pro Gruppe ist n < 30, was für Man-Whitney-U-Test spricht

 DESCRIPTIVES

 Descriptives                                 
 -------------------------------------------- 
                         Group      Subject   
 -------------------------------------------- 
   N                     Control         11   
                         Sport           15   
   Missing               Control          0   
                         Sport            0   
   Standard deviation    Control              
                         Sport                
 -------------------------------------------- 


  1. Die Verteilung der Prüfgrösse anhand der Box im Boxplot ergibt eine leicht rechtssteile Verteilung in der Kontrollgruppe und etwa Normalverteilung in der Sportgruppe Die QQ-Plots sind wenig aussagekräftig. Die Streuung der Daten ist unterschiedlich.
 DESCRIPTIVES

 Descriptives                                   
 ---------------------------------------------- 
                         Group      PSSbefore   
 ---------------------------------------------- 
   N                     Control           11   
                         Sport             15   
   Missing               Control            0   
                         Sport              0   
   Mean                  Control     16.36364   
                         Sport       23.93333   
   Median                Control     15.00000   
                         Sport       23.00000   
   Standard deviation    Control     10.74498   
                         Sport       7.487768   
   Minimum               Control     0.000000   
                         Sport       12.00000   
   Maximum               Control     30.00000   
                         Sport       44.00000   
 ---------------------------------------------- 

  • Die Prüfung der Testbedingungen legt nichtparametrische Verfahren zur statistischen Analyse nahe.
  1. Vertrauensintervalle für die Prüfgrösse und Teststatistik bestimmen

    • independent t-Test: t = -2.1213, df = 24, p = .0444
    • Man-Whitney-U-Test: U = 52.5, p = .1249
    • Der Welch-Test korrigiert den t-Test für die unterschiedlichen Varianzen: t =-2.006, df = 16.86, p = .0611, generell sollte immer der Welch-Test verwendet werden
    • Das 95% Vertrauensintervall für \(\mu_{con,before} - \mu_{sport,before}\) schliesst 0 aus.
    • Das 95% Vertrauensintervall für \(Md_{con,before} - Md_{sport,before}\) schliesst 0 ein.
 INDEPENDENT SAMPLES T-TEST

 Independent Samples T-Test                                            
 --------------------------------------------------------------------- 
                                  Statistic    df          p           
 --------------------------------------------------------------------- 
   PSSbefore    Student's t       -2.121275    24.00000    0.0444216   
                Welch's t         -2.006413    16.86303    0.0611237   
                Mann-Whitney U     52.50000                0.1249161   
 --------------------------------------------------------------------- 

Aus technischen Gründen können die 95%-Konfidenzintervalle in diesem Output nicht dargestellt werden


  1. Resultat, Schlussfolgerung

Der Stresslevel bei Eintritt ins Gefängnis ist in der Kontrollgruppe (n = 11) im Durchschnitt (Median) um -7 [-15, 2] Punkte tiefer als in der Sportgruppe (n = 15). Es liegt jedoch keine Evidenz dafür vor, dass sich die beiden Gruppen im Stresslevel bei Eintritt ins Gefängnis signifikant unterscheiden, Man-Whitney-U = 52.5, p = .1249.


Lösung 2

Fragestellung: Haben beide Gruppen bei Austritt den gleichen Stresslevel?

  1. Hypothesen

    • \(H_0\) Es besteht kein Unterschied im Stresslevel der Gruppen Sport und Kontrolle bei Austritt, \(\mu_{con,after} = \mu_{sport,after}\)
    • \(H_A\) Es besteht ein Unterschied im Stresslevel der Gruppen Sport und Kontrolle bei Austritt, \(\mu_{con,after} \neq \mu_{sport,after}\)
  2. Das Signifikanzniveau legen wir bei \(\alpha = .05\) fest.

  3. Die Daten sind unabhängig.

  4. Die Prüfgrösse ist \(\mu_{con,after} - \mu_{sport,after}\).

  5. Der Stichprobenumfang pro Gruppe ist n < 30, was für Man-Whitney-U-Test spricht.

 DESCRIPTIVES

 Descriptives                                 
 -------------------------------------------- 
                         Group      Subject   
 -------------------------------------------- 
   N                     Control         11   
                         Sport           15   
   Missing               Control          0   
                         Sport            0   
   Standard deviation    Control              
                         Sport                
 -------------------------------------------- 


  1. Die Verteilung der Prüfgrösse anhand der Box im Boxplot ergibt eine leicht rechtssteile Verteilung in beiden Gruppen. Die QQ-Plots sind wenig aussagekräftig. Die Streuung der Daten ist ähnlich.
 DESCRIPTIVES

 Descriptives                                  
 --------------------------------------------- 
                         Group      PSSafter   
 --------------------------------------------- 
   N                     Control          11   
                         Sport            15   
   Missing               Control           0   
                         Sport             0   
   Mean                  Control    23.72727   
                         Sport      20.00000   
   Median                Control    26.00000   
                         Sport      21.00000   
   Standard deviation    Control    7.114646   
                         Sport      6.907553   
   Minimum               Control    9.000000   
                         Sport      8.000000   
   Maximum               Control    33.00000   
                         Sport      33.00000   
 --------------------------------------------- 

  • Die Prüfung der Testbedingungen (n < 30, rechtssteile Verteilungen) legt nichtparametrische Verfahren zur statistischen Analyse nahe.

  1. Vertrauensintervalle für die Prüfgrösse und Teststatistik bestimmen

    • independent t-Test: t = 1.3424, df = 24, p = .192
    • Man-Whitney-U-Test: U = 108.5, p = .185
    • Nur für Interessierte: Der Welch-Test korrigiert den t-Test für die unterschiedlichen Varianzen: t =1.336, df = 21.32, p = .1956
    • Das 95% Vertrauensintervall für \(\mu_{con} - \mu_{sport}\) schliesst 0 ein.
    • Das 95% Vertrauensintervall für \(Md_{con} - Md_{sport}\) schliesst 0 ein.
 INDEPENDENT SAMPLES T-TEST

 Independent Samples T-Test                                           
 -------------------------------------------------------------------- 
                                 Statistic    df          p           
 -------------------------------------------------------------------- 
   PSSafter    Student's t        1.342408    24.00000    0.1920249   
               Welch's t          1.336068    21.32508    0.1956106   
               Mann-Whitney U     56.50000                0.1850090   
 -------------------------------------------------------------------- 

Aus technischen Gründen können die 95%-Konfidenzintervalle in diesem Output nicht dargestellt werden.

  1. Schlussfolgerung

Der Stresslevel bei aus dem Gefängnis ist in der Kontrollgruppe (n = 11) im Durchschnitt (Median) um 4 [-3, 9] Punkte höher als in der Sportgruppe (n = 15). Es liegt jedoch keine Evidenz dafür vor, dass sich die beiden Gruppen im Stresslevel bei Austritt aus dem Gefängnis signifikant unterscheiden, Man-Whitney-U = 56.5, p = 0.185.


Lösung 3

Fragestellung: Besteht ein Unterschied im Stresslevel zwischen Ein- und Austritt in der Kontrollgruppe?

  • Tipp: Erstellen Sie in jamovi einen Filter = Group == Control.

  1. Hypothesen

    • \(H_0\) Es besteht kein Unterschied im Stresslevel in der Kontrollgruppe zwischen Ein- und Austritt, \(\mu_{con,diff}=0}\) (Mittelwert der paarweisen Differenzen!)
    • \(H_A\) Es besteht ein Unterschied im Stresslevel in der Kontrollgruppe bei Eintritt, \(\mu_{con,diff} \neq 0\)$
  2. Das Signifikanzniveau legen wir bei \(\alpha = .05\) fest.

  3. Die Daten sind gepaart (2 Messungen pro Proband)

  4. Die Prüfgrösse ist \(\mu_{con,diff}\) und wir erstellen in jamovi ein neue Variable für die paarweisen Differenzen im Register Data > Compute > PSSdiff = PSSafter - PSSbefore.

  5. Der Stichprobenumfang pro Gruppe ist n < 30, was für den Wilcoxon-Vorzeichenrang-Test spricht.

 DESCRIPTIVES

 Descriptives                      
 --------------------------------- 
                         Subject   
 --------------------------------- 
   N                          11   
   Missing                     0   
   Standard deviation              
 --------------------------------- 


  1. Die Verteilung der Prüfgrösse PSSdiff anhand von Boxplot und QQ-Plot ist auf Grund der geringen Datenmenge wenig zuverlässig zu interpretieren; es scheint aber nichts dagegen zu sprechen, dass die Daten aus einer normalverteilten Population stammen.
 DESCRIPTIVES

 Descriptives                        
 ----------------------------------- 
                         PSSdiff     
 ----------------------------------- 
   N                            11   
   Missing                       0   
   Mean                   7.363636   
   Median                 7.000000   
   Standard deviation     9.233339   
   Minimum               -8.000000   
   Maximum                20.00000   
 ----------------------------------- 

  • Die Prüfung der Testbedingungen (n < 30) legt nichtparametrische Verfahren zur statistischen Analyse nahe. Wir führen aber übungshalber auch den t-Test für gepaarte Daten durch

  1. Vertrauensintervalle für die Prüfgrösse und Teststatistik bestimmen
    • independent t-Test: t = -2.645, df = 10, p = .0245
    • Wilcoxon Vorzeichenrang-Test: V = 47.5, p = .0466
    • Das 95% Vertrauensintervall für \(\mu_{con,diff}\) [-13.6, -1.16] beinhaltet den Nullwert nicht.
    • Das 95% Vertrauensintervall für \(Md_{con,diff}\) kann nicht sinnvoll berechnet werden.
 PAIRED SAMPLES T-TEST

 Paired Samples T-Test                                                          
 ------------------------------------------------------------------------------ 
                                           statistic    df          p           
 ------------------------------------------------------------------------------ 
   PSSafter    PSSbefore    Student's t     2.645026    10.00000    0.0245215   
                            Wilcoxon W      47.50000                0.0465678   
 ------------------------------------------------------------------------------ 


  1. Schlussfolgerung

Der Stresslevel bei Austritt aus dem Gefängnis ist in der Kontrollgruppe (n = 11) im Durchschnitt (Median) um 8 Punkte höher als beim Eintritt. Es liegt Evidenz dafür vor, dass sich der Stresslevel bei Austritt aus dem Gefängnis signifikant erhöht, Wilcoxon Vorzeichenrang-Test V = 47.5, p = 0.047.


Lösung 4

Fragestellung: Besteht ein Unterschied im Stresslevel zwischen Ein- und Austritt in der Sportgruppe?

Tipp: Erstellen Sie in jamovi einen Filter = Group == Sport.


  1. Hypothesen

    • \(H_0\) Es besteht kein Unterschied im Stresslevel in der Sportgruppe zwischen Ein- und Austritt, \(\mu_{sport,diff}=0}\) (Mittelwert der paarweisen Differenzen!)
    • \(H_A\) Es besteht ein Unterschied im Stresslevel in der Kontrollgruppe bei Eintritt, \(\mu_{sport,diff} \neq 0\)$
  2. Das Signifikanzniveau legen wir bei \(\alpha = .05\) fest.

  3. Die Daten sind gepaart (2 Messungen pro Proband)

  4. Die Prüfgrösse ist \(\mu_{sport,diff}\)

  5. Der Stichprobenumfang pro Gruppe ist n < 30, was für Wilcoxon-Vorzeichenrang-Test spricht.

 DESCRIPTIVES

 Descriptives                               
 ------------------------------------------ 
                         Group    Subject   
 ------------------------------------------ 
   N                     Sport         15   
   Missing                              0   
   Standard deviation                       
 ------------------------------------------ 


  1. Die Verteilung der Prüfgrösse PSSdiff anhand von Boxplot und QQ-Plot ist auf Grund der geringen Datenmenge wenig zuverlässig zu interpretieren; es scheint aber nichts dagegen zu sprechen, dass die Daten aus einer normalverteilten Population stammen.
 DESCRIPTIVES

 Descriptives                        
 ----------------------------------- 
                         PSSdiff     
 ----------------------------------- 
   N                            15   
   Missing                       0   
   Mean                  -3.933333   
   Median                -4.000000   
   Standard deviation     5.675343   
   Minimum               -15.00000   
   Maximum                4.000000   
 ----------------------------------- 

  • Die Prüfung der Testbedingungen legt nichtparametrische Verfahren zur statistischen Analyse nahe.

  1. Vertrauensintervalle für die Prüfgrösse und Teststatistik bestimmen

    • independent t-Test: t = -2.6842, df = 14, p = .0178
    • Wilcoxon Vorzeichenrang-Test: W = 20, p = .0246
    • Das 95% Vertrauensintervall für \(\mu_{sport,diff}\) [-7.08, -0.790] beinhaltet den Nullwert nicht.
    • Das 95% Vertrauensintervall für \(Md_{sport,diff}\) [-7, -0.5] beinhaltet den Nullwert nicht.
 PAIRED SAMPLES T-TEST

 Paired Samples T-Test                                                          
 ------------------------------------------------------------------------------ 
                                           statistic    df          p           
 ------------------------------------------------------------------------------ 
   PSSafter    PSSbefore    Student's t    -2.684196    14.00000    0.0177988   
                            Wilcoxon W      20.00000                0.0246061   
 ------------------------------------------------------------------------------ 


  1. Schlussfolgerung

Der Stresslevel bei Austritt aus dem Gefängnis ist in der Sportgruppe (n = 15) im Durchschnitt (Median) um 3.6 Punkte tiefer als beim Eintritt. Es liegt Evidenz dafür vor, dass sich der Stresslevel bei Austritt aus dem Gefängnis in der Sportgruppe signifikant senkt, Wilcoxon Vorzeichenrang-Test W = 100, p = 0.0246.

Hinweis: Sie können gepaarte Tests auch als Einstichprobentest mit \(Testvalue: \mu_{diff} = 0\) durchführen.


Lösung 5

Fragestellung: Hat Sport einen Effekt auf den Stresslevel im Vergleich zu einer Kontrollgruppe, die keinen Sport macht?

  1. Hypothesen

    • \(H_0\) Sport hat keinen Effekt, \(\mu_{diff,sport} = \mu_{diff,con}\)
    • \(H_A\) Sport hat einen Effekt, \(\mu_{diff,sport} \neq \mu_{diff,con}\)
  2. Das Signifikanzniveau legen wir bei \(\alpha = .05\) fest.

  3. Die Daten sind unabhängig.

  4. Die Prüfgrösse ist \(\mu_{diff,sport} = \mu_{diff,con}\)

  5. Der Stichprobenumfang pro Gruppe ist n < 30, was für Man-Whitney-U-Test spricht.

 DESCRIPTIVES

 Descriptives                      
 --------------------------------- 
              Group      PSSdiff   
 --------------------------------- 
   N          Control         11   
              Sport           15   
   Missing    Control          0   
              Sport            0   
 --------------------------------- 


  1. Die Verteilung der Daten in beiden Gruppen anhand von Boxplot und QQ-Plot ist auf Grund der geringen Datenmenge wenig zuverlässig zu interpretieren; es scheint aber nichts dagegen zu sprechen, dass die Daten aus einer normalverteilten Population stammen.
 DESCRIPTIVES

 Descriptives                                   
 ---------------------------------------------- 
                         Group      Diff        
 ---------------------------------------------- 
   N                     Control           11   
                         Sport             15   
   Missing               Control            0   
                         Sport              0   
   Mean                  Control     7.363636   
                         Sport      -3.933333   
   Median                Control     7.000000   
                         Sport      -4.000000   
   Standard deviation    Control     9.233339   
                         Sport       5.675343   
   Minimum               Control    -8.000000   
                         Sport      -15.00000   
   Maximum               Control     20.00000   
                         Sport       4.000000   
 ---------------------------------------------- 

  • Die Prüfung der Testbedingungen (n < 30) legt nichtparametrische Verfahren zur statistischen Analyse nahe.


  1. Vertrauensintervalle für die Prüfgrösse und Teststatistik bestimmen
    • Welch-Test: t = 3.59, df = 15.5, p = .003
    • Man-Whitney-U-Test: U = 27.0, p = .004
    • Das 95% Vertrauensintervall für \(\mu_{diff,sport} = \mu_{diff,con}\) [4.61, 18] schliesst den Nullwert nicht ein.
    • Das 95% Vertrauensintervall für \(Md_{diff,sport} = Md_{diff,con}\) [4.0, 18.0] schliesst den Nullwert nicht ein.
 INDEPENDENT SAMPLES T-TEST

 Independent Samples T-Test                                          
 ------------------------------------------------------------------- 
                                Statistic    df          p           
 ------------------------------------------------------------------- 
   PSSdiff    Student's t        3.861632    24.00000    0.0007469   
              Welch's t          3.590827    15.46102    0.0025647   
              Mann-Whitney U     27.00000                0.0042184   
 ------------------------------------------------------------------- 


  1. Schlussfolgerung

Untersucht wurde der Effekt von Sport auf den Stresslevel bei Gefängnisinsassen, die in eine Sport- (n = 15) und eine Kontrollgruppe (n = 11) eingeteilt wurden. In der Kontrollgruppe hat der Stresslevel um 8 Punkte zugenommen und in der Sportgruppe um durchschnittlich -3.6 [-7.0, -0.5] Punkte abgenommen. Die Daten liefern Evidenz dafür, dass sich Sport günstig auf den Stresslevel im Gefängnis auswirkt, Man-Whitney-U = 27.0, p = .0042.


Übung 5

Aufgabe

Hintergrund: Aufgrund der aktuellsten Thunberg’schen Guideline soll auch die Elektrotherapie klimaneutral werden. Darum ist wichtig zu wissen, wie viel Strom die Elektrotherapie überhaupt verbraucht. Allerdings ist unklar, ob verschiedene Frequenzen unterschiedlich viel Strom brauchen. Ziel dieser Studie war es, die Amplituden bei TENS-Strömen bei verschiedenen Frequenzen und Dosen zu untersuchen.

Methode: Bei allen teilnehmenden Personen (PHY19BS) wurde der dorsale Unterschenkel mit biphasischen, symmetrischen Rechteckimpulsen stimuliert. Die Impulsdauer betrug 150 µs und die Kathode (48cm2) wurde proximal angebracht. Jeweils mit einer Frequenz von 8 Hz und 120 Hz wurde die Amplitude (in mA) bis zur 1) Dosis mitis und 2) Dosis fortis aufgedreht. Primäres Outcome war der Unterschied der Amplituden zwischen den beiden Frequenzen. Sekundäres Outcome waren Unterschiede der errichten Amplituden zwischen Klasse 1 und Klasse 2.

Bearbeiten Sie die Übung 5 in jamovi. Den Datensatz können sie hier herunterladen: tens.csv

Der Datensatz umfasst 6 Variablen

Variable Beschreibung
Stud anonyme ID
mA_mitis_8 Dosis mitis, 8 Hz, Amplitude in mA
mA_fortis_8 Dosis fortis, 8 Hz, Amplitude in mA
mA_mitis_120 Dosis mitis, 120 Hz, Amplitude in mA
mA_fortiss_120 Dosis fortis, 120 Hz, Amplitude in mA
Klasse Klasse 1, Klasse 2

Fragestellung: Unterscheidet sich die Amplitude in mA zwischen 8 Hz und 120 Hz bei der Dosis fortis?

  1. Laden Sie den Datensatz in jamovi und kategorisieren Sie die Variablen.
  2. Formulieren Sie die Hypothesen.
  3. Beschreiben Sie die Daten deskriptiv. Erstellen Sie ein Boxplot für den Vergleich der Amplituden bei Dosis fortis.
  4. Wählen Sie den richtigen t-Test aus und prüfen Sie die Testvoraussetzungen. Erstellen Sie auch eine Grafik für den Vergleich der 95%-Vertrauensintervalle.
  5. Kopieren Sie den jamovi-Output in ein Word-Dokument und beschriften Sie die Tabellen und Grafiken so, dass sie selbsterklärend sind. Formulieren Sie ihr Resultat in ein bis zwei Sätzen.


Lösung

  1. Hypothesen

    • \(H_0\) Die Differenz der Amplituden bei Dosis fortis 8 Hz und 120 Hz ist gleich Null, \(\mu_{Diff.Dosisfortis} = 0\) (Mittelwert der paarweisen Differenzen!)
    • \(H_A\) Die Differenz der Amplituden bei Dosis fortis 8 Hz und 120 Hz ist nicht gleich Null, \(\mu_{Diff.Dosisfortis}\neq 0\)


  2. Beschreiben Sie die Daten deskriptiv. Erstellen Sie ein Boxplot für den Vergleich der Amplituden bei Dosis mitis.

 DESCRIPTIVES

 Descriptives                                           
 ------------------------------------------------------ 
                         mA_fortis_8    mA_fortis_120   
 ------------------------------------------------------ 
   N                              50               50   
   Missing                         0                0   
   Mean                     64.96000         26.69200   
   Median                   68.00000         26.00000   
   Standard deviation       19.96012         7.956408   
   Minimum                  26.00000         12.00000   
   Maximum                  110.0000         48.00000   
 ------------------------------------------------------ 

Hinweis: Wenn Sie die beiden Boxplots nebeneinander in derselben Grafik erstellen wollen, müssen Sie auf ein anderes Dateiformat zurückgreifen. Sie können dieses hier als tensLong.csv herunterladen.

Setzen Sie einen Filter: Dosis == "mA_fortis_8" or Dosis == "mA_fortis_120".

 DESCRIPTIVES

 Descriptives                                        
 --------------------------------------------------- 
                         Dosis            mA         
 --------------------------------------------------- 
   N                     mA_fortis_120          50   
                         mA_fortis_8            50   
   Missing               mA_fortis_120           0   
                         mA_fortis_8             0   
   Mean                  mA_fortis_120    26.69200   
                         mA_fortis_8      64.96000   
   Median                mA_fortis_120    26.00000   
                         mA_fortis_8      68.00000   
   Standard deviation    mA_fortis_120    7.956408   
                         mA_fortis_8      19.96012   
   Minimum               mA_fortis_120    12.00000   
                         mA_fortis_8      26.00000   
   Maximum               mA_fortis_120    48.00000   
                         mA_fortis_8      110.0000   
 --------------------------------------------------- 


  1. Wählen Sie den richtigen t-Test aus und prüfen Sie die Testvoraussetzungen. Erstellen Sie auch eine Grafik für den Vergleich der 95%-Vertrauensintervalle.
  • Die Daten sind gepaart.
  • Die Prüfgrösse ist der Mittelwert der paarweisen Differenzen.
    • Erstellen Sie im Datensatz tens eine New Computed Variable mA_diff_fortis mit der Formel = mA_fortis_120 - mA_fortis_8.
    • Erstellen Sie einen QQ-Plot für mA_diff_fortis.
 DESCRIPTIVES

 Descriptives                             
 ---------------------------------------- 
                         mA_diff_fortis   
 ---------------------------------------- 
   N                                 50   
   Missing                            0   
   Mean                       -38.26800   
   Median                     -37.25000   
   Standard deviation          17.20505   
   Minimum                    -78.00000   
   Maximum                    -7.000000   
 ---------------------------------------- 

  • Im Durchschnitt ist die Amplitude um 38.3 (s = 17.2) mA bei Dosis fortis 120 Hz geringer als bei Dosis fortis 8 Hz.
  • Auf Grund des Stichprobenumfangs und der Grafiken entscheiden wir für normalverteilte Daten (man kann darüber streiten, es ist nicht eindeutig) und führen einen t-Test für gepaarte Daten durch.
 PAIRED SAMPLES T-TEST

 Paired Samples T-Test                                                                  
 -------------------------------------------------------------------------------------- 
                                                  statistic    df          p            
 -------------------------------------------------------------------------------------- 
   mA_fortis_120    mA_fortis_8    Student's t    -15.72769    49.00000    < .0000001   
                                   Wilcoxon W      0.000000                < .0000001   
 -------------------------------------------------------------------------------------- 


  1. Kopieren Sie den jamovi-Output in ein Word-Dokument und beschriften Sie die Tabellen und Grafiken so, dass sie selbsterklärend sind. Formulieren Sie ihr Resultat in ein bis zwei Sätzen.

Untersucht wurde die Differenz der Amplitude in mA bei Dosis fortis 8 Hz und Dosis fortis 120 Hz. Die Amplitude ist im Durchschnitt bei Dosis fortis 8 Hz um 38.3 [33.4, 43.2] mA signifikant höher als bei Dosis fortis 120 Hz, gepaarter t-Test, t = -15.7, df = 49, p < .0001.



Übung 6

Unterscheidet sich der BMI von weiblichen und männlichen Physiotherapie-Studierenden?

Wir prüfen diese Frage anhand zweier Zufallsstichproben von 45 männlichen und 45 weiblichen Physiotherapie-Studierenden. Der Datensatz bmi_phy_45.csvkann hier heruntergeladen werden.

Dies ist die gleiche Fragestellung mit den identischen Daten, wie im Video Mittelwertsvergleiche Teil 1, Kap. Zweistichproben-t-Test.

Aufgabe

Führen Sie eine inferenzstatistische Analyse zu dieser Fragestellung durch. Legen Sie das Signifikanzniveau auf \(\alpha\) = .05 fest.



Lösung

  1. Deskriptive Zusammenfassung (Kennzahlen)

Es wird empfohlen, stets die wichtigsten Kennzahlen zu berechnen.

in R

tapply(bmi_phy_45$bmi, bmi_phy_45$Geschlecht, summary)
## $m
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   16.91   21.13   22.41   22.52   24.11   27.78 
## 
## $w
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   17.18   19.60   20.94   20.98   22.49   24.54

Einfacher geht es mit dem package psych. Dieses muss zuerst installiert und geladen werden.

library(psych)
psych::describeBy(bmi_phy_45$bmi, group = bmi_phy_45$Geschlecht)
## 
##  Descriptive statistics by group 
## group: m
##    vars  n  mean   sd median trimmed  mad   min   max range  skew kurtosis   se
## X1    1 45 22.52 2.24  22.41   22.59 2.01 16.91 27.78 10.87 -0.25     0.26 0.33
## ------------------------------------------------------------ 
## group: w
##    vars  n  mean   sd median trimmed  mad   min   max range skew kurtosis   se
## X1    1 45 20.98 1.82  20.94   20.99 2.18 17.18 24.54  7.36 0.03     -0.9 0.27

in jamovi

jamovi > Exploration > bmi in Variables einfügen, Geschlecht in Split by einfügen. Gewünschte Kennzahlen unter Statistics auswählen.

 DESCRIPTIVES

 Descriptives                                     
 ------------------------------------------------ 
                         Geschlecht    bmi        
 ------------------------------------------------ 
   N                     m                   45   
                         w                   45   
   Missing               m                    0   
                         w                    0   
   Mean                  m             22.52183   
                         w             20.98392   
   Median                m             22.40818   
                         w             20.93664   
   Standard deviation    m             2.235014   
                         w             1.818249   
   Minimum               m             16.90617   
                         w             17.17532   
   Maximum               m             27.77693   
                         w             24.53896   
 ------------------------------------------------ 

  1. Statistische Hypothesen formulieren
  • \(H_0: \mu_w = \mu_m\)
  • \(H_A: \mu_w \neq \mu_m\)
  1. Signifkanzniveau festlegen
  • \(\alpha\) = .05
  1. Sind die Daten gepaart oder unabhängig?
  • Es besteht kein Zusammenhang zwischen dem BMI von Studenten und von Studentinnen. Es handelt sich um nicht gepaarte (unabhängige) Stichproben.
  1. Prüfgrösse bestimmen
  • Die Prüfgrösse ist die Differenz der Mittelwerte: \(\mu_m - \mu_w\)
  1. Voraussetzungen prüfen
  • Es handelt sich um Zufallsstichproben. Es kann davon ausgegangen werden, dass die Beobachtungseinheiten unabhängig voneinander sind.
  • Der Stichprobenumfang pro Gruppe ist grösser als 30.
  • Normalverteilung für beide Stichproben prüfen

in R

phy_m <- subset(bmi_phy_45, Geschlecht == "m")  # Teildatensatz für Männer
phy_w <- subset(bmi_phy_45, Geschlecht == "w")  # Teildatensatz für Frauen

qqnorm(phy_m$bmi, col = "blue")
qqline(phy_m$bmi)

qqnorm(phy_w$bmi, col = "blue")
qqline(phy_w$bmi)

in jamovi

jamovi > Exploration > bmi in Variables einfügen, Geschlecht in Split by einfügen. Unter Plots > Q-Q Plots > Häkchen bei Q-Q.

 DESCRIPTIVES

 Descriptives                                     
 ------------------------------------------------ 
                         Geschlecht    bmi        
 ------------------------------------------------ 
   N                     m                   45   
                         w                   45   
   Missing               m                    0   
                         w                    0   
   Mean                  m             22.52183   
                         w             20.98392   
   Median                m             22.40818   
                         w             20.93664   
   Standard deviation    m             2.235014   
                         w             1.818249   
   Minimum               m             16.90617   
                         w             17.17532   
   Maximum               m             27.77693   
                         w             24.53896   
 ------------------------------------------------ 

  • In beiden Stichproben sind die Daten annähernd normalverteilt.
  1. 95%-Konfidenzintervalle berechnen

in R

# für Männer
n_m <- length(phy_m$bmi)  
m_m <- mean(phy_m$bmi)
s_m <- sd(phy_m$bmi)
SE_m <- s_m/sqrt(n_m)
t <- abs(qt(.025, df = n_m - 1))
CI <- m_m + c(-1, 1) * t * SE_m
CI <- round(CI, 3)
result_m <- paste("BMI Männer: Mittelwert =", round(m_m, 3), ", CI = [", CI[1], ",", CI[2], "]")

# für Frauen
n_w <- length(phy_w$bmi)  
m_w <- mean(phy_w$bmi)
s_w <- sd(phy_w$bmi)
SE_w <- s_w/sqrt(n_w)
t <- abs(qt(.025, df = n_w - 1))
CI <- m_w + c(-1, 1) * t * SE_w
CI <- round(CI, 3)
result_w <- paste("BMI Frauen: Mittelwert =", round(m_w, 3), ", CI = [", CI[1], ",", CI[2], "]")

result_m
## [1] "BMI Männer: Mittelwert = 22.522 , CI = [ 21.85 , 23.193 ]"
result_w
## [1] "BMI Frauen: Mittelwert = 20.984 , CI = [ 20.438 , 21.53 ]"

in jamovi

jamovi > Exploration > Descriptives > Mean Dispersion > Confidence interval for Mean: Häkchen setzen, Vorgabe ist der Wert 95 für ein 95%-CI.

## <pre>
## 
##  DESCRIPTIVES
## 
##  Descriptives                                          
##  ----------------------------------------------------- 
##                               Geschlecht    bmi        
##  ----------------------------------------------------- 
##    N                          m                   45   
##                               w                   45   
##    Missing                    m                    0   
##                               w                    0   
##    Mean                       m             22.52183   
##                               w             20.98392   
##    95% CI mean lower bound    m             21.86882   
##                               w             20.45267   
##    95% CI mean upper bound    m             23.17485   
##                               w             21.51516   
##    Median                     m             22.40818   
##                               w             20.93664   
##    Standard deviation         m             2.235014   
##                               w             1.818249   
##    Minimum                    m             16.90617   
##                               w             17.17532   
##    Maximum                    m             27.77693   
##                               w             24.53896   
##  -----------------------------------------------------
## </pre>

Physiotherapie-Studentinnen haben einen durchschnittlichen BMI von 20.984 [20.438, 21.53] \(kg/m^2\) und Physiotherapie-Studenten haben einen durchschnittlichen BMI von 22.522 [21.85, 23.193] \(kg/m^2\). Männer haben im Durchschnitt einen um 1.538 [0.684, 2.392] \(kg/m^2\) signifikant höheren BMI als Frauen. Dieses 95%-Konfidenzintervall enthält den Nullwert nicht und wir haben Evidenz gegen die Nullhypothese.

Hinweise:

  • Das 95%-CI für die Differenz kann dem Welch-Test unten entnommen werden.
  • Die geringgradige Differenz für die Grenzen des 95%-CI zwischen R und jamovi sind darauf zurückzuführen, dass jamovi die Grenzen mit dem \(z\)-Wert 1.96 berechnet, während die Berechnung in R mit dem \(t\)-Wert für das 2.5-Quantil und \(df\) = 44 (\(t\) = 2.0154) erfolgt.
  1. Teststatistik und p-Wert berechnen

in R

t.test(bmi ~ Geschlecht, data = bmi_phy_45, alternative = "two.sided")
## 
##  Welch Two Sample t-test
## 
## data:  bmi by Geschlecht
## t = 3.5807, df = 84.501, p-value = 0.0005713
## alternative hypothesis: true difference in means between group m and group w is not equal to 0
## 95 percent confidence interval:
##  0.6838744 2.3919580
## sample estimates:
## mean in group m mean in group w 
##        22.52183        20.98392

in jamovi

jamovi > T-Tests > Independent Samples T-Test > Tests: Welch’s wählen und unter > Hypothesis Group 1 \(\neq\) Group 2$ wählen. Für das 95%-CI der Differenz zwischen den beiden Gruppen unter > Additional Statistics > Mean difference und Confidence interval wählen.

Für die Anzeige der 95%-Konfidenzintervalle kann unter > Additional Statistics > Descriptive Plots gewählt werden.

 INDEPENDENT SAMPLES T-TEST

 Independent Samples T-Test                                                                                              
 ----------------------------------------------------------------------------------------------------------------------- 
                       Statistic    df          p            Mean difference    SE difference    Lower        Upper      
 ----------------------------------------------------------------------------------------------------------------------- 
   bmi    Welch's t     3.580680    84.50087    0.0005713           1.537916        0.4295040    0.6838744    2.391958   
 ----------------------------------------------------------------------------------------------------------------------- 

  1. Schlussfolgerung

Der durchschnittliche BMI von Physiotherapie-Studentinnen (20.984 [20.438, 21.53] \(kg/m^2\)) unterscheidet sich signifikant vom durchschnittlichen BMI von Physiotherapie-Studenten (22.522 [21.85, 23.193] \(kg/m^2\)). Physiotherapie-Studenten haben im Durchschnitt einen um 1.538 [0.684, 2.392] \(kg/m^2\) höheren BMI als Physiotherapie-Studentinnen, \(t\) = 3.581, \(df\) = 84.5, \(p\) = .0006.



Übung 7

In einer Studie wird der Effekt eines neuen Schlafmittels untersucht. Die Studie wird mit 20 Testpersonen durchgeführt. Zuerst wird die Schlafdauer ohne Medikament, dann die Schlafdauer mit Medikament gemessen.

Der Datensatz schlafmittel.csvkann hier heruntergeladen werden.

Dies ist die gleiche Fragestellung mit den identischen Daten, wie im Video Mittelwertsvergleiche Teil 1, Kap. T-Test für verbundene Stichproben.

Aufgabe

Hat das neue Schlafmittel einen Effekt auf die Schlafdauer? Führen Sie eine inferenzstatistische Analyse zu dieser Fragestellung durch. Legen Sie das Signifikanzniveau auf \(\alpha\) = .05 fest.



Lösung

  1. Datensatz einlesen und Struktur analysieren

in R

medi <- rio::import("../data/schlafmittel.csv")

head(medi)
##   Proband ohne_Med mit_Med
## 1       1     5.28    5.83
## 2       2     5.69    4.69
## 3       3     4.81    4.43
## 4       4     5.90    6.49
## 5       5     6.50    7.18
## 6       6     5.14    5.53
  1. Deskriptive Zusammenfassung (Kennzahlen)

in R

##     Proband         ohne_Med        mit_Med     
##  Min.   : 1.00   Min.   :4.340   Min.   :4.340  
##  1st Qu.: 5.75   1st Qu.:5.008   1st Qu.:5.197  
##  Median :10.50   Median :5.260   Median :5.645  
##  Mean   :10.50   Mean   :5.376   Mean   :5.771  
##  3rd Qu.:15.25   3rd Qu.:5.742   3rd Qu.:6.317  
##  Max.   :20.00   Max.   :6.500   Max.   :8.080
##          vars  n  mean   sd median trimmed  mad  min   max range skew kurtosis
## Proband     1 20 10.50 5.92  10.50   10.50 7.41 1.00 20.00 19.00 0.00    -1.38
## ohne_Med    2 20  5.38 0.57   5.26    5.36 0.58 4.34  6.50  2.16 0.28    -0.73
## mit_Med     3 20  5.77 0.95   5.64    5.71 0.80 4.34  8.08  3.74 0.58    -0.28
##            se
## Proband  1.32
## ohne_Med 0.13
## mit_Med  0.21

in jamovi

 DESCRIPTIVES

 Descriptives                                     
 ------------------------------------------------ 
                         ohne_Med     mit_Med     
 ------------------------------------------------ 
   N                            20           20   
   Missing                       0            0   
   Mean                   5.376000     5.770500   
   Median                 5.260000     5.645000   
   Standard deviation    0.5743500    0.9527549   
   Minimum                4.340000     4.340000   
   Maximum                6.500000     8.080000   
 ------------------------------------------------ 

  1. Statistische Hypothesen
  • \(H_0: \mu_{diff} = 0\)
  • \(H_A: \mu_{diff} \neq 0\)
  1. Sind die Daten gepaart oder unabhängig?
  • Es handelt sich um zwei Messungen an den gleichen Probanden. In diesem Fall besteht ein Zusammenhang zwischen der ersten und der zweiten Messung; die Daten sind gepaart.
  • Der Zusammenhang zwischen den Messungen kann in einem Streudiagramm dargestellt werden.

in R

plot(medi$ohne_Med, medi$mit_Med, col = "blue")

in jamovi

jamovi > Exploration > Scatterplot > ohne_Med als X-Axis, mit_Med als Y-Axis.

Das Streudiagramm zeigt in der Tendenz, dass Testpersonen, die ohne Medikament länger schlafen auch mit Medikament länger schlafen.

  1. Prüfgrösse
  • Die Prüfgrösse ist der Mittelwert der paarweisen Differenzen \(\mu_{diff}\)
  • Die paarweisen Differenzen müssen als neue Variable berechnet werden.

in R

medi$diff <- medi$mit_Med - medi$ohne_Med
summary(medi$diff)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -1.0000 -0.0450  0.5700  0.3945  0.7825  1.6500

in jamovi

jamovi > Data > Compute > Variablennamen eingeben, z.B. diff > im Formelfenster = mit_Medi - ohne_Medi eintragen.

 DESCRIPTIVES

 Descriptives                                                  
 ------------------------------------------------------------- 
                         ohne_Med     mit_Med      diff        
 ------------------------------------------------------------- 
   N                            20           20           20   
   Missing                       0            0            0   
   Mean                   5.376000     5.770500    0.3945000   
   Median                 5.260000     5.645000    0.5700000   
   Standard deviation    0.5743500    0.9527549    0.6724384   
   Minimum                4.340000     4.340000    -1.000000   
   Maximum                6.500000     8.080000     1.650000   
 ------------------------------------------------------------- 

  1. Voraussetzungen prüfen
  • Es handelt sich um eine Zufallsstichprobe und wir können davon ausgehen, dass die Beobachtungseinheiten voneinander unabhängig sind.
  • Der Stichprobenumfang ist grösser als 12; ein parametrischer Test ist möglich.
  • Ist die Prüfgrösse normalverteilt?

in R

qqnorm(medi$diff, col = "blue")
qqline(medi$diff)

in jamovi

jamovi > Analyses > Exploration > diff in Variables auswählen, > Plots > Q-Q Plots > Häkchen bei Q-Q setzen.

 DESCRIPTIVES

 Descriptives                        
 ----------------------------------- 
                         diff        
 ----------------------------------- 
   N                            20   
   Missing                       0   
   Mean                  0.3945000   
   Median                0.5700000   
   Standard deviation    0.6724384   
   Minimum               -1.000000   
   Maximum                1.650000   
 ----------------------------------- 

Der QQ-Plot liefert keine Evidenz gegen die Annahme, dass die paarweisen Differenzen normalverteilt sind.

  1. 95%-Konfidenzintervall für \(\hat{\mu}_{diff}\) berechnen

in R

n_diff <- length(medi$diff)             # Stichprobenumfang
m_diff <- mean(medi$diff)               # Mittelwert
s_diff <- sd(medi$diff)                 # Standardabweichung
se_diff <- s_diff/sqrt(n_diff)          # Standardfehler
t <- abs(qt(.025, df = n_diff - 1))     # t-Wert für 95%-CI und df = 19
CI <- m_diff + c(-1, 1) * t * se_diff   # Grenzen des 95%-CI
CI <- round(CI, 3)                      # Grenzen des 95%-CI auf drei Nachkommastellen runden

# Resultat formatieren und ausgeben
result <- paste("medi$diff: Mittelwert =", round(m_diff, 3), ", CI = [", CI[1], ",", CI[2], "]")
print(result)
## [1] "medi$diff: Mittelwert = 0.395 , CI = [ 0.08 , 0.709 ]"

in jamovi

Das korrekte 95%-Konfidenzintervall für \(\hat{\mu}_{diff}\) muss mit der Funktion für den \(T\)-Test für verbundene Stichproben berechnet werden, da jamovi in > Descriptives stets mit dem \(z\)-Wert rechnet und dadurch ein zu schmales 95%-CI berechnet wird.

jamovi > Analyses > T-Tests > Paired Samples T-Test > 1. mit_Med, 2. ohne_Med als Paired Variables einsetzen; unter > Additional Statistics: Häkchen bei Mean difference und Confidence Interval setzen.

 PAIRED SAMPLES T-TEST

 Paired Samples T-Test                                                                                                                       
 ------------------------------------------------------------------------------------------------------------------------------------------- 
                                         statistic    df          p            Mean difference    SE difference    Lower         Upper       
 ------------------------------------------------------------------------------------------------------------------------------------------- 
   mit_Med    ohne_Med    Student's t     2.623672    19.00000    0.0167179          0.3945000        0.1503618    0.07978913    0.7092109   
 ------------------------------------------------------------------------------------------------------------------------------------------- 

Interpretation: Die Einnahme des Schlafmittels verlängert den Schlaf im Durchschnitt um 0.395 [0.080, 0.709] Stunden. Das 95%-Konfidenzintervall beinhaltet den Nullwert nicht und wir haben Evidenz gegen die Nullhypothese, bzw. Evidenz für einen signifikanten Effekt.

  1. Teststatistik und \(p\)-Wert berechnen

Die Berechnung der Teststatistik \(t\) und des \(p\)-Werts kann auf zweierlei Arten erfolgen:

  • Variante 1: Als \(t\)-Test für verbundene Stichproben oder
  • Variante 2: Als Einstichproben-\(t\)-Test mit der Variablen diff und dem Referenzwert 0 (siehe Hypothesen oben)

in R

## 
##  Paired t-test
## 
## data:  medi$mit_Med and medi$ohne_Med
## t = 2.6237, df = 19, p-value = 0.01672
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.07978913 0.70921087
## sample estimates:
## mean of the differences 
##                  0.3945
## 
##  One Sample t-test
## 
## data:  medi$diff
## t = 2.6237, df = 19, p-value = 0.01672
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  0.07978913 0.70921087
## sample estimates:
## mean of x 
##    0.3945

in jamovi

  • Variante 1: jamovi > Analyses > T-Tests > Paired Samples T-Test > 1. mit_Med, 2. ohne_Med als Paired Variables einsetzen; unter > Tests: Student’s wählen; unter > Additional Statistics: Häkchen bei Mean difference und Confidence Interval setzen.

  • Variante 2: jamovi > Analyses > T-Tests > One Sample T-Test: diff in Dependent Variables einsetzen, unter > Tests: Student’s wählen, unter > Additional Statistics: Häkchen bei Mean difference und Confidence Interval setzen.

 ONE SAMPLE T-TEST

 One Sample T-Test                                                                                           
 ----------------------------------------------------------------------------------------------------------- 
                          Statistic    df          p            Mean difference    Lower         Upper       
 ----------------------------------------------------------------------------------------------------------- 
   diff    Student's t     2.623672    19.00000    0.0167179          0.3945000    0.07978913    0.7092109   
 ----------------------------------------------------------------------------------------------------------- 

  1. Schlussfolgerung

Geprüft wurde die Frage, ob ein neues Schlafmittel einen Effekt auf die Schlafdauer hat. Die Studie mit 20 Testpersonen ergab, das die Einnahme des Schlafmittels den Schlaf im Durchschnitt signifikant um 0.395 [0.080, 0.709] Stunden verlängert, \(t\) = 2.624, \(df\) = 19, \(p\) = .017.