jamovi
(The Jamovi Project 2021) angelegt, können aber mit jeder anderen Statistiksoftware bearbeitet werden..csv
-Format vor (header = TRUE, sep = “,” dec = “.”) und können direkt in jamovi geöffnet werden. Es wird empfohlen, nach der Kategorisierung der Variablen in jamovi
, die Datei im jamovi
-Format .omv
zu speichern.Untersucht, ob ein Zusammenhang zwischen zwei qualitativen Variablen besteht bzw. ob die Ausprägungen der einen Variablen von einer anderen Variablen abhängen.
Beispiel:
Die Effektivität einer Atemphysiotherapie mit combined-PEP (RC-Cornet® Ausgangsposition) in der Langzeittherapie wurde im folgenden Set-up untersucht. Studiendesign: Randomisierte prospektive Studie über 2 Jahre an 50 Patienten mit schwerer COPD (12 w, 38 m, Alter 63,1 Jahre, FEV1 41 %, DLCO 51 % des Solls). Die Patienten waren zu Beginn der Studie infektfrei und Exraucher. Die erste Gruppe wurde nur medikamentös therapiert (Theophyllin, Salmeterol, Ipratropiumbromid, Glucocorticosteroide systemisch 5 mg Prednisolonäquivalent). Die zweite Gruppe erhielt die Medikation wie bei Gruppe 1 plus Physiotherapie 3 × täglich mindestens über 5 Minuten und falls erforderlich öfter mit dem RC-Cornet® in Ausgangsstellung (erzeugt einen combined PEP, d. h., Dauer-PEP plus aufgesetzte Druckoszillationen). In 3- bzw. im zweiten Jahr in 4-monatigem Abstand erfolgten Lungenfunktionskontrollen und klinische Untersuchungen. Die Compliance wurde mittels Theophyllin- und Cortisolspiegel-Kontrollen, Inspektion des RC-Cornets® sowie Befragung der Patienten überprüft. (U. H. Cegla and Wissmann 2002)
Eine der Forschungsfragen war, ob es im Untersuchungszeitraum einen Zusammenhang gibt zwischen der Therapie und der Notwendigkeit, Antibiotika einzunehmen.
Die Ergebnisse sind im Datenset copd.csv
abgelegt.
Der Datensatz umfasst 2 Variablen:
Variable | Beschreibung |
---|---|
Gruppe | Kontrollgruppe (ohne PT) oder Interventionsgruppe (mit PT) |
Antibiotika | mindestens 1 Mal Antibiotika zur Therapie einer Exazerbation |
Ja | Nein | Sum | |
---|---|---|---|
Intervention | 13 | 12 | 25 |
Kontrolle | 24 | 1 | 25 |
Sum | 37 | 13 | 50 |
Ja | Nein | Sum | |
---|---|---|---|
Intervention | 0.26 | 0.24 | 0.5 |
Kontrolle | 0.48 | 0.02 | 0.5 |
Sum | 0.74 | 0.26 | 1.0 |
\(H_0\) : Der Einsatz von Antiobiotika ist unabhängig von der Behandlung.
\(H_A\) : Der Einsatz von Antiobiotika ist abhängig von der Behandlung.
Signifikanzniveau \(\alpha = 0.05\)
##
## CONTINGENCY TABLES
##
## Contingency Tables
## ---------------------------------------
## Gruppe Ja Nein Total
## ---------------------------------------
## Intervention 13 12 25
## Kontrolle 24 1 25
## Total 37 13 50
## ---------------------------------------
##
##
## <U+03C7>² Tests
## -------------------------------------
## Value df p
## -------------------------------------
## <U+03C7>² 12.57796 1 0.0003903
## N 50
## -------------------------------------
Sorry, hier hat Markdown ein Problem: <U+03C7>² = \(\chi^2\)
##
## CONTINGENCY TABLES
##
## Contingency Tables
## -----------------------------------------------------------------
## Gruppe Ja Nein Total
## -----------------------------------------------------------------
## Intervention Observed 13 12 25
## Expected 18.50000 6.500000 25.00000
##
## Kontrolle Observed 24 1 25
## Expected 18.50000 6.500000 25.00000
##
## Total Observed 37 13 50
## Expected 37.00000 13.000000 50.00000
## -----------------------------------------------------------------
##
##
## <U+03C7>² Tests
## -------------------------------------
## Value df p
## -------------------------------------
## <U+03C7>² 12.57796 1 0.0003903
## N 50
## -------------------------------------
Interpretation des \(\chi^2\)-Tests:
Ein Chi-Quadrat-Test wurde für zwei Stichproben ohne (n = 25) und mit Physiotherapie und dem Einsatz von Antiobiotika (n = 25) durchgeführt. Keine erwarteten Zellhäufigkeiten waren kleiner als 5. Es gab einen statistisch signifikanten Zusammenhang zwischen Behandlungsgruppe und dem Einsatz von Antiobiotika, \(\chi^2\)(1) = 12.6, p = .0004.
Bei einem Eisverkäufer wurde an einem Tag erfasst, wieviel Schoko-Eis und wievel Vanille-Eis von Männern und Frauen gekauft wurden. Frage: Gibt es einen Zusammenhang zwischen Geschlecht und Auswahl von Eis?
Datensatz: eis.csv
Variable | Beschreibung |
---|---|
Geschlecht | Mann, Frau |
Eis | Vanille, Schoko |
\(H_0\): Es besteht kein Zusammenhang zwischen Geschlecht und der Vorliebe für ein bestimmtes Eis.
\(H_A\): Es besteht ein Zusammenhang zwischen Geschlecht und der Vorliebe für ein bestimmtes Eis.
Signifikanzniveau \(\alpha\) = 0.05
##
## CONTINGENCY TABLES
##
## Contingency Tables
## -----------------------------------------------------------
## Eis Frau Mann Total
## -----------------------------------------------------------
## Schoko Observed 25 15 40
## Expected 20.27397 19.72603 40.00000
##
## Vanille Observed 12 21 33
## Expected 16.72603 16.27397 33.00000
##
## Total Observed 37 36 73
## Expected 37.00000 36.00000 73.00000
## -----------------------------------------------------------
##
##
## <U+03C7>² Tests
## -------------------------------------
## Value df p
## -------------------------------------
## <U+03C7>² 4.941774 1 0.0262151
## N 73
## -------------------------------------
Die Wahrscheinlichkeit für \(\chi^2 = 4.942\) für eine 2 x 2-Vierfeldertafel (df = 1) unter der Nullhypothese ist p = 0.026; damit ist p kleiner als das festgelegte Signifikanzniveau und wir verwerfen die Nullhypothese zugunsten der Alternativhypothese.
Schlussfolgerung: An einer Zufallsstichprobe (Frauen n = 37, Männer n = 36), ob ein Zusammenhang zwischen Geschlecht und Vorliebe für ein bestimmtes Eis besteht. Keine der erwarteten Zellhäufigkeiten waren kleiner als 5. Der Chi-Quadrat-Test ergab einen statistisch signifikanten Zusammenhang zwischen Geschlecht und der Vorliebe für ein bestimmtes Eis: Frauen bevorzugen eher Schokoeis, Männer eher Vanilleeis, \(\chi^2\)(1) = 4.94, p = .0262.
Die Inhaberin einer Firma möchte die Krankheitsabwesenheiten infolge Covid-19 möglichst gering halten und bietet seiner Belegschaft (184 Personen) ein Impfprogramm an. Die Hälfte der Angestellten sind bereit, sich impfen zu lassen, die andere Hälfte ist gegenüber der Impfung skeptisch und verzichtet darauf. In den folgenden 6 Monaten schickt die Unternehmerin eine Pflegefachperson zu allen Personen, die an einem Infekt erkranken. Diese entnimmt den Erkrankten eine Speichelprobe und schickt sie ins Labor, um festzustellen, welcher Erreger die Krankheit verursacht hat. Die Ergebnisse der Laboruntersuchung werden eingeteilt in Covid-19- und Nicht-Covid-19-Erkrankungen.
Die Resultate dieser Untersuchung sind im Datensatz impfung.csv
abgelegt.
Der Datensatz umfasst 2 Variablen
Variable | Beschreibung |
---|---|
geimpft | ja, nein |
Krankheit | Covid, Nicht-Covid, gesund |
\(H_0\): Die Impfung hat keinen Einfluss auf die Art und die Häufigkeit der Erkrankungen.
\(H_A\): Die Impfung hat einen Einfluss auf die Art und die Häufigkeit der Erkrankung.
Signifikanzniveau \(\alpha = 0.05\)
##
## CONTINGENCY TABLES
##
## Contingency Tables
## ------------------------------------------------------------------
## Krankheit ja nein Total
## ------------------------------------------------------------------
## Covid Observed 5 23 28
## Expected 14.000000 14.000000 28.00000
##
## gesund Observed 77 61 138
## Expected 69.000000 69.000000 138.00000
##
## Nicht-Covid Observed 10 8 18
## Expected 9.000000 9.000000 18.00000
##
## Total Observed 92 92 184
## Expected 92.000000 92.000000 184.00000
## ------------------------------------------------------------------
##
##
## <U+03C7>² Tests
## -------------------------------------
## Value df p
## -------------------------------------
## <U+03C7>² 13.64872 2 0.0010870
## N 184
## -------------------------------------
Die Wahrscheinlichkeit für \(\chi^2 = 13.65\) für eine 3 x 2-Kreuztabelle (df = 2) unter der Nullhypothese ist p = 0.001; damit ist p kleiner als das festgelegte Signifikanzniveau und wir verwerfen die Nullhypothese zugunsten der Alternativhypothese.
Untersucht wurde anhand der Belegschaft einer Firma (geimpft n = 92, nicht geimpft n = 92) der Zusammenhang zwischen Covid-19-Impfung und der Erkrankungshäufigkeit sowie der Krankheitsursache (Covid-19, Nicht-Covid-19) in den Folgemonaten (Beobachtungsdauer: 6 Monate). Keine der erwarteten Zellhäufigkeiten waren kleiner als 5. Der Chi-Quadrat-Test ergab einen statistisch signifikanten Zusammenhang zwischen Impfstatus und Erkrankungshäufigkeit, \(\chi^2\)(2) = 13.7, p = .0011.
Die Unternehmerin aus Übung 2 erzählt im Bekanntenkreis vom Erfolg ihrer Impfkampagne. Ein Kollege mit einer etwas kleineren Firma (36 Angestellte) findet das eine gute Sache und bietet seinen Angestellten ebenfalls eine Impfung an. Da er ein kleineres Budget hat, verzichtet er auf die Laboruntersuchung und erfasst nur, ob jemand erkrankt oder nicht erkrankt.
Die Resultate dieser Untersuchung sind im Datensatz impfung2.csv
abgelegt.
Der Datensatz umfasst 2 Variablen
Variable | Beschreibung |
---|---|
geimpft | ja, nein |
Krankheit | ja, nein |
\(H_0\): Die Impfung hat keinen Einfluss auf die Art und die Häufigkeit der Erkrankungen.
\(H_A\): Die Impfung hat einen Einfluss auf die Art und die Häufigkeit der Erkrankung.
Signifikanzniveau \(\alpha = 0.05\)
##
## CONTINGENCY TABLES
##
## Contingency Tables
## ----------------------------------------------------------------
## Krankheit ja nein Total
## ----------------------------------------------------------------
## ja Observed 1 6 7
## Expected 3.111111 3.888889 7.000000
##
## nein Observed 15 14 29
## Expected 12.888889 16.111111 29.000000
##
## Total Observed 16 20 36
## Expected 16.000000 20.000000 36.000000
## ----------------------------------------------------------------
##
##
## <U+03C7>² Tests
## -------------------------------------
## Value df p
## -------------------------------------
## <U+03C7>² 3.200985 1 0.0735939
## N 36
## -------------------------------------
##
## CONTINGENCY TABLES
##
## Contingency Tables
## ----------------------------------------------------------------
## Krankheit ja nein Total
## ----------------------------------------------------------------
## ja Observed 1 6 7
## Expected 3.111111 3.888889 7.000000
##
## nein Observed 15 14 29
## Expected 12.888889 16.111111 29.000000
##
## Total Observed 16 20 36
## Expected 16.000000 20.000000 36.000000
## ----------------------------------------------------------------
##
##
## <U+03C7>² Tests
## -------------------------------------------------
## Value p
## -------------------------------------------------
## Fisher's exact test 0.1628061 0.1041343
## N 36
## -------------------------------------------------
Der p-Wert liegt mit 0.104 über dem festgelegten Signifikanzniveau \(\alpha = 0.05\) und wir haben keine Evidenz dafür, die Nullhypothese zu verwerfen.
Anhand der Belegschaft einer Firma (n = 36, geimpft n = 16, nicht geimpft n = 20) wurde untersucht, ob ein Zusammenhang zwischen Impfung und Erkrankungshäufigkeit in den Folgemonaten besteht. In zwei Zellen lagen die erwartete Werte < 5 und es wurde Fisher’s exakter Test für die Nullhypothesenprüfung verwendet. Die statistische Analyse ergab keinen signifikanten Zusammenhang zwischen Impfstatus und Erkrankungsrate, Fisher’s exakter Test , p = .104
Anmerkung: Fisher’s exakter Test ist zwar sehr genau, aber seine Power, d.h. ein Effekt zu entdecken, wenn die Nullhypothese falsch ist, ist eher klein. Wenn die Voraussetzungen erfüllt sind, sollte daher immer der \(\chi^2-Test\) bevorzugt werden.