Dans la lignée de la semaine 1, ce devoir porte sur l’étude évaluant la qualité de relation et la quantité d’information reçue par des patients lors d’un séjour à l’hôpital. 534 patients ont été recrutés sur plusieurs hôpitaux de la région parisienne.
Pour effectuer des calculs quels qu’ils soient, il faut tout d’abord charger le fichier de données pour obtenir un dataframe utilisable par R
Transformez la variable « recommander » en une variable binaire « recommander.b » : « recommander.b » vaut 0 si « recommander » vaut 0 ou 1 ; « recommander.b » vaut 1 si « recommander » vaut 2.
satpatient$recommander.b<-ifelse(satpatient$recommander==2,1,0)
table(satpatient$recommander,satpatient$recommander.b, useNA = "always")
##
## 0 1 <NA>
## 0 16 0 0
## 1 120 0 0
## 2 0 269 0
## <NA> 0 0 129
A l’aide d’un odds-ratio, estimez la force de l’association entre « recommander.b » et « sexe ». Estimez un intervalle de confiance de cet odds-ratio
fisher.test(satpatient$recommander.b, satpatient$sexe)
##
## Fisher's Exact Test for Count Data
##
## data: satpatient$recommander.b and satpatient$sexe
## p-value = 0.7523
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
## 0.7020996 1.6745388
## sample estimates:
## odds ratio
## 1.083487
L’oddsratio vaut 1.083487
Calculez la corrélation (de Pearson) entre « score.relation » et « age ». Testez statistiquement cette corrélation (le script doit inclure la vérification éventuelle des conditions de validité de la méthode utilisée). L’age suit à peu près une loi normale
hist(satpatient$age)
Donc on peux utiliser le test de Pearson et on constate que la corrélation est faible mais le p est fort donc on rejete l’hypothèse: Il n’y a donc aucun rapport entre l’age et le score.relation
cor.test(satpatient$score.relation,satpatient$age)
##
## Pearson's product-moment correlation
##
## data: satpatient$score.relation and satpatient$age
## t = 1.796, df = 347, p-value = 0.07336
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.009102243 0.198945290
## sample estimates:
## cor
## 0.09596955
La moyenne du score de relation est-il significativement différent chez les hommes et chez les femmes ? (le script doit inclure la vérification éventuelle des conditions de validité de la méthode utilisée) On calcul la moyenne par sexe et on émet l’hypothèse que la différence n’est pas significative (H0)
tab<-tapply(satpatient$score.relation, satpatient$sexe, mean, na.rm=TRUE)
tab
## 0 1
## 35.48087 34.92771
Pour valider l’hypothèse, on réalise un test de student
t.test(satpatient$score.relation~satpatient$sexe, var.equal = TRUE)
##
## Two Sample t-test
##
## data: satpatient$score.relation by satpatient$sexe
## t = 1.1166, df = 347, p-value = 0.2649
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.4212101 1.5275370
## sample estimates:
## mean in group 0 mean in group 1
## 35.48087 34.92771
le p est de 26% ce qui nous amène à accepter H0