Introduction

Dans la lignée de la semaine 1, ce devoir porte sur l’étude évaluant la qualité de relation et la quantité d’information reçue par des patients lors d’un séjour à l’hôpital. 534 patients ont été recrutés sur plusieurs hôpitaux de la région parisienne.

Pour effectuer des calculs quels qu’ils soient, il faut tout d’abord charger le fichier de données pour obtenir un dataframe utilisable par R

Q1

Transformez la variable « recommander » en une variable binaire « recommander.b » : « recommander.b » vaut 0 si « recommander » vaut 0 ou 1 ; « recommander.b » vaut 1 si « recommander » vaut 2.

satpatient$recommander.b<-ifelse(satpatient$recommander==2,1,0)
table(satpatient$recommander,satpatient$recommander.b, useNA = "always")

##       
##          0   1 <NA>
##   0     16   0    0
##   1    120   0    0
##   2      0 269    0
##   <NA>   0   0  129

Q2

A l’aide d’un odds-ratio, estimez la force de l’association entre « recommander.b » et « sexe ». Estimez un intervalle de confiance de cet odds-ratio

fisher.test(satpatient$recommander.b, satpatient$sexe)

## 
##  Fisher's Exact Test for Count Data
## 
## data:  satpatient$recommander.b and satpatient$sexe
## p-value = 0.7523
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
##  0.7020996 1.6745388
## sample estimates:
## odds ratio 
##   1.083487

L’oddsratio vaut 1.083487

Q3

Calculez la corrélation (de Pearson) entre « score.relation » et « age ». Testez statistiquement cette corrélation (le script doit inclure la vérification éventuelle des conditions de validité de la méthode utilisée). L’age suit à peu près une loi normale

hist(satpatient$age)

Donc on peux utiliser le test de Pearson et on constate que la corrélation est faible mais le p est fort donc on rejete l’hypothèse: Il n’y a donc aucun rapport entre l’age et le score.relation

cor.test(satpatient$score.relation,satpatient$age)

## 
##  Pearson's product-moment correlation
## 
## data:  satpatient$score.relation and satpatient$age
## t = 1.796, df = 347, p-value = 0.07336
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.009102243  0.198945290
## sample estimates:
##        cor 
## 0.09596955

Q5

La moyenne du score de relation est-il significativement différent chez les hommes et chez les femmes ? (le script doit inclure la vérification éventuelle des conditions de validité de la méthode utilisée) On calcul la moyenne par sexe et on émet l’hypothèse que la différence n’est pas significative (H0)

tab<-tapply(satpatient$score.relation, satpatient$sexe, mean, na.rm=TRUE)
tab

##        0        1 
## 35.48087 34.92771

Pour valider l’hypothèse, on réalise un test de student

t.test(satpatient$score.relation~satpatient$sexe, var.equal = TRUE)

## 
##  Two Sample t-test
## 
## data:  satpatient$score.relation by satpatient$sexe
## t = 1.1166, df = 347, p-value = 0.2649
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.4212101  1.5275370
## sample estimates:
## mean in group 0 mean in group 1 
##        35.48087        34.92771

le p est de 26% ce qui nous amène à accepter H0

course-v1:UPSUD+42001: Semaine3: Devoir évalué par les pairs

David Sissoko

5 octobre 2018

Introduction

Q1

Q2

Q3

Q5