Question1

chargement du fichier sous le nom hop_sa

setwd("D:/mooc R statistique")
 hop_sa <-read.csv2("D:/mooc R statistique/DATA/satisfaction_hopital.csv")

recodage de la variable recommander en recommander.b binaire

hop_sa$recommander.b <-ifelse(hop_sa$recommander<2,0,1)

croisement de la variable recommander.b et sexe

table(hop_sa$recommander.b,hop_sa$sexe,deparse.level=2,useNA="always")
##                     hop_sa$sexe
## hop_sa$recommander.b   0   1 <NA>
##                 0     73  63    0
##                 1    139 130    0
##                 <NA>  56  73    0

transformons les données en pourcentage

stockons les résultats dans tab

tab <-table(hop_sa$recommander.b,hop_sa$sexe,deparse.level=2)

utilisons la fonction prop.table pour les pourcentages

prop.table(tab,2)
##                     hop_sa$sexe
## hop_sa$recommander.b      0      1
##                    0 0.3443 0.3264
##                    1 0.6557 0.6736

interessons nous au petit par le test de khi-2

chisq.test(hop_sa$recommander.b,hop_sa$sexe,correct=FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  hop_sa$recommander.b and hop_sa$sexe
## X-squared = 0.1454, df = 1, p-value = 0.703

il ressort de la valeur du petit p > 5 que les relations entre ces 2 variables sont dues au hasard

Question 2

Véricafication des conditions de validité du test t (student)

hist(hop_sa$score.relation)

plot of chunk unnamed-chunk-7

qqnorm(hop_sa$score.relation);qqline(hop_sa$score.relation)

plot of chunk unnamed-chunk-7

by(hop_sa$score.relation,hop_sa$sexe,sd,na.rm=TRUE)
## hop_sa$sexe: 0
## [1] 4.552
## -------------------------------------------------------- 
## hop_sa$sexe: 1
## [1] 4.698

la normalité n’est pas évidente pour les 2 premières méthodes##cependant pour la 3ème les écarts types sont à peu près les mêmes.

t.test(hop_sa$score.relation~hop_sa$sexe,var.equal=TRUE)
## 
##  Two Sample t-test
## 
## data:  hop_sa$score.relation by hop_sa$sexe
## t = 1.117, df = 347, p-value = 0.2649
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.4212  1.5275
## sample estimates:
## mean in group 0 mean in group 1 
##           35.48           34.93

la moyenne du score n’est pas différent chez les hommes que les femmes

Question 3

vérifions les conditions de validité de l’une des variables(score de relation et âge)

hist(hop_sa$age)

plot of chunk unnamed-chunk-9 ##Au vu de l’histogramme des âges qui en cloche la variable suit une loi normale

cor.test(hop_sa$score.relation,hop_sa$age) 
## 
##  Pearson's product-moment correlation
## 
## data:  hop_sa$score.relation and hop_sa$age
## t = 1.796, df = 347, p-value = 0.07336
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.009102  0.198945
## sample estimates:
##     cor 
## 0.09597

la corrélation est positive et le petit p > 5