Cargo Paquetes
library("tidyverse")
library("ggthemes")
library("ggplot2")
install.packages("nortest")
Error in install.packages : Updating loaded packages
library("nortest")
Abro mi df4
df5 <- read.csv("suma por areas y total.csv", header = TRUE, sep=",")
str(df5)
'data.frame': 34 obs. of 14 variables:
$ Centro.Salud: Factor w/ 3 levels "Externo ","Paillaco",..: 2 2 2 2 2 2 2 2 2 2 ...
$ Sexo : Factor w/ 2 levels "F","M": 1 1 2 1 1 1 1 1 2 2 ...
$ HOC1 : int 15 15 14 12 13 8 12 15 13 12 ...
$ CFC1 : int 12 17 14 13 19 13 16 12 19 17 ...
$ AEC1 : int 15 15 3 15 15 14 12 14 12 13 ...
$ TOTALC1 : int 42 47 31 40 47 35 40 41 44 42 ...
$ HOC2 : int 15 13 13 11 11 8 14 12 15 9 ...
$ CFC2 : int 14 18 20 16 18 18 20 18 19 20 ...
$ AEC2 : int 15 15 13 12 12 14 14 14 15 14 ...
$ TOTALC2 : int 44 46 46 39 41 40 48 44 49 43 ...
$ HOC3 : int 12 12 14 12 9 10 11 12 14 13 ...
$ CFC3 : int 14 18 19 17 20 16 17 20 18 20 ...
$ AEC3 : int 15 15 14 14 14 15 13 13 14 13 ...
$ TOTALC3 : int 41 45 47 43 43 41 41 45 46 46 ...
summary(df5)
Centro.Salud Sexo HOC1 CFC1 AEC1 TOTALC1
Externo :13 F:21 Min. : 6.00 Min. : 6.00 Min. : 3.00 Min. :22.00
Paillaco:17 M:13 1st Qu.:10.00 1st Qu.:12.25 1st Qu.:11.25 1st Qu.:35.00
Privado : 4 Median :11.00 Median :15.00 Median :12.50 Median :39.00
Mean :11.26 Mean :14.47 Mean :12.21 Mean :37.94
3rd Qu.:13.00 3rd Qu.:17.00 3rd Qu.:14.75 3rd Qu.:43.00
Max. :15.00 Max. :19.00 Max. :15.00 Max. :48.00
HOC2 CFC2 AEC2 TOTALC2 HOC3 CFC3
Min. : 4.00 Min. : 9.00 Min. : 6.00 Min. :24.00 "print" Min. : 8.00
1st Qu.:10.00 1st Qu.:14.25 1st Qu.:12.00 1st Qu.:37.25 1st Qu.: 9.25 1st Qu.:14.50
Median :11.00 Median :18.00 Median :14.00 Median :41.50 Median :12.00 Median :18.00
Mean :11.21 Mean :16.47 Mean :12.88 Mean :40.56 Mean :11.24 Mean :16.56
3rd Qu.:13.00 3rd Qu.:19.00 3rd Qu.:14.00 3rd Qu.:44.75 3rd Qu.:13.00 3rd Qu.:19.00
Max. :15.00 Max. :20.00 Max. :15.00 Max. :49.00 Max. :15.00 Max. :20.00
AEC3 TOTALC3
Min. : 5.00 Min. :20.00
1st Qu.:13.00 1st Qu.:38.00
Median :14.00 Median :43.00
Mean :13.29 Mean :41.09
3rd Qu.:15.00 3rd Qu.:46.00
Max. :15.00 Max. :50.00
agrego decimales para los calculos
options(digits=2)
Agrupo por centro de salud para el total de controles
df5 %>%
group_by(Centro.Salud) %>%
summarise(n = n(),
"Promedio(control1)" = mean(TOTALC1),
"SD(control1)" = sd(TOTALC1),
"min(control1)"= min(TOTALC1),
"max(control1)"=max(TOTALC1),
"Promedio(control2)" = mean(TOTALC2),
"SD(control2)" = sd(TOTALC2) ,
"min(control2)"=min(TOTALC2),
"max(control2)"=max(TOTALC2),
"Promedio(control3)" = mean(TOTALC3),
"SD(control3)" = sd(TOTALC3),
"min(control3)"=min(TOTALC3),
"max(control3"=max(TOTALC3))
Agrupo por Sexo para el total de los controles
df5 %>%
group_by(Sexo) %>%
summarise(n = n(),
"Promedio(control1)" = mean(TOTALC1),
"SD(control1)" = sd(TOTALC1),
"min(control1)"= min(TOTALC1),
"max(control1)"=max(TOTALC1),
"Promedio(control2)" = mean(TOTALC2),
"SD(control2)" = sd(TOTALC2) ,
"min(control2)"=min(TOTALC2),
"max(control2)"=max(TOTALC2),
"Promedio(control3)" = mean(TOTALC3),
"SD(control3)" = sd(TOTALC3),
"min(control3)"=min(TOTALC3),
"max(control3"=max(TOTALC3))
Calculo promedios y desviacion por centro de salud para cada uno de los controles del item higiene
df5 %>%
group_by(Centro.Salud) %>%
summarise(n = n(),
"PromedioOH(control1)" = mean(HOC1),
"SD OH(control1)" = sd(HOC1),
"PromedioOH(control2)" = mean(HOC2),
"SD OH(control2)" = sd(HOC2) ,
"Mean_OH(control3)" = mean(HOC3),
"SD OH(control3)" = sd(HOC3))
Calculo promedios y desviacion por centro de salud para cada uno de los controles del item confort
df5 %>%
group_by(Centro.Salud) %>%
summarise(n = n(),
"Promedio CF(control1)" = mean(CFC1),
"SD CF(control1)" = sd(CFC1),
"Promedio CF(control2)" = mean(CFC2),
"SD CF(control2)" = sd(CFC2) ,
"Mean CF(control3)" = mean(CFC3),
"SD CF(control3)" = sd(CFC3))
Calculo promedios y desviacion por centro de salud para cada uno de los controles del item autopercepcion estetica
df5 %>%
group_by(Centro.Salud) %>%
summarise(n = n(),
"Promedio AE(control1)" = mean(AEC1),
"SD AE(control1)" = sd(AEC1),
"Promedio AE(control2)" = mean(AEC2),
"SD AE(control2)" = sd(AEC2) ,
"Mean AE(control3)" = mean(AEC3),
"SD AE(control3)" = sd(AEC3))
Agrupo por sexo para cada uno de los controles del item higiene
df5 %>%
group_by(Sexo) %>%
summarise(n = n(),
"PromedioOH(control1)" = mean(HOC1),
"SD OH(control1)" = sd(HOC1),
"PromedioOH(control2)" = mean(HOC2),
"SD OH(control2)" = sd(HOC2) ,
"Mean_OH(control3)" = mean(HOC3),
"SD OH(control3)" = sd(HOC3))
Agrupo por sexo para cada uno de los controles del item confort
df5 %>%
group_by(Sexo) %>%
summarise(n = n(),
"Promedio CF(control1)" = mean(CFC1),
"SD CF(control1)" = sd(CFC1),
"Promedio CF(control2)" = mean(CFC2),
"SD CF(control2)" = sd(CFC2) ,
"Mean CF(control3)" = mean(CFC3),
"SD CF(control3)" = sd(CFC3))
Agrupo por sexo para cada uno de los controles del item autopercepcion
df5 %>%
group_by(Sexo) %>%
summarise(n = n(),
"Promedio AE(control1)" = mean(AEC1),
"SD AE(control1)" = sd(AEC1),
"Promedio AE(control2)" = mean(AEC2),
"SD AE(control2)" = sd(AEC2) ,
"Mean AE(control3)" = mean(AEC3),
"SD AE(control3)" = sd(AEC3))
Grafico para tipo de centro de salud y total del primer control
df5 %>%
ggplot(aes(x=Centro.Salud, y=TOTALC1, fill=Sexo)) +
scale_fill_manual(values=c("black", "blue")) +
geom_boxplot() +
geom_jitter() +
xlab("Centro de Salud") +
ylab("Puntaje encuesta") +
ggtitle("Puntaje total satisfaccion para primer control por centro de Salud") +
theme_economist() +
theme(legend.position = "right") +
scale_y_continuous(limits = c(0,50)) +
theme(axis.title.x = element_text(face="bold", vjust=-0.5, colour="black", size=rel(1))) +
theme(axis.title.y = element_text(face="bold", vjust=1.5, colour="black", size=rel(1))) +
scale_fill_discrete(name="Sexo", labels=c("Femenino","Masculino"))
Scale for 'fill' is already present. Adding another scale for 'fill', which will replace the
existing scale.
install.packages("nortest")
probando la URL 'https://cran.rstudio.com/bin/macosx/el-capitan/contrib/3.4/nortest_1.0-4.tgz'
Content type 'application/x-gzip' length 28699 bytes (28 KB)
==================================================
downloaded 28 KB
tar: Failed to set default locale
The downloaded binary packages are in
/var/folders/kk/vxjkvtsx4w13nnvfz58fmly40000gn/T//RtmpbAAv7n/downloaded_packages

Grafico para tipo de centro de salud y total del segundo control
df5 %>%
ggplot(aes(x=Centro.Salud, y=TOTALC2, fill=Sexo))+
geom_boxplot() +
geom_jitter() +
xlab("Centro de Salud") +
ylab("Puntaje encuesta") +
ggtitle("Puntaje total segundo control por centro de Salud") +
theme_economist() +
scale_y_continuous(limits = c(0,50))

Grafico para tipo de centro de salud y total del tercer control
df5 %>%
ggplot(aes(x=Centro.Salud, y=(TOTALC3), fill= Sexo)) +
geom_boxplot() +
geom_jitter() +
xlab("Centro de Salud") +
ylab("Puntaje encuesta") +
ggtitle("Puntaje total tercer control por centro de Salud") +
theme_economist() +
scale_y_continuous(limits = c(0,50))

Veo normalidad de mis datos
qqnorm(df5$TOTALC1, main = "Normalidad")

Shapito test para totalc1
shapiro.test(df5$TOTALC1)
Shapiro-Wilk normality test
data: df5$TOTALC1
W = 0.9, p-value = 0.02
test de anderson para totalC1
ad.test(df5$TOTALC1)
Anderson-Darling normality test
data: df5$TOTALC1
A = 0.8, p-value = 0.04
Existe diferencia entre centro de salud y la instalación en el primer control??
aov1 <- aov(df5$TOTALC1~df5$Centro.Salud)
summary(aov1)
Df Sum Sq Mean Sq F value Pr(>F)
df5$Centro.Salud 2 495 247.6 6.49 0.0044 **
Residuals 31 1183 38.2
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
TukeyHSD(aov1)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = df5$TOTALC1 ~ df5$Centro.Salud)
$`df5$Centro.Salud`
diff lwr upr p adj
Paillaco-Externo -0.36 -6 5.2 0.99
Privado-Externo -12.04 -21 -3.3 0.01
Privado-Paillaco -11.68 -20 -3.2 0.01
Lo mismo para prueba no parametrica
kruskal.test(df5$TOTALC1~df5$Centro.Salud)
Kruskal-Wallis rank sum test
data: df5$TOTALC1 by df5$Centro.Salud
Kruskal-Wallis chi-squared = 7, df = 2, p-value = 0.02
Existe diferencia entre centro de salud y la instalación en el segundo control??
aov2 <- aov(df5$TOTALC2~df5$Centro.Salud)
summary(aov2)
Df Sum Sq Mean Sq F value Pr(>F)
df5$Centro.Salud 2 261 130.7 3.78 0.034 *
Residuals 31 1071 34.5
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Lo mismo para prueba no parametrica
kruskal.test(df5$TOTALC2~df5$Centro.Salud)
Kruskal-Wallis rank sum test
data: df5$TOTALC2 by df5$Centro.Salud
Kruskal-Wallis chi-squared = 5, df = 2, p-value = 0.08
Existe diferencia entre centro de salud y la instalación en el segundo control??
aov3 <- aov(df5$TOTALC3~df5$Centro.Salud)
summary(aov3)
Df Sum Sq Mean Sq F value Pr(>F)
df5$Centro.Salud 2 101 50.3 1.06 0.36
Residuals 31 1478 47.7
Lo mismo para prueba no parametrica
kruskal.test(df5$TOTALC3~df5$Centro.Salud)
Kruskal-Wallis rank sum test
data: df5$TOTALC3 by df5$Centro.Salud
Kruskal-Wallis chi-squared = 1, df = 2, p-value = 0.6
Sumo por item los tres controles
df2 <- df5 %>%
mutate(SUMA_HO =HOC1 + HOC2 + HOC3, SUMA_CF= CFC1 + CFC2 + CFC3, SUMA_AE= AEC1 + AEC2 + AEC3)
Doy otra estructura a mi datos para los controles de higiene
long_df1 <- df2 %>%
select(Centro.Salud, Sexo, HOC1, HOC2,HOC3) %>%
gather(HOC1, HOC2,HOC3, key = "Higiene", value = "SUMA_HO")
Grafico item higiene oral (HO) por controles
long_df1 %>%
ggplot(aes(x=Higiene, y=SUMA_HO)) +
geom_boxplot() +
geom_jitter() +
xlab("Control por Higiene Oral") +
ylab("Puntaje HO") +
ggtitle("Puntaje de satisfaccion en HO") +
theme_economist() +
scale_y_continuous(limits = c(0,15))

Grafico item higiene oral (HO) por controles segun sexo

Existe diferencia entre el item de higiene y los diferentes controles ????
aov4 <- aov(long_df1$SUMA_HO~long_df1$Higiene)
summary(aov4)
Df Sum Sq Mean Sq F value Pr(>F)
long_df1$Higiene 2 0 0.03 0 1
Residuals 99 598 6.04
Lo mismo para no parametrico
kruskal.test(long_df1$Higiene~long_df1$SUMA_HO)
Kruskal-Wallis rank sum test
data: long_df1$Higiene by long_df1$SUMA_HO
Kruskal-Wallis chi-squared = 20, df = 10, p-value = 0.06
Doy otra estructura a mi datos para los controles confort
long_df2 <- df2 %>%
select(Centro.Salud, Sexo,CFC1, CFC2, CFC3) %>%
gather(CFC1, CFC2, CFC3, key = "Confort", value = "SUMA_CF")
Grafico item CF (confort) por controles
long_df2 %>%
ggplot(aes(x=Confort, y=SUMA_CF)) +
geom_boxplot() +
geom_jitter() +
xlab("Control por confort") +
ylab("Puntaje CF") +
ggtitle("Puntaje de satisfaccion en CF") +
theme_economist() +
scale_y_continuous(limits = c(0,20))

Grafico item CF (confort) por controles segun sexo

Existe diferencia entre el item de confort y los diferentes controles ????
aov5 <- aov(long_df2$SUMA_CF~long_df2$Confort)
summary(aov5)
Df Sum Sq Mean Sq F value Pr(>F)
long_df2$Confort 2 95 47.4 4.36 0.015 *
Residuals 99 1077 10.9
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Lo mismo para no parametricos
kruskal.test(long_df2$Confort~long_df2$SUMA_CF)
Kruskal-Wallis rank sum test
data: long_df2$Confort by long_df2$SUMA_CF
Kruskal-Wallis chi-squared = 20, df = 10, p-value = 0.3
Doy otra estructura a mi datos para los controles de autopercepcion
long_df3 <- df2 %>%
select(Centro.Salud, Sexo,AEC1, AEC2, AEC3) %>%
gather(AEC1, AEC2, AEC3, key = "Autopercepcion", value = "SUMA_AE")
Grafico item AE(autopercepcion estetica) por controles
long_df3 %>%
ggplot(aes(x=Autopercepcion, y=SUMA_AE)) +
geom_boxplot() +
geom_jitter() +
xlab("Control por autopercepcion") +
ylab("Puntaje AE") +
ggtitle("Puntaje de satisfaccion en AE") +
theme_economist() +
scale_y_continuous(limits = c(0,15))

Grafico item AE(autopercepcion estetica) por controles segun sexo

Grafico para autopercepcion por controles en barras pareadas
long_df3 %>%
ggplot(aes(x=Centro.Salud, y=Autopercepcion, fill= Autopercepcion)) +
geom_col() +
coord_flip() +
xlab("Centro de salud") +
ylab("Puntaje satisfaccion para autopercepcion") +
ggtitle("Puntaje de satisfaccion en AE en controles por centro de salud") +
theme_economist()

Existe diferencia entre el item de confort y los diferentes controles ????
aov6 <- aov(long_df3$SUMA_AE~long_df3$Autopercepcion)
summary(aov6)
Df Sum Sq Mean Sq F value Pr(>F)
long_df3$Autopercepcion 2 21 10.26 1.69 0.19
Residuals 99 600 6.06
Lo mismo para no parametricos
kruskal.test(long_df3$Autopercepcion~long_df3$SUMA_AE)
Kruskal-Wallis rank sum test
data: long_df3$Autopercepcion by long_df3$SUMA_AE
Kruskal-Wallis chi-squared = 10, df = 10, p-value = 0.4
