New names:
Rows: 316 Columns: 21
── Column specification
──────────────────────────────────────────────────────── Delimiter: "," dbl
(21): ...1, RBC.Age.Group, Median.RBC.Age, Age, AA, FamHx, PVol, TVol, T...
ℹ Use `spec()` to retrieve the full column specification for this data. ℹ
Specify the column types or set `show_col_types = FALSE` to quiet this message.
• `` -> `...1`
library("RColorBrewer")
Resolución ejercicio 12.1
#Tabla de contingencia de variables a evaluartabx1 <-table(birthwt$race, birthwt$low)#Grafico con proporcionesbarplot(prop.table(tabx1,2), legend=rownames(tabx1), beside= T, ylab ="Proporción", names=c("Bajo peso","Peso estandar"),col=brewer.pal(n =3, name ="Accent"))
tabx1.1<-table(birthwt$ht, birthwt$low)#Grafico con proporcionesbarplot(prop.table(tabx1.1,2), legend=rownames(tabx1.1), beside= T, ylab ="Proporción", names=c("Bajo peso","Peso estandar"),col=brewer.pal(n =3, name ="Accent"))
#Test de F de Fisherfisher.test(tabx1.1, conf.int = T, conf.level =0.95)
Fisher's Exact Test for Count Data
data: tabx1.1
p-value = 0.05161
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.8679484 13.9894703
sample estimates:
odds ratio
3.340866
Resolución de ejercicio 12.3
#Tabla de contingencia de variables a evaluartabx1.3<-table(birthwt$race, birthwt$smoke)#Grafico con proporcionesbarplot(prop.table(tabx1.3,2), legend=rownames(tabx1.3), beside= T, ylab ="Proporción", names=c("No fuma","Fumador"),col=brewer.pal(n =3, name ="Accent"))
#Tabla de contingencia de variables a evaluartabx1.4<-table(birthwt$race, birthwt$low)#Grafico con proporcionesbarplot(prop.table(tabx1.4,2), legend=rownames(tabx1.4), beside= T, ylab ="Proporción", names=c("Bajo peso","Peso estandar"),col=brewer.pal(n =3, name ="Accent"))
#Test de F de Fisherfisher.test(tabx1.4, conf.int = T, conf.level =0.95)
Fisher's Exact Test for Count Data
data: tabx1.4
p-value = 0.07889
alternative hypothesis: two.sided
#conjunto de variables 2tabx1.1<-table(birthwt$ht, birthwt$low)#Grafico con proporcionesbarplot(prop.table(tabx1.1,2), legend=rownames(tabx1.1), beside= T, ylab ="Proporción", names=c("Bajo peso","Peso estandar"),col=brewer.pal(n =3, name ="Accent"))
#Test de F de Fisherfisher.test(tabx1.1, conf.int = T, conf.level =0.95)
Fisher's Exact Test for Count Data
data: tabx1.1
p-value = 0.05161
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.8679484 13.9894703
sample estimates:
odds ratio
3.340866
#conjunto de variables 3#Tabla de contingencia de variables a evaluartabx1.5<-table(birthwt$race, birthwt$smoke)#Grafico con proporcionesbarplot(prop.table(tabx1.5,2), legend=rownames(tabx1.5), beside= T, ylab ="Proporción", names=c("No fuma","Fumador"),col=brewer.pal(n =3, name ="Accent"))
#Test de F de Fisherfisher.test(tabx1.5, conf.int = T, conf.level =0.95)
Fisher's Exact Test for Count Data
data: tabx1.5
p-value = 9.799e-06
alternative hypothesis: two.sided
Resolución ejercicio 12.5
mosaicplot(prop.table(table(blood_storage$AA, blood_storage$Recurrence)),main="Relación del grupo etnico y remision del cancer de prostata", col=brewer.pal(n =3, name ="Accent"))
#Una vez observado el grafico de mosaico se puede observar una aparente relacion#Prueba de diferencias entre varaibles cualitativastabx1.6<-table(blood_storage$AA, blood_storage$Recurrence)#Grafico con proporcionesbarplot(prop.table(tabx1.6,2), legend=rownames(tabx1.6), beside= T, ylab ="Proporción", names=c("Otra raza","Afroamericano"), col =c(2:3))
chisq.test(tabx1.6)
Pearson's Chi-squared test with Yates' continuity correction
data: tabx1.6
X-squared = 2.6134, df = 1, p-value = 0.106
#Variables recurrencia y edad de muestra de sangretabx1.7<-table(blood_storage$RBC.Age.Group, blood_storage$Recurrence)#Grafico con proporcionesbarplot(prop.table(tabx1.7,2), legend=rownames(tabx1.7), beside= T, ylab ="Proporción", names=c("Sin remisión", "Remision"), col=brewer.pal(n =3, name ="Accent"))
data("Melanoma")#recodificacion de variablesMelanoma$status <-factor(Melanoma$status, levels =c(1,2,3),labels =c("Bajo", "Medio","Avanzado"))Melanoma$sex <-factor(Melanoma$sex, levels =c(0,1),labels =c("mujer", "hombre"))Melanoma$ulcer <-factor(Melanoma$ulcer, levels =c(0,1),labels =c("sin ulcera", "con ulcera"))#Realizar un corte hasta los 50 años en variable ageMelanoma$edad.1<-cut(Melanoma$age, breaks =c(0, 15, 25, 35, 50),labels =c("0-15", "15-25", "25-35", "35-50"),right = F, na.rm=TRUE) Melanoma$edad.1<-factor(Melanoma$edad.1)
Prueba de relación entre variables
#Influencia de variable age vs status?tabx1.9<-table(Melanoma$status, Melanoma$edad.1)#Grafico con proporcionesbarplot(prop.table(tabx1.9,2), legend=rownames(tabx1.9), beside= T, ylab ="Proporción", names=c("0-15", "15-25","25-35","35-50"), col=brewer.pal(n =3, name ="Accent"))
chisq.test(tabx1.9)
Warning in chisq.test(tabx1.9): Chi-squared approximation may be incorrect
Warning in chisq.test(tabx1.9): Chi-squared approximation may be incorrect
tabx2.9$observed
0-15 15-25 25-35 35-50
Bajo 1 2 5 12
Medio 2 7 14 39
Avanzado 0 0 0 2
tabx2.9$expected
0-15 15-25 25-35 35-50
Bajo 0.71428571 2.1428571 4.523810 12.619048
Medio 2.21428571 6.6428571 14.023810 39.119048
Avanzado 0.07142857 0.2142857 0.452381 1.261905
#hombres o mujeres con mayor mortalidadtabx1.10<-table(Melanoma$status, Melanoma$sex)#Grafico con proporcionesbarplot(prop.table(tabx1.10,2), legend=rownames(tabx1.10), beside= T, ylab ="Proporción", names=c("Hombre", "Mujer"), col=brewer.pal(n =3, name ="Accent"))
mujer hombre
Bajo 35.034146 21.965854
Medio 82.360976 51.639024
Avanzado 8.604878 5.395122
#Presencia o ausencia de ulceras vs statustabx1.11<-table(Melanoma$status, Melanoma$ulcer)#Grafico con proporcionesbarplot(prop.table(tabx1.11,2), legend=rownames(tabx1.11), beside= T, ylab ="Proporción", names=c("sin ulceras", "Con ulceras"), col=brewer.pal(n =3, name ="Accent"))
New names:
Rows: 254654 Columns: 9
── Column specification
──────────────────────────────────────────────────────── Delimiter: "," chr
(6): morekids, gender1, gender2, afam, hispanic, other dbl (3): ...1, age, work
ℹ Use `spec()` to retrieve the full column specification for this data. ℹ
Specify the column types or set `show_col_types = FALSE` to quiet this message.
• `` -> `...1`
Relación variable de fertilidad con otras cualitativas
#cambio de estructura de la variableFertility$morekids <-factor(Fertility$morekids)Fertility$afam <-factor(Fertility$afam)Fertility$hispanic <-factor(Fertility$hispanic)Fertility$other <-factor(Fertility$other)#Fertilidad vs grupo etnico#afroamericanotabx1.12<-table(Fertility$morekids, Fertility$afam)#Grafico con proporcionesbarplot(prop.table(tabx1.12,2), legend=rownames(tabx1.12), beside= T, ylab ="Proporción", names=c("Otra raza", "Afroamericano"), col=c(2:3))
chisq.test(tabx1.12)
Pearson's Chi-squared test with Yates' continuity correction
data: tabx1.12
X-squared = 352.23, df = 1, p-value < 2.2e-16
tabx2.12<-chisq.test(tabx1.12)tabx2.12$observed
no yes
no 150611 7131
yes 90887 6025
tabx2.12$expected
no yes
no 149592.69 8149.307
yes 91905.31 5006.693