Parcial-Ana-y-Paula.knit

Pregunta 1

Porcentaje de hombres con Estudios Universitarios y cantidad total de mujeres participantes

hombres_total <- datos_p%>%filter(Genero =="Masculino")
hombres_uni <- hombres_total %>% filter(NivelEducativo == "Universitario")
aux <- table(datos_p$Genero, datos_p$NivelEducativo)
porcentajes_fila <- prop.table(aux, margin = 1) * 100
porcentaje_hombres_uni <- porcentajes_fila["Masculino", "Universitario"]
cat("El % de los hombres tiene estudios universitarios.", porcentaje_hombres_uni)

## El % de los hombres tiene estudios universitarios. 32.65306

total_mujeres <- nrow(filter(datos_p, Genero == "Femenino"))

cat("La cantidad total de mujeres participantes es:", total_mujeres, "\n")

## La cantidad total de mujeres participantes es: 59

#Pregunta 2 El grupo con mayor estatura promedio es “Otro”, seguido por los hombres, y finalmente las mujeres. Las diferencias no son extremas, pero la mediana claramente distingue niveles. No hay evidencia clara de outliers, y las estaturas están dentro de un rango saludable y razonablemente homogéneo.

boxplot(datos_p$Estatura ~ datos_p$Genero, xlab = "Género", ylab="Estatura", main = "Diagrama de caja y bigotes pregunta 2", col =c("deeppink", "goldenrod1", "pink"))

#3A TABLA DE FRECUENCIA

parcial1<- table(datos_p$Hermanos) 
parcial1

## 
##  0  1  2  3  4  5  6 
## 34 14 15 24 26 21 26

barplot(parcial1, col = c("goldenrod1","deeppink","gold","pink"),
        horiz=FALSE, density= NULL ,ylab= "Frecuencia absoluta" , border = TRUE,
        ylim=c(0,40),xlab="Hermanos",main=" Gráfico de barras para Hermanos")

#3B

library(plotrix)
tablane <- table(datos_p$NivelEducativo)
pie3D(tablane, col = c("pink","gold","goldenrod1","deeppink"),
      start=0, radius = 1.1,
      explode=0, height=0.1
      ,labelcex = 1,theta=pi/3,
      main="Diagrama de Torta",labels= c("Primaria", 
      "Secundaria", "Técnico", "Universitario"))

#3C #TABLA DE FREC

tabla1 <- fdt(datos_p$HorasDeTrabajo)
tabla_frec <- as.data.frame(tabla1$table)
colnames(tabla_frec) <- c("Intervalo", "Frecuencia", "Frecuencia Relativa", 
                          "Frecuencia Acumulada", "Frecuencia Relativa Acumulada")
kable(tabla_frec, caption = "Tabla de frecuencia (horas de trabajo)")

Tabla de frecuencia (horas de trabajo)
Intervalo	Frecuencia	Frecuencia Relativa	Frecuencia Acumulada	Frecuencia Relativa Acumulada	NA
[16.137,21.549)	7	0.04375	4.375	7	4.375
[21.549,26.96)	14	0.08750	8.750	21	13.125
[26.96,32.372)	14	0.08750	8.750	35	21.875
[32.372,37.784)	31	0.19375	19.375	66	41.250
[37.784,43.195)	29	0.18125	18.125	95	59.375
[43.195,48.607)	40	0.25000	25.000	135	84.375
[48.607,54.019)	18	0.11250	11.250	153	95.625
[54.019,59.43)	4	0.02500	2.500	157	98.125
[59.43,64.842)	3	0.01875	1.875	160	100.000

#histograma

tabla1 <- fdt(datos_p$HorasDeTrabajo)
tabla_frec <- as.data.frame(tabla1$table)
plot(tabla1, xlab = "Horas de Trabajo", ylab = "Frecuencia", col = "pink")

#POLIGONO DE FRECUENCIA

tabla1 <- fdt(datos_p$HorasDeTrabajo)
tabla_frec <- as.data.frame(tabla1$table)
plot(tabla1, type = "fp", xlab = "Horas de Trabajo", ylab = "Frecuencia", col = "gold")