Cargar datos
alumnos <- read_csv("F:/SEMESTRE 2/Probabilidad_estadistica/datos/alumnos.genero.lentes.deporte.musica_ver_1.0.csv")
## Parsed with column specification:
## cols(
## obs = col_double(),
## genero = col_character(),
## lentes = col_character(),
## deporte = col_character(),
## musica = col_character()
## )
alumnos <- data.frame(alumnos) # Asegurarnos que es un df
alumnos
## obs genero lentes deporte musica
## 1 1 Mujer Si Si Si
## 2 2 Mujer Si Si Si
## 3 3 Mujer Si No Si
## 4 4 Mujer Si No Si
## 5 5 Mujer No Si Si
## 6 6 Mujer No Si Si
## 7 7 Mujer No No No
## 8 8 Mujer No No Si
## 9 9 Mujer No No Si
## 10 10 Mujer No No Si
## 11 11 Mujer No Si Si
## 12 12 Hombre No Si Si
## 13 13 Hombre Si Si Si
## 14 14 Hombre Si Si No
## 15 15 Hombre Si No Si
## 16 16 Hombre Si No Si
## 17 17 Hombre No No Si
## 18 18 Hombre No Si Si
## 19 19 Hombre No Si Si
## 20 20 Hombre No Si No
## 21 21 Hombre No No Si
## 22 22 Hombre No No No
## 23 23 Hombre No No Si
## 24 24 Hombre No No No
## 25 25 Hombre No No Si
## 26 26 Hombre No Si Si
## 27 27 Hombre No Si No
## 28 28 Hombre No Si Si
## 29 29 Hombre No Si Si
## 30 30 Hombre No Si Si
## 31 31 Hombre No Si No
## 32 32 Hombre No No Si
## 33 33 Hombre No No No
n <- nrow(alumnos)
Determinar frecuencias de cada variable
tablaFrecuencia.genero <- fdt_cat(alumnos$genero)
tablaFrecuencia.genero
## Category f rf rf(%) cf cf(%)
## Hombre 22 0.67 66.67 22 66.67
## Mujer 11 0.33 33.33 33 100.00
tablaFrecuencia.lentes <- fdt_cat(alumnos$lentes)
tablaFrecuencia.lentes
## Category f rf rf(%) cf cf(%)
## No 25 0.76 75.76 25 75.76
## Si 8 0.24 24.24 33 100.00
tablaFrecuencia.deporte <- fdt_cat(alumnos$deporte)
tablaFrecuencia.deporte
## Category f rf rf(%) cf cf(%)
## Si 17 0.52 51.52 17 51.52
## No 16 0.48 48.48 33 100.00
tablaFrecuencia.musica <- fdt_cat(alumnos$musica)
tablaFrecuencia.musica
## Category f rf rf(%) cf cf(%)
## Si 25 0.76 75.76 25 75.76
## No 8 0.24 24.24 33 100.00
Respuestas:
Pregunta 1: ¿Cual es la probabilidad de que una persona sea hombre?
cuantos <- filter(alumnos, genero == 'Hombre') %>%
select(genero)
cuantos
## genero
## 1 Hombre
## 2 Hombre
## 3 Hombre
## 4 Hombre
## 5 Hombre
## 6 Hombre
## 7 Hombre
## 8 Hombre
## 9 Hombre
## 10 Hombre
## 11 Hombre
## 12 Hombre
## 13 Hombre
## 14 Hombre
## 15 Hombre
## 16 Hombre
## 17 Hombre
## 18 Hombre
## 19 Hombre
## 20 Hombre
## 21 Hombre
## 22 Hombre
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que sea hombre es:
frecuencia
## [1] 66.66667
Pregunta 2: ¿Cual es la probabilidad de que una persona sea mujer?
cuantos <- filter(alumnos, genero == 'Mujer') %>%
select(genero)
cuantos
## genero
## 1 Mujer
## 2 Mujer
## 3 Mujer
## 4 Mujer
## 5 Mujer
## 6 Mujer
## 7 Mujer
## 8 Mujer
## 9 Mujer
## 10 Mujer
## 11 Mujer
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que sea mujer es:
frecuencia
## [1] 33.33333
Pregunta 3: ¿Cual es la probabilidad de que una persona use lentes?
cuantos <- filter(alumnos, lentes == 'Si') %>%
select(lentes)
cuantos
## lentes
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 Si
## 6 Si
## 7 Si
## 8 Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que una persona use lentes es:
frecuencia
## [1] 24.24242
Pregunta 4: ¿Cual es la probabilidad de que una persona le guste la música?
cuantos <- filter(alumnos, musica == 'Si') %>%
select(musica)
cuantos
## musica
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 Si
## 6 Si
## 7 Si
## 8 Si
## 9 Si
## 10 Si
## 11 Si
## 12 Si
## 13 Si
## 14 Si
## 15 Si
## 16 Si
## 17 Si
## 18 Si
## 19 Si
## 20 Si
## 21 Si
## 22 Si
## 23 Si
## 24 Si
## 25 Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica:
frecuencia
## [1] 75.75758
Pregunta 5: ¿Cuál es la probabilidad de que una persona le guste el deporte?
cuantos <- filter(alumnos, deporte == 'Si') %>%
select(deporte)
cuantos
## deporte
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 Si
## 6 Si
## 7 Si
## 8 Si
## 9 Si
## 10 Si
## 11 Si
## 12 Si
## 13 Si
## 14 Si
## 15 Si
## 16 Si
## 17 Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste el deporte:
frecuencia
## [1] 51.51515
Pregunta 6: ¿Cuál es la probabilidad de que una persona le guste el deporte y la música?
cuantos <- filter(alumnos, musica=='Si' & deporte == 'Si') %>%
select(musica, deporte)
cuantos
## musica deporte
## 1 Si Si
## 2 Si Si
## 3 Si Si
## 4 Si Si
## 5 Si Si
## 6 Si Si
## 7 Si Si
## 8 Si Si
## 9 Si Si
## 10 Si Si
## 11 Si Si
## 12 Si Si
## 13 Si Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste el deporte y la musica:
frecuencia
## [1] 39.39394
Pregunta 7: ¿Cuál es la probabilidad de que una persona le guste el deporte y sea hombre?
cuantos <- filter(alumnos, genero=='Hombre' & deporte == 'Si') %>%
select(genero, deporte)
cuantos
## genero deporte
## 1 Hombre Si
## 2 Hombre Si
## 3 Hombre Si
## 4 Hombre Si
## 5 Hombre Si
## 6 Hombre Si
## 7 Hombre Si
## 8 Hombre Si
## 9 Hombre Si
## 10 Hombre Si
## 11 Hombre Si
## 12 Hombre Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste el deporte y sea hombre:
frecuencia
## [1] 36.36364
¿Cuál es la probabilidad de que una persona le guste la música y sea hombre?
cuantos <- filter(alumnos, genero=='Hombre' & musica == 'Si') %>%
select(genero, musica)
cuantos
## genero musica
## 1 Hombre Si
## 2 Hombre Si
## 3 Hombre Si
## 4 Hombre Si
## 5 Hombre Si
## 6 Hombre Si
## 7 Hombre Si
## 8 Hombre Si
## 9 Hombre Si
## 10 Hombre Si
## 11 Hombre Si
## 12 Hombre Si
## 13 Hombre Si
## 14 Hombre Si
## 15 Hombre Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica y sea hombre:
frecuencia
## [1] 45.45455
Pregunta 8: ¿Cuál es la probabilidad de que una persona le guste la musica y use lentes además de que sea mujer?
cuantos <- filter(alumnos, genero=='Mujer' & musica == 'Si' & lentes == 'Si') %>%
select(genero, musica, lentes)
cuantos
## genero musica lentes
## 1 Mujer Si Si
## 2 Mujer Si Si
## 3 Mujer Si Si
## 4 Mujer Si Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica, use lentes y sea mujer:
frecuencia
## [1] 12.12121
Pregunta 9: ¿Cuál es la probabilidad de que una persona le guste la musica, use lentes y sea hombre?
cuantos <- filter(alumnos, genero=='Hombre' & musica == 'Si' & lentes == 'Si') %>%
select(genero, musica, lentes)
cuantos
## genero musica lentes
## 1 Hombre Si Si
## 2 Hombre Si Si
## 3 Hombre Si Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica, use lentes y sea hombre:
frecuencia
## [1] 9.090909
Pregunta 10: ¿Cuál es la probabilida de que una persona use lentes, sea mujer, le guste la música y el deporte también?
cuantos <- filter(alumnos, genero=='Mujer' & musica == 'Si' & lentes == 'Si' & deporte == 'Si') %>%
select(genero, musica, lentes, deporte)
cuantos
## genero musica lentes deporte
## 1 Mujer Si Si Si
## 2 Mujer Si Si Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica, use lentes, le guste el deporte y sea mujer:
frecuencia
## [1] 6.060606
Pregunta 11: ¿Cuál es la probabilida de que una persona use lentes, sea hombre, le guste la música y el deporte también?
cuantos <- filter(alumnos, genero=='Hombre' & musica == 'Si' & lentes == 'Si' & deporte == 'Si') %>%
select(genero, musica, lentes, deporte)
cuantos
## genero musica lentes deporte
## 1 Hombre Si Si Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica, use lentes, le guste el deporte y sea hombre:
frecuencia
## [1] 3.030303
Pregunta 12: ¿Cuál es la probabilida de que una persona use lentes, sea hombre, le guste deporte también?
cuantos <- filter(alumnos, genero=='Hombre' & deporte == 'Si' & lentes == 'Si') %>%
select(genero, deporte, lentes)
cuantos
## genero deporte lentes
## 1 Hombre Si Si
## 2 Hombre Si Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que una persona use lentes, le guste el deporte y sea hombre:
frecuencia
## [1] 6.060606
Pregunta 13: ¿Cuál es la probabilida de que una persona use lentes, sea mujer, le guste deporte también?
cuantos <- filter(alumnos, genero=='Mujer' & deporte == 'Si' & lentes == 'Si') %>%
select(genero, deporte, lentes)
cuantos
## genero deporte lentes
## 1 Mujer Si Si
## 2 Mujer Si Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste el deporte, use lentes y de mujer:
frecuencia
## [1] 6.060606
Pregunta 14: ¿Cuál es la probabilidad de que a una persona le guste el deporte?
cuantos <- filter(alumnos, deporte == 'Si') %>%
select(deporte)
cuantos
## deporte
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 Si
## 6 Si
## 7 Si
## 8 Si
## 9 Si
## 10 Si
## 11 Si
## 12 Si
## 13 Si
## 14 Si
## 15 Si
## 16 Si
## 17 Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste el deporte
frecuencia
## [1] 51.51515
Pregunta 15: ¿Cuál es la probabilidad de que una persona sea hombre o sea mujer?
cuantos <- filter(alumnos, genero=='Hombre') %>%
select(genero)
cuantos
## genero
## 1 Hombre
## 2 Hombre
## 3 Hombre
## 4 Hombre
## 5 Hombre
## 6 Hombre
## 7 Hombre
## 8 Hombre
## 9 Hombre
## 10 Hombre
## 11 Hombre
## 12 Hombre
## 13 Hombre
## 14 Hombre
## 15 Hombre
## 16 Hombre
## 17 Hombre
## 18 Hombre
## 19 Hombre
## 20 Hombre
## 21 Hombre
## 22 Hombre
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona sea hombre
frecuencia
## [1] 66.66667
cuantos <- filter(alumnos, genero=='Mujer') %>%
select(genero)
cuantos
## genero
## 1 Mujer
## 2 Mujer
## 3 Mujer
## 4 Mujer
## 5 Mujer
## 6 Mujer
## 7 Mujer
## 8 Mujer
## 9 Mujer
## 10 Mujer
## 11 Mujer
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona sea mujer
frecuencia
## [1] 33.33333
cuantos <- filter(alumnos, genero=='Mujer' || genero=='Hombres') %>%
select(genero)
cuantos
## genero
## 1 Mujer
## 2 Mujer
## 3 Mujer
## 4 Mujer
## 5 Mujer
## 6 Mujer
## 7 Mujer
## 8 Mujer
## 9 Mujer
## 10 Mujer
## 11 Mujer
## 12 Hombre
## 13 Hombre
## 14 Hombre
## 15 Hombre
## 16 Hombre
## 17 Hombre
## 18 Hombre
## 19 Hombre
## 20 Hombre
## 21 Hombre
## 22 Hombre
## 23 Hombre
## 24 Hombre
## 25 Hombre
## 26 Hombre
## 27 Hombre
## 28 Hombre
## 29 Hombre
## 30 Hombre
## 31 Hombre
## 32 Hombre
## 33 Hombre
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona sea hombre o mujer
frecuencia
## [1] 100
Analisis de los datos
Como podemos observar de entrada podemos darnos cuenta que contamos con cuatro variables: el genero de cada persona, si usa lentes o no, si le gusta la musica o no y si le gusta el depore o no. Con estas variables como vimos atravez de toda la practica sacamos distintos porcentajes que nos iban dando pequeños datos estadisticos, pero, ¿Cual es la utilidad de estos datos estadisiticos?, con estos datos estadisticos podemos darnos cuenta de las probabilidades y con ella intentar predecir el futuro mas probable, por ejemplo si sabemos que a mas personas les gusta la musica que el deporte podemos inferir que un evento musical tendria mas posibilidades de agradarle al publico estudiantil, pero si por el contrario sabemos que les gusta el deporte y ponemos un evento musical sabremos que tantas probabilidades tenemos de que aquel evento cause descontento, ademas podemos saber si tanto a mujeres como a hombres los podemos poner en mismo evento, ya que por genero pueden tener distintos gustos, tambien podemos ver cuanto porcentaje de alumnos usa lentes, con ello, conseguir un fondo para hacer examenes de vista a mas alumnos en caso de que necesiten lentes o por el contrario si saben que usan lentes, adaptar las clases para aquellas personas con menor vista.
Mas que nada estos datos nos permite predecir algo que pueda suceder a futuro con pura probabilidad en base a los datos, por lo que podriamos decir que esto es una estadistica inferencial basica, que si bien nos predice el futuro como tal, nos podemos dar una idea del presente y de que acciones podemos tomar sabiendo los riesgos y las probabilidades de exito.