—————————————–

EQUIPO NUMERO 3

19041231 Osiris Ochoa Solis
19041239 Elias Jr. Ramos Lopez
19041216 Frida Krystel Herrera Hernández
19041198 Marco Daniel De La Torre Mendia
19041206 Irving alonso Galvan carabez

—————————————–

Cargar librerias

Tener descargas las librerias usadas

library(readr)
library(dplyr)
library(fdth)

Cargar datos

alumnos <- read_csv("F:/SEMESTRE 2/Probabilidad_estadistica/datos/alumnos.genero.lentes.deporte.musica_ver_1.0.csv")
## Parsed with column specification:
## cols(
##   obs = col_double(),
##   genero = col_character(),
##   lentes = col_character(),
##   deporte = col_character(),
##   musica = col_character()
## )
alumnos <- data.frame(alumnos) # Asegurarnos que es un df
alumnos
##    obs genero lentes deporte musica
## 1    1  Mujer     Si      Si     Si
## 2    2  Mujer     Si      Si     Si
## 3    3  Mujer     Si      No     Si
## 4    4  Mujer     Si      No     Si
## 5    5  Mujer     No      Si     Si
## 6    6  Mujer     No      Si     Si
## 7    7  Mujer     No      No     No
## 8    8  Mujer     No      No     Si
## 9    9  Mujer     No      No     Si
## 10  10  Mujer     No      No     Si
## 11  11  Mujer     No      Si     Si
## 12  12 Hombre     No      Si     Si
## 13  13 Hombre     Si      Si     Si
## 14  14 Hombre     Si      Si     No
## 15  15 Hombre     Si      No     Si
## 16  16 Hombre     Si      No     Si
## 17  17 Hombre     No      No     Si
## 18  18 Hombre     No      Si     Si
## 19  19 Hombre     No      Si     Si
## 20  20 Hombre     No      Si     No
## 21  21 Hombre     No      No     Si
## 22  22 Hombre     No      No     No
## 23  23 Hombre     No      No     Si
## 24  24 Hombre     No      No     No
## 25  25 Hombre     No      No     Si
## 26  26 Hombre     No      Si     Si
## 27  27 Hombre     No      Si     No
## 28  28 Hombre     No      Si     Si
## 29  29 Hombre     No      Si     Si
## 30  30 Hombre     No      Si     Si
## 31  31 Hombre     No      Si     No
## 32  32 Hombre     No      No     Si
## 33  33 Hombre     No      No     No
n <- nrow(alumnos) 

Depurar datos

alumnos$genero <- as.factor(alumnos$genero)
alumnos$lentes <- as.factor(alumnos$lentes)
alumnos$deporte <- as.factor(alumnos$deporte)
alumnos$musica <- as.factor(alumnos$musica)

Limpiar los datos

# Ya vienen homogéneos, consistentes, ... limpios, desde origen

Explorar datos

summary(alumnos)
##       obs        genero   lentes  deporte musica 
##  Min.   : 1   Hombre:22   No:25   No:16   No: 8  
##  1st Qu.: 9   Mujer :11   Si: 8   Si:17   Si:25  
##  Median :17                                      
##  Mean   :17                                      
##  3rd Qu.:25                                      
##  Max.   :33

Determinar frecuencias de cada variable

tablaFrecuencia.genero <- fdt_cat(alumnos$genero)
tablaFrecuencia.genero
##  Category  f   rf rf(%) cf  cf(%)
##    Hombre 22 0.67 66.67 22  66.67
##     Mujer 11 0.33 33.33 33 100.00
tablaFrecuencia.lentes <- fdt_cat(alumnos$lentes)
tablaFrecuencia.lentes
##  Category  f   rf rf(%) cf  cf(%)
##        No 25 0.76 75.76 25  75.76
##        Si  8 0.24 24.24 33 100.00
tablaFrecuencia.deporte <- fdt_cat(alumnos$deporte)
tablaFrecuencia.deporte
##  Category  f   rf rf(%) cf  cf(%)
##        Si 17 0.52 51.52 17  51.52
##        No 16 0.48 48.48 33 100.00
tablaFrecuencia.musica <- fdt_cat(alumnos$musica)
tablaFrecuencia.musica
##  Category  f   rf rf(%) cf  cf(%)
##        Si 25 0.76 75.76 25  75.76
##        No  8 0.24 24.24 33 100.00

—————————————

Análisis probabilístico

Respuestas:

Pregunta 1: ¿Cual es la probabilidad de que una persona sea hombre?
cuantos <- filter(alumnos,  genero == 'Hombre')  %>% 
  select(genero)

cuantos
##    genero
## 1  Hombre
## 2  Hombre
## 3  Hombre
## 4  Hombre
## 5  Hombre
## 6  Hombre
## 7  Hombre
## 8  Hombre
## 9  Hombre
## 10 Hombre
## 11 Hombre
## 12 Hombre
## 13 Hombre
## 14 Hombre
## 15 Hombre
## 16 Hombre
## 17 Hombre
## 18 Hombre
## 19 Hombre
## 20 Hombre
## 21 Hombre
## 22 Hombre
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que sea hombre es:
frecuencia
## [1] 66.66667
Pregunta 2: ¿Cual es la probabilidad de que una persona sea mujer?
cuantos <- filter(alumnos,  genero == 'Mujer')  %>% 
  select(genero)

cuantos
##    genero
## 1   Mujer
## 2   Mujer
## 3   Mujer
## 4   Mujer
## 5   Mujer
## 6   Mujer
## 7   Mujer
## 8   Mujer
## 9   Mujer
## 10  Mujer
## 11  Mujer
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que sea mujer es:
frecuencia
## [1] 33.33333
Pregunta 3: ¿Cual es la probabilidad de que una persona use lentes?
cuantos <- filter(alumnos,  lentes == 'Si')  %>% 
  select(lentes)

cuantos
##   lentes
## 1     Si
## 2     Si
## 3     Si
## 4     Si
## 5     Si
## 6     Si
## 7     Si
## 8     Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que una persona use lentes es:
frecuencia
## [1] 24.24242
Pregunta 4: ¿Cual es la probabilidad de que una persona le guste la música?
cuantos <- filter(alumnos,  musica == 'Si')  %>% 
  select(musica)

cuantos
##    musica
## 1      Si
## 2      Si
## 3      Si
## 4      Si
## 5      Si
## 6      Si
## 7      Si
## 8      Si
## 9      Si
## 10     Si
## 11     Si
## 12     Si
## 13     Si
## 14     Si
## 15     Si
## 16     Si
## 17     Si
## 18     Si
## 19     Si
## 20     Si
## 21     Si
## 22     Si
## 23     Si
## 24     Si
## 25     Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica:
frecuencia
## [1] 75.75758
Pregunta 5: ¿Cuál es la probabilidad de que una persona le guste el deporte?
cuantos <- filter(alumnos,  deporte == 'Si')  %>% 
  select(deporte)

cuantos
##    deporte
## 1       Si
## 2       Si
## 3       Si
## 4       Si
## 5       Si
## 6       Si
## 7       Si
## 8       Si
## 9       Si
## 10      Si
## 11      Si
## 12      Si
## 13      Si
## 14      Si
## 15      Si
## 16      Si
## 17      Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste el deporte:
frecuencia
## [1] 51.51515
Pregunta 6: ¿Cuál es la probabilidad de que una persona le guste el deporte y la música?
cuantos <- filter(alumnos, musica=='Si' & deporte == 'Si')  %>% 
  select(musica, deporte)

cuantos
##    musica deporte
## 1      Si      Si
## 2      Si      Si
## 3      Si      Si
## 4      Si      Si
## 5      Si      Si
## 6      Si      Si
## 7      Si      Si
## 8      Si      Si
## 9      Si      Si
## 10     Si      Si
## 11     Si      Si
## 12     Si      Si
## 13     Si      Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste el deporte y la musica:
frecuencia
## [1] 39.39394
Pregunta 7: ¿Cuál es la probabilidad de que una persona le guste el deporte y sea hombre?
cuantos <- filter(alumnos, genero=='Hombre' & deporte == 'Si')  %>% 
  select(genero, deporte)

cuantos
##    genero deporte
## 1  Hombre      Si
## 2  Hombre      Si
## 3  Hombre      Si
## 4  Hombre      Si
## 5  Hombre      Si
## 6  Hombre      Si
## 7  Hombre      Si
## 8  Hombre      Si
## 9  Hombre      Si
## 10 Hombre      Si
## 11 Hombre      Si
## 12 Hombre      Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste el deporte y sea hombre:
frecuencia
## [1] 36.36364
¿Cuál es la probabilidad de que una persona le guste la música y sea hombre?
cuantos <- filter(alumnos, genero=='Hombre' & musica == 'Si')  %>% 
  select(genero, musica)

cuantos
##    genero musica
## 1  Hombre     Si
## 2  Hombre     Si
## 3  Hombre     Si
## 4  Hombre     Si
## 5  Hombre     Si
## 6  Hombre     Si
## 7  Hombre     Si
## 8  Hombre     Si
## 9  Hombre     Si
## 10 Hombre     Si
## 11 Hombre     Si
## 12 Hombre     Si
## 13 Hombre     Si
## 14 Hombre     Si
## 15 Hombre     Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica y sea hombre:
frecuencia
## [1] 45.45455
Pregunta 8: ¿Cuál es la probabilidad de que una persona le guste la musica y use lentes además de que sea mujer?
cuantos <- filter(alumnos, genero=='Mujer' & musica == 'Si' & lentes == 'Si')  %>% 
  select(genero, musica, lentes)

cuantos
##   genero musica lentes
## 1  Mujer     Si     Si
## 2  Mujer     Si     Si
## 3  Mujer     Si     Si
## 4  Mujer     Si     Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica, use lentes y sea mujer:
frecuencia
## [1] 12.12121
Pregunta 9: ¿Cuál es la probabilidad de que una persona le guste la musica, use lentes y sea hombre?
cuantos <- filter(alumnos, genero=='Hombre' & musica == 'Si' & lentes == 'Si')  %>% 
  select(genero, musica, lentes)

cuantos
##   genero musica lentes
## 1 Hombre     Si     Si
## 2 Hombre     Si     Si
## 3 Hombre     Si     Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica, use lentes y sea hombre:
frecuencia
## [1] 9.090909
Pregunta 10: ¿Cuál es la probabilida de que una persona use lentes, sea mujer, le guste la música y el deporte también?
cuantos <- filter(alumnos, genero=='Mujer' & musica == 'Si' & lentes == 'Si' & deporte == 'Si')  %>% 
  select(genero, musica, lentes, deporte)

cuantos
##   genero musica lentes deporte
## 1  Mujer     Si     Si      Si
## 2  Mujer     Si     Si      Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica, use lentes, le guste el deporte y sea mujer:
frecuencia
## [1] 6.060606
Pregunta 11: ¿Cuál es la probabilida de que una persona use lentes, sea hombre, le guste la música y el deporte también?
cuantos <- filter(alumnos, genero=='Hombre' & musica == 'Si' & lentes == 'Si' & deporte == 'Si')  %>% 
  select(genero, musica, lentes, deporte)

cuantos
##   genero musica lentes deporte
## 1 Hombre     Si     Si      Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste la musica, use lentes, le guste el deporte y sea hombre:
frecuencia
## [1] 3.030303
Pregunta 12: ¿Cuál es la probabilida de que una persona use lentes, sea hombre, le guste deporte también?
cuantos <- filter(alumnos, genero=='Hombre' & deporte == 'Si' & lentes == 'Si')  %>% 
  select(genero, deporte, lentes)

cuantos
##   genero deporte lentes
## 1 Hombre      Si     Si
## 2 Hombre      Si     Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que una persona use lentes, le guste el deporte y sea hombre:
frecuencia
## [1] 6.060606
Pregunta 13: ¿Cuál es la probabilida de que una persona use lentes, sea mujer, le guste deporte también?
cuantos <- filter(alumnos, genero=='Mujer' & deporte == 'Si' & lentes == 'Si')  %>% 
  select(genero, deporte, lentes)

cuantos
##   genero deporte lentes
## 1  Mujer      Si     Si
## 2  Mujer      Si     Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste el deporte, use lentes y de mujer:
frecuencia
## [1] 6.060606
Pregunta 14: ¿Cuál es la probabilidad de que a una persona le guste el deporte?
cuantos <- filter(alumnos, deporte == 'Si')  %>% 
  select(deporte)

cuantos
##    deporte
## 1       Si
## 2       Si
## 3       Si
## 4       Si
## 5       Si
## 6       Si
## 7       Si
## 8       Si
## 9       Si
## 10      Si
## 11      Si
## 12      Si
## 13      Si
## 14      Si
## 15      Si
## 16      Si
## 17      Si
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona le guste el deporte
frecuencia
## [1] 51.51515
Pregunta 15: ¿Cuál es la probabilidad de que una persona sea hombre o sea mujer?
cuantos <- filter(alumnos, genero=='Hombre')  %>% 
  select(genero)

cuantos
##    genero
## 1  Hombre
## 2  Hombre
## 3  Hombre
## 4  Hombre
## 5  Hombre
## 6  Hombre
## 7  Hombre
## 8  Hombre
## 9  Hombre
## 10 Hombre
## 11 Hombre
## 12 Hombre
## 13 Hombre
## 14 Hombre
## 15 Hombre
## 16 Hombre
## 17 Hombre
## 18 Hombre
## 19 Hombre
## 20 Hombre
## 21 Hombre
## 22 Hombre
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona sea hombre
frecuencia
## [1] 66.66667
cuantos <- filter(alumnos, genero=='Mujer')  %>% 
  select(genero)

cuantos
##    genero
## 1   Mujer
## 2   Mujer
## 3   Mujer
## 4   Mujer
## 5   Mujer
## 6   Mujer
## 7   Mujer
## 8   Mujer
## 9   Mujer
## 10  Mujer
## 11  Mujer
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona sea mujer
frecuencia
## [1] 33.33333
cuantos <- filter(alumnos, genero=='Mujer' || genero=='Hombres')  %>% 
  select(genero)

cuantos
##    genero
## 1   Mujer
## 2   Mujer
## 3   Mujer
## 4   Mujer
## 5   Mujer
## 6   Mujer
## 7   Mujer
## 8   Mujer
## 9   Mujer
## 10  Mujer
## 11  Mujer
## 12 Hombre
## 13 Hombre
## 14 Hombre
## 15 Hombre
## 16 Hombre
## 17 Hombre
## 18 Hombre
## 19 Hombre
## 20 Hombre
## 21 Hombre
## 22 Hombre
## 23 Hombre
## 24 Hombre
## 25 Hombre
## 26 Hombre
## 27 Hombre
## 28 Hombre
## 29 Hombre
## 30 Hombre
## 31 Hombre
## 32 Hombre
## 33 Hombre
frecuencia <- nrow(cuantos) / n * 100
# La probabilidad de que a una persona sea hombre o mujer
frecuencia
## [1] 100

Analisis de los datos

Como podemos observar de entrada podemos darnos cuenta que contamos con cuatro variables: el genero de cada persona, si usa lentes o no, si le gusta la musica o no y si le gusta el depore o no. Con estas variables como vimos atravez de toda la practica sacamos distintos porcentajes que nos iban dando pequeños datos estadisticos, pero, ¿Cual es la utilidad de estos datos estadisiticos?, con estos datos estadisticos podemos darnos cuenta de las probabilidades y con ella intentar predecir el futuro mas probable, por ejemplo si sabemos que a mas personas les gusta la musica que el deporte podemos inferir que un evento musical tendria mas posibilidades de agradarle al publico estudiantil, pero si por el contrario sabemos que les gusta el deporte y ponemos un evento musical sabremos que tantas probabilidades tenemos de que aquel evento cause descontento, ademas podemos saber si tanto a mujeres como a hombres los podemos poner en mismo evento, ya que por genero pueden tener distintos gustos, tambien podemos ver cuanto porcentaje de alumnos usa lentes, con ello, conseguir un fondo para hacer examenes de vista a mas alumnos en caso de que necesiten lentes o por el contrario si saben que usan lentes, adaptar las clases para aquellas personas con menor vista.

Mas que nada estos datos nos permite predecir algo que pueda suceder a futuro con pura probabilidad en base a los datos, por lo que podriamos decir que esto es una estadistica inferencial basica, que si bien nos predice el futuro como tal, nos podemos dar una idea del presente y de que acciones podemos tomar sabiendo los riesgos y las probabilidades de exito.