Cargar librerías

library(readr)
library(dplyr)
library(fdth)

Cargar datos

alumnos <- read_csv("C:/Users/luisf/Documents/Probabilidad/Datos/alumnos.genero.lentes.deporte.musica.csv")
## Parsed with column specification:
## cols(
##   obs = col_double(),
##   genero = col_character(),
##   lentes = col_character(),
##   deporte = col_character(),
##   musica = col_character()
## )
alumnos <- data.frame(alumnos) # Asegurarnos que es un df
alumnos
##    obs genero lentes deporte musica
## 1    1  Mujer     Si      Si     Si
## 2    2  Mujer     Si      Si     Si
## 3    3  Mujer     Si      No     Si
## 4    4  Mujer     Si      No     Si
## 5    5  Mujer     No      Si     Si
## 6    6  Mujer     No      Si     Si
## 7    7  Mujer     No      No     No
## 8    8  Mujer     No      No     Si
## 9    9  Mujer     No      No     Si
## 10  10  Mujer     No      No     Si
## 11  11  Mujer     No      Si     Si
## 12  12 Hombre     No      Si     Si
## 13  13 Hombre     Si      Si     Si
## 14  14 Hombre     Si      Si     No
## 15  15 Hombre     Si      No     Si
## 16  16 Hombre     Si      No     Si
## 17  17 Hombre     No      No     Si
## 18  18 Hombre     No      Si     Si
## 19  19 Hombre     No      Si     Si
## 20  20 Hombre     No      SI     No
## 21  21 Hombre     No      No     Si
## 22  22 Hombre     No      No     No
## 23  23 Hombre     No      No     Si
## 24  24 Hombre     No      No     No
## 25  25 Hombre     No      No     Si
## 26  26 Hombre     No      Si     Si
## 27  27 Hombre     No      Si     No
## 28  28 Hombre     No      SI     Si
## 29  29 Hombre     No      Si     Si
## 30  30 Hombre     No      Si     Si
## 31  31 Hombre     No      Si     No
## 32  32 Hombre     No      No     Si
## 33  33 Hombre     No      No     No

Depurar datos

alumnos$genero <- as.factor(alumnos$genero)
alumnos$lentes <- as.factor(alumnos$lentes)
alumnos$deporte <- as.factor(alumnos$deporte)
alumnos$musica <- as.factor(alumnos$musica)

Limpiar los datos

# filter(alumnos, deporte= 'SI')
# Pendiente

Explorar datos

summary(alumnos)
##       obs        genero   lentes  deporte musica 
##  Min.   : 1   Hombre:22   No:25   No:16   No: 8  
##  1st Qu.: 9   Mujer :11   Si: 8   Si:15   Si:25  
##  Median :17                       SI: 2          
##  Mean   :17                                      
##  3rd Qu.:25                                      
##  Max.   :33

Determinar frecuencias de cada variable

tablaFrecuencia.genero <- fdt_cat(alumnos$genero)
tablaFrecuencia.genero
##  Category  f   rf rf(%) cf  cf(%)
##    Hombre 22 0.67 66.67 22  66.67
##     Mujer 11 0.33 33.33 33 100.00
tablaFrecuencia.lentes <- fdt_cat(alumnos$lentes)
tablaFrecuencia.lentes
##  Category  f   rf rf(%) cf  cf(%)
##        No 25 0.76 75.76 25  75.76
##        Si  8 0.24 24.24 33 100.00
tablaFrecuencia.deporte <- fdt_cat(alumnos$deporte)
tablaFrecuencia.deporte
##  Category  f   rf rf(%) cf  cf(%)
##        No 16 0.48 48.48 16  48.48
##        Si 15 0.45 45.45 31  93.94
##        SI  2 0.06  6.06 33 100.00

Análisis probabilístico