Cargar librerías
library(readr)
library(dplyr)
library(fdth)
Cargar datos
alumnos <- read_csv("C:/Users/luisf/Documents/Probabilidad/Datos/alumnos.genero.lentes.deporte.musica.csv")
## Parsed with column specification:
## cols(
## obs = col_double(),
## genero = col_character(),
## lentes = col_character(),
## deporte = col_character(),
## musica = col_character()
## )
alumnos <- data.frame(alumnos) # Asegurarnos que es un df
alumnos
## obs genero lentes deporte musica
## 1 1 Mujer Si Si Si
## 2 2 Mujer Si Si Si
## 3 3 Mujer Si No Si
## 4 4 Mujer Si No Si
## 5 5 Mujer No Si Si
## 6 6 Mujer No Si Si
## 7 7 Mujer No No No
## 8 8 Mujer No No Si
## 9 9 Mujer No No Si
## 10 10 Mujer No No Si
## 11 11 Mujer No Si Si
## 12 12 Hombre No Si Si
## 13 13 Hombre Si Si Si
## 14 14 Hombre Si Si No
## 15 15 Hombre Si No Si
## 16 16 Hombre Si No Si
## 17 17 Hombre No No Si
## 18 18 Hombre No Si Si
## 19 19 Hombre No Si Si
## 20 20 Hombre No SI No
## 21 21 Hombre No No Si
## 22 22 Hombre No No No
## 23 23 Hombre No No Si
## 24 24 Hombre No No No
## 25 25 Hombre No No Si
## 26 26 Hombre No Si Si
## 27 27 Hombre No Si No
## 28 28 Hombre No SI Si
## 29 29 Hombre No Si Si
## 30 30 Hombre No Si Si
## 31 31 Hombre No Si No
## 32 32 Hombre No No Si
## 33 33 Hombre No No No
Depurar datos
- Hacerlos tipo factor para que se puede sacar frecuencia
alumnos$genero <- as.factor(alumnos$genero)
alumnos$lentes <- as.factor(alumnos$lentes)
alumnos$deporte <- as.factor(alumnos$deporte)
alumnos$musica <- as.factor(alumnos$musica)
Limpiar los datos
- En la variable deporte modificar SI a Si
# filter(alumnos, deporte= 'SI')
# Pendiente
Explorar datos
summary(alumnos)
## obs genero lentes deporte musica
## Min. : 1 Hombre:22 No:25 No:16 No: 8
## 1st Qu.: 9 Mujer :11 Si: 8 Si:15 Si:25
## Median :17 SI: 2
## Mean :17
## 3rd Qu.:25
## Max. :33
Determinar frecuencias de cada variable
tablaFrecuencia.genero <- fdt_cat(alumnos$genero)
tablaFrecuencia.genero
## Category f rf rf(%) cf cf(%)
## Hombre 22 0.67 66.67 22 66.67
## Mujer 11 0.33 33.33 33 100.00
tablaFrecuencia.lentes <- fdt_cat(alumnos$lentes)
tablaFrecuencia.lentes
## Category f rf rf(%) cf cf(%)
## No 25 0.76 75.76 25 75.76
## Si 8 0.24 24.24 33 100.00
tablaFrecuencia.deporte <- fdt_cat(alumnos$deporte)
tablaFrecuencia.deporte
## Category f rf rf(%) cf cf(%)
## No 16 0.48 48.48 16 48.48
## Si 15 0.45 45.45 31 93.94
## SI 2 0.06 6.06 33 100.00
Análisis probabilístico
- ¿Cual es la probabilidad de que una persona sea Hombre?
- ¿Cual es la probabilidad de que una persona sea Mujer?
- ¿Cual es la probabilidad de que una persona use lentes?
- ¿Cual es la probabilidad de que una persona le guste la música?
- ¿Cual es la probabilidad de que una persona le guste el deporte?
- ¿Cual es la probabilidad de que una persona le guste el deporte y la música?
- ¿Cual es la probabilidad de que una persona le guste el deporte y sea Hombre?
- ¿Cual es la probabilidad de que una persona le guste la musica use lentes?
- ¿Cual es la probabilidad de que una persona le guste la musica, use lentes y sea mujer?
- ¿Cual es la probabilidad de que una persona sea hombre y sea mujer?