Isrrael Contreras Edgar Soto *Jesus Vergara ###probabilidades alumnos lentes deporte musica ver 2.0 Determinar probabilidades Obtener probabilidades de que un alumno tenga ciertas características mediante la frecuencia Se utilizan los datos de alumnos ver 2.0
library(readr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
##Cargar Datos
alumnos <- read_csv("alumnos.genero.lentes.deporte.musica_ver_2.0.csv")
## Parsed with column specification:
## cols(
## obs = col_double(),
## mujer = col_character(),
## hombre = col_character(),
## lentes = col_character(),
## deporte = col_character(),
## musica = col_character()
## )
alumnos <- data.frame(alumnos) # Asegurarnos que es un df
alumnos
## obs mujer hombre lentes deporte musica
## 1 1 Si No Si Si Si
## 2 2 Si No Si Si Si
## 3 3 Si No Si No Si
## 4 4 Si No Si No Si
## 5 5 Si No No Si Si
## 6 6 Si No No Si Si
## 7 7 Si No No No No
## 8 8 Si No No No Si
## 9 9 Si No No No Si
## 10 10 Si No No No Si
## 11 11 Si No No Si Si
## 12 12 No Si No Si Si
## 13 13 No Si Si Si Si
## 14 14 No Si Si Si No
## 15 15 No Si Si No Si
## 16 16 No Si Si No Si
## 17 17 No Si No No Si
## 18 18 No Si No Si Si
## 19 19 No Si No Si Si
## 20 20 No Si No Si No
## 21 21 No Si No No Si
## 22 22 No Si No No No
## 23 23 No Si No No Si
## 24 24 No Si No No No
## 25 25 No Si No No Si
## 26 26 No Si No Si Si
## 27 27 No Si No Si No
## 28 28 No Si No Si Si
## 29 29 No Si No Si Si
## 30 30 No Si No Si Si
## 31 31 No Si No Si No
## 32 32 No Si No No Si
## 33 33 No Si No No No
## 34 34 Si No Si No Si
## 35 35 No Si Si Si No
## 36 36 No Si No No Si
## 37 36 No Si Si No Si
## 38 38 Si No Si No Si
## 39 39 No Si No Si No
## 40 40 No Si No Si Si
## 41 41 Si No Si No Si
n <- nrow(alumnos) # Número de observaciones o registros
Depurar datos *Hacerlos tipo factor para que se puede sacar frecuencia
alumnos$mujer <- as.factor(alumnos$mujer)
alumnos$hombre <- as.factor(alumnos$hombre)
alumnos$lentes <- as.factor(alumnos$lentes)
alumnos$deporte <- as.factor(alumnos$deporte)
alumnos$musica <- as.factor(alumnos$musica)
#Explorar datos
summary(alumnos)
## obs mujer hombre lentes deporte musica
## Min. : 1.00 No:27 No:14 No:28 No:21 No:10
## 1st Qu.:11.00 Si:14 Si:27 Si:13 Si:20 Si:31
## Median :21.00
## Mean :20.98
## 3rd Qu.:31.00
## Max. :41.00
#Determinar frecuencias de cada variable
tablaFrecuencia.mujer <- fdt_cat(alumnos$mujer)
tablaFrecuencia.mujer
## Category f rf rf(%) cf cf(%)
## No 27 0.66 65.85 27 65.85
## Si 14 0.34 34.15 41 100.00
tablaFrecuencia.hombre <- fdt_cat(alumnos$hombre)
tablaFrecuencia.hombre
## Category f rf rf(%) cf cf(%)
## Si 27 0.66 65.85 27 65.85
## No 14 0.34 34.15 41 100.00
tablaFrecuencia.lentes <- fdt_cat(alumnos$lentes)
tablaFrecuencia.lentes
## Category f rf rf(%) cf cf(%)
## No 28 0.68 68.29 28 68.29
## Si 13 0.32 31.71 41 100.00
tablaFrecuencia.deporte <- fdt_cat(alumnos$deporte)
tablaFrecuencia.deporte
## Category f rf rf(%) cf cf(%)
## No 21 0.51 51.22 21 51.22
## Si 20 0.49 48.78 41 100.00
tablaFrecuencia.musica <- fdt_cat(alumnos$musica)
tablaFrecuencia.musica
## Category f rf rf(%) cf cf(%)
## Si 31 0.76 75.61 31 75.61
## No 10 0.24 24.39 41 100.00
#Análisis probabilístico ##¿Cual es la probabilidad de que una persona sea hombre?
cuantos <- filter(alumnos,hombre == 'Si') %>%
select(hombre)
cuantos
## hombre
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 Si
## 6 Si
## 7 Si
## 8 Si
## 9 Si
## 10 Si
## 11 Si
## 12 Si
## 13 Si
## 14 Si
## 15 Si
## 16 Si
## 17 Si
## 18 Si
## 19 Si
## 20 Si
## 21 Si
## 22 Si
## 23 Si
## 24 Si
## 25 Si
## 26 Si
## 27 Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 65.85366
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona sea hombre "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 27 casos de que una persona sea hombre de 41
## observaciones que representan una probabilidad del 65.8537 %
##¿Cual es la probabilidad de que una persona sea mujer?
cuantos <- filter(alumnos,mujer == 'Si') %>%
select(mujer)
cuantos
## mujer
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 Si
## 6 Si
## 7 Si
## 8 Si
## 9 Si
## 10 Si
## 11 Si
## 12 Si
## 13 Si
## 14 Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 34.14634
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona sea mujer "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 14 casos de que una persona sea mujer de 41
## observaciones que representan una probabilidad del 34.1463 %
##¿Cual es la probabilidad de que una persona use lentes?
cuantos <- filter(alumnos,lentes == 'Si') %>%
select(lentes)
cuantos
## lentes
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 Si
## 6 Si
## 7 Si
## 8 Si
## 9 Si
## 10 Si
## 11 Si
## 12 Si
## 13 Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 31.70732
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona use lentes "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 13 casos de que una persona use lentes de 41
## observaciones que representan una probabilidad del 31.7073 %
##¿Cual es la probabilidad de que una persona le guste la musica?
cuantos <- filter(alumnos,musica == 'Si') %>%
select(musica)
cuantos
## musica
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 Si
## 6 Si
## 7 Si
## 8 Si
## 9 Si
## 10 Si
## 11 Si
## 12 Si
## 13 Si
## 14 Si
## 15 Si
## 16 Si
## 17 Si
## 18 Si
## 19 Si
## 20 Si
## 21 Si
## 22 Si
## 23 Si
## 24 Si
## 25 Si
## 26 Si
## 27 Si
## 28 Si
## 29 Si
## 30 Si
## 31 Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 75.60976
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la musica "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 31 casos de que una persona le guste la musica de 41
## observaciones que representan una probabilidad del 75.6098 %
##¿Cual es la probabilidad de que una persona le guste el deporte?
cuantos <- filter(alumnos,deporte == 'Si') %>%
select(deporte)
cuantos
## deporte
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 Si
## 6 Si
## 7 Si
## 8 Si
## 9 Si
## 10 Si
## 11 Si
## 12 Si
## 13 Si
## 14 Si
## 15 Si
## 16 Si
## 17 Si
## 18 Si
## 19 Si
## 20 Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 48.78049
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona le guste el deporte "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 20 casos de que una persona le guste el deporte de 41
## observaciones que representan una probabilidad del 48.7805 %
##¿Cual es la probabilidad de que una persona le guste el deporte y la musica?
cuantos <- filter(alumnos,musica == 'Si' & deporte == 'Si' ) %>%
select(musica,deporte)
cuantos
## musica deporte
## 1 Si Si
## 2 Si Si
## 3 Si Si
## 4 Si Si
## 5 Si Si
## 6 Si Si
## 7 Si Si
## 8 Si Si
## 9 Si Si
## 10 Si Si
## 11 Si Si
## 12 Si Si
## 13 Si Si
## 14 Si Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 34.14634
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona le fuste deporte y musica "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 14 casos de que una persona le fuste deporte y musica de 41
## observaciones que representan una probabilidad del 34.1463 %
##¿Cual es la probabilidad de que una persona le guste el deporte y sea hombre?
cuantos <- filter(alumnos,hombre == 'Si' & deporte == 'Si' ) %>%
select(hombre,deporte)
cuantos
## hombre deporte
## 1 Si Si
## 2 Si Si
## 3 Si Si
## 4 Si Si
## 5 Si Si
## 6 Si Si
## 7 Si Si
## 8 Si Si
## 9 Si Si
## 10 Si Si
## 11 Si Si
## 12 Si Si
## 13 Si Si
## 14 Si Si
## 15 Si Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 36.58537
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona le guste el deporte y sea hombre "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 15 casos de que una persona le guste el deporte y sea hombre de 41
## observaciones que representan una probabilidad del 36.5854 %
##¿Cual es la probabilidad de que una persona le guste la musica y sea hombre?
cuantos <- filter(alumnos,musica == 'Si' & hombre == 'Si' ) %>%
select(musica,hombre)
cuantos
## musica hombre
## 1 Si Si
## 2 Si Si
## 3 Si Si
## 4 Si Si
## 5 Si Si
## 6 Si Si
## 7 Si Si
## 8 Si Si
## 9 Si Si
## 10 Si Si
## 11 Si Si
## 12 Si Si
## 13 Si Si
## 14 Si Si
## 15 Si Si
## 16 Si Si
## 17 Si Si
## 18 Si Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 43.90244
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la musica y sea hombre "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 18 casos de que una persona le guste la musica y sea hombre de 41
## observaciones que representan una probabilidad del 43.9024 %
##¿Cuál es la probabilidad de que una persona le guste la musica y use lentes además de que sea mujer?
cuantos <- filter(alumnos, musica == 'Si' & lentes == 'Si' & mujer == 'Si') %>%
select(musica, lentes, mujer)
cuantos
## musica lentes mujer
## 1 Si Si Si
## 2 Si Si Si
## 3 Si Si Si
## 4 Si Si Si
## 5 Si Si Si
## 6 Si Si Si
## 7 Si Si Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 17.07317
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la música y use lentes además de que sea mujer "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 7 casos de que una persona le guste la música y use lentes además de que sea mujer de 41
## observaciones que representan una probabilidad del 17.0732 %
##¿Cuál es la probabilidad de que una persona le guste la musica y use lentes además de que sea hombre?
cuantos <- filter(alumnos, musica == 'Si' & lentes == 'Si' & hombre == 'Si') %>%
select(musica, lentes, hombre)
cuantos
## musica lentes hombre
## 1 Si Si Si
## 2 Si Si Si
## 3 Si Si Si
## 4 Si Si Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 9.756098
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la música y use lentes además de que sea hombre "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 4 casos de que una persona le guste la música y use lentes además de que sea hombre de 41
## observaciones que representan una probabilidad del 9.7561 %
##¿Cuál es la probabilida de que una persona use lentes, sea mujer, le guste la música y el deporte también?
cuantos <- filter(alumnos, musica == 'Si' & lentes == 'Si' & mujer == 'Si' & deporte == 'Si') %>%
select(musica, lentes, deporte,mujer)
cuantos
## musica lentes deporte mujer
## 1 Si Si Si Si
## 2 Si Si Si Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 4.878049
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la música y use lentes y le guste la musica y el deporte además de que sea mujer "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 2 casos de que una persona le guste la música y use lentes y le guste la musica y el deporte además de que sea mujer de 41
## observaciones que representan una probabilidad del 4.878 %
##¿Cuál es la probabilida de que una persona use lentes, sea hombre, le guste la música y el deporte también?
cuantos <- filter(alumnos, musica == 'Si' & lentes == 'Si' & hombre == 'Si' & deporte == 'Si') %>%
select(musica, lentes, deporte,hombre)
cuantos
## musica lentes deporte hombre
## 1 Si Si Si Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 2.439024
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la música y use lentes y le guste la musica y el deporte además de que sea hombre "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 1 casos de que una persona le guste la música y use lentes y le guste la musica y el deporte además de que sea hombre de 41
## observaciones que representan una probabilidad del 2.439 %
##¿Cuál es la probabilida de que una persona use lentes, sea hombre, le guste deporte también?
cuantos <- filter(alumnos, lentes == 'Si' & hombre == 'Si' & deporte == 'Si') %>%
select(lentes, deporte,hombre)
cuantos
## lentes deporte hombre
## 1 Si Si Si
## 2 Si Si Si
## 3 Si Si Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 7.317073
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona use lentes y le guste la musica y el deporte además de que sea hombre "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 3 casos de que una persona use lentes y le guste la musica y el deporte además de que sea hombre de 41
## observaciones que representan una probabilidad del 7.3171 %
##¿Cuál es la probabilida de que una persona use lentes, sea mujer, le guste deporte también?
cuantos <- filter(alumnos, lentes == 'Si' & mujer == 'Si' & deporte == 'Si') %>%
select(lentes, deporte, mujer)
cuantos
## lentes deporte mujer
## 1 Si Si Si
## 2 Si Si Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 4.878049
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona use lentes y le guste la musica y el deporte además de que sea mujer "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 2 casos de que una persona use lentes y le guste la musica y el deporte además de que sea mujer de 41
## observaciones que representan una probabilidad del 4.878 %
##¿Cuál es la probabilida de que una persona le guste el deporte?
cuantos <- filter(alumnos, deporte == 'Si') %>%
select(deporte)
cuantos
## deporte
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 Si
## 6 Si
## 7 Si
## 8 Si
## 9 Si
## 10 Si
## 11 Si
## 12 Si
## 13 Si
## 14 Si
## 15 Si
## 16 Si
## 17 Si
## 18 Si
## 19 Si
## 20 Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 48.78049
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona le guste el deporte "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 20 casos de que una persona le guste el deporte de 41
## observaciones que representan una probabilidad del 48.7805 %
##¿Cuál es la probabilida de que una persona sea hombre y sea mujer?
cuantos <- filter(alumnos, hombre == 'Si'& mujer == 'Si') %>%
select(hombre,mujer)
cuantos
## [1] hombre mujer
## <0 rows> (or 0-length row.names)
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 0
*Respuesta 1
cat(" Hay ",nrow(cuantos), " casos de que una persona sea hombre y mujer "," de ", n, " \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
## Hay 0 casos de que una persona sea hombre y mujer de 41
## observaciones que representan una probabilidad del 0 %