Importamos librerías

library(readr)
library(dplyr)
library(fdth)

Cargamos datos

alumnos = read.csv("M:/Documentos/[Tareas y Trabajos ITD]/2do Semestre/Probabilidad y Estadistica/datos/alumnos.genero.lentes.deporte.musica_ver_2.0.csv")
alumnos = data.frame(alumnos)
alumnos
##    obs mujer hombre lentes deporte musica
## 1    1    Si     No     Si      Si     Si
## 2    2    Si     No     Si      Si     Si
## 3    3    Si     No     Si      No     Si
## 4    4    Si     No     Si      No     Si
## 5    5    Si     No     No      Si     Si
## 6    6    Si     No     No      Si     Si
## 7    7    Si     No     No      No     No
## 8    8    Si     No     No      No     Si
## 9    9    Si     No     No      No     Si
## 10  10    Si     No     No      No     Si
## 11  11    Si     No     No      Si     Si
## 12  12    No     Si     No      Si     Si
## 13  13    No     Si     Si      Si     Si
## 14  14    No     Si     Si      Si     No
## 15  15    No     Si     Si      No     Si
## 16  16    No     Si     Si      No     Si
## 17  17    No     Si     No      No     Si
## 18  18    No     Si     No      Si     Si
## 19  19    No     Si     No      Si     Si
## 20  20    No     Si     No      Si     No
## 21  21    No     Si     No      No     Si
## 22  22    No     Si     No      No     No
## 23  23    No     Si     No      No     Si
## 24  24    No     Si     No      No     No
## 25  25    No     Si     No      No     Si
## 26  26    No     Si     No      Si     Si
## 27  27    No     Si     No      Si     No
## 28  28    No     Si     No      Si     Si
## 29  29    No     Si     No      Si     Si
## 30  30    No     Si     No      Si     Si
## 31  31    No     Si     No      Si     No
## 32  32    No     Si     No      No     Si
## 33  33    No     Si     No      No     No
## 34  34    Si     No     Si      No     Si
## 35  35   No      Si    Si       Si     No
## 36  36    No     Si     No      No     Si
## 37  36    No     Si     Si      No     Si
## 38  38    Si     No     Si      No     Si
## 39  39    No     Si     No      Si     No
## 40  40    No     Si     No      Si     Si
## 41  41    Si     No     Si      No     Si
n = nrow(alumnos)

Depuramos los datos para poder determinar las frecuencias de cada campo.

alumnos$mujer <- as.factor(alumnos$mujer)
alumnos$hombre <- as.factor(alumnos$hombre)
alumnos$lentes <- as.factor(alumnos$lentes)
alumnos$deporte <- as.factor(alumnos$deporte)
alumnos$musica <- as.factor(alumnos$musica)

Realizamos un resumen de los datos

summary(alumnos)
##       obs        mujer    hombre  lentes   deporte musica 
##  Min.   : 1.00   No :26   No:14   No :28   No:21   No:10  
##  1st Qu.:11.00   No : 1   Si:27   Si :12   Si:20   Si:31  
##  Median :21.00   Si :14           Si : 1                  
##  Mean   :20.98                                            
##  3rd Qu.:31.00                                            
##  Max.   :41.00

Determinamos las frecuencias de cada campo

tablaFrecuencia.mujer <- fdt_cat(alumnos$mujer)
tablaFrecuencia.mujer
##  Category  f   rf rf(%) cf  cf(%)
##        No 26 0.63 63.41 26  63.41
##        Si 14 0.34 34.15 40  97.56
##       No   1 0.02  2.44 41 100.00
tablaFrecuencia.hombre <- fdt_cat(alumnos$hombre)
tablaFrecuencia.hombre
##  Category  f   rf rf(%) cf  cf(%)
##        Si 27 0.66 65.85 27  65.85
##        No 14 0.34 34.15 41 100.00
tablaFrecuencia.lentes <- fdt_cat(alumnos$lentes)
tablaFrecuencia.lentes
##  Category  f   rf rf(%) cf  cf(%)
##        No 28 0.68 68.29 28  68.29
##        Si 12 0.29 29.27 40  97.56
##       Si   1 0.02  2.44 41 100.00
tablaFrecuencia.deporte <- fdt_cat(alumnos$deporte)
tablaFrecuencia.deporte
##  Category  f   rf rf(%) cf  cf(%)
##        No 21 0.51 51.22 21  51.22
##        Si 20 0.49 48.78 41 100.00
tablaFrecuencia.musica <- fdt_cat(alumnos$musica)
tablaFrecuencia.musica
##  Category  f   rf rf(%) cf  cf(%)
##        Si 31 0.76 75.61 31  75.61
##        No 10 0.24 24.39 41 100.00

Análisis Probabilístico

Respuestas

Pregunta 1: ¿Cuál es la probabilidad de que una persona sea hombre?

r1 = filter(alumnos, hombre == 'Si')  %>% select(hombre)
resp1 = nrow(r1) / n * 100
r1
##    hombre
## 1      Si
## 2      Si
## 3      Si
## 4      Si
## 5      Si
## 6      Si
## 7      Si
## 8      Si
## 9      Si
## 10     Si
## 11     Si
## 12     Si
## 13     Si
## 14     Si
## 15     Si
## 16     Si
## 17     Si
## 18     Si
## 19     Si
## 20     Si
## 21     Si
## 22     Si
## 23     Si
## 24     Si
## 25     Si
## 26     Si
## 27     Si
## Hay  65.85366 % de probabilidades de que una persona sea hombre.

Pregunta 2: ¿Cuál es la probabilidad de que una persona sea mujer?

r2 = filter(alumnos, mujer == 'Si')  %>% select(mujer)
resp2 = nrow(r2) / n * 100
r2
##    mujer
## 1     Si
## 2     Si
## 3     Si
## 4     Si
## 5     Si
## 6     Si
## 7     Si
## 8     Si
## 9     Si
## 10    Si
## 11    Si
## 12    Si
## 13    Si
## 14    Si
## Hay  34.14634 % de probabilidades de que una persona sea mujer.

Pregunta 3: ¿Cuál es la probabilidad de que una persona use lentes?

r3 = filter(alumnos, lentes == 'Si')  %>% select(lentes)
resp3 = nrow(r3) / n * 100
r3
##    lentes
## 1      Si
## 2      Si
## 3      Si
## 4      Si
## 5      Si
## 6      Si
## 7      Si
## 8      Si
## 9      Si
## 10     Si
## 11     Si
## 12     Si
## Hay  29.26829 % de probabilidades de que una persona use lentes.

Pregunta 4: ¿Cuál es la probabilidad de que una persona le guste la música?

r4 = filter(alumnos, musica == 'Si')  %>% select(musica)
resp4 = nrow(r4) / n * 100
r4
##    musica
## 1      Si
## 2      Si
## 3      Si
## 4      Si
## 5      Si
## 6      Si
## 7      Si
## 8      Si
## 9      Si
## 10     Si
## 11     Si
## 12     Si
## 13     Si
## 14     Si
## 15     Si
## 16     Si
## 17     Si
## 18     Si
## 19     Si
## 20     Si
## 21     Si
## 22     Si
## 23     Si
## 24     Si
## 25     Si
## 26     Si
## 27     Si
## 28     Si
## 29     Si
## 30     Si
## 31     Si
## Hay  75.60976 % de probabilidades de que una persona le guste la música.

Pregunta 5: ¿Cuál es la probabilidad de que una persona le guste el deporte?

r5 = filter(alumnos, deporte == 'Si')  %>% select(deporte)
resp5 = nrow(r5) / n * 100
r5
##    deporte
## 1       Si
## 2       Si
## 3       Si
## 4       Si
## 5       Si
## 6       Si
## 7       Si
## 8       Si
## 9       Si
## 10      Si
## 11      Si
## 12      Si
## 13      Si
## 14      Si
## 15      Si
## 16      Si
## 17      Si
## 18      Si
## 19      Si
## 20      Si
## Hay  48.78049 % de probabilidades de que una persona le guste el deporte.

Pregunta 6: ¿Cuál es la probabilidad de que una persona le guste el deporte y la música?

r6 = filter(alumnos, deporte == 'Si' & musica == 'Si')  %>% select(deporte, musica)
resp6 = nrow(r6) / n * 100
r6
##    deporte musica
## 1       Si     Si
## 2       Si     Si
## 3       Si     Si
## 4       Si     Si
## 5       Si     Si
## 6       Si     Si
## 7       Si     Si
## 8       Si     Si
## 9       Si     Si
## 10      Si     Si
## 11      Si     Si
## 12      Si     Si
## 13      Si     Si
## 14      Si     Si
## Hay  34.14634 % de probabilidades de que una persona le gusten el deporte y la música.

Pregunta 7: ¿Cuál es la probabilidad de que una persona le guste el deporte y sea hombre?

r7 = filter(alumnos, deporte == 'Si' & hombre == 'Si')  %>% select(deporte, hombre)
resp7 = nrow(r7) / n * 100
r7
##    deporte hombre
## 1       Si     Si
## 2       Si     Si
## 3       Si     Si
## 4       Si     Si
## 5       Si     Si
## 6       Si     Si
## 7       Si     Si
## 8       Si     Si
## 9       Si     Si
## 10      Si     Si
## 11      Si     Si
## 12      Si     Si
## 13      Si     Si
## 14      Si     Si
## 15      Si     Si
## Hay  36.58537 % de probabilidades de que una persona le guste el deporte y sea hombre.

Pregunta 8: ¿Cuál es la probabilidad de que una persona le guste la música y sea hombre?

r8 = filter(alumnos, musica == 'Si' & hombre == 'Si')  %>% select(musica, hombre)
resp8 = nrow(r8) / n * 100
r8
##    musica hombre
## 1      Si     Si
## 2      Si     Si
## 3      Si     Si
## 4      Si     Si
## 5      Si     Si
## 6      Si     Si
## 7      Si     Si
## 8      Si     Si
## 9      Si     Si
## 10     Si     Si
## 11     Si     Si
## 12     Si     Si
## 13     Si     Si
## 14     Si     Si
## 15     Si     Si
## 16     Si     Si
## 17     Si     Si
## 18     Si     Si
## Hay  43.90244 % de probabilidades de que una persona le guste la música y sea hombre.

Pregunta 9: ¿Cuál es la probabilidad de que una persona le guste la musica y use lentes además de que sea mujer?

r9 = filter(alumnos, musica == 'Si' & lentes == 'Si' & mujer == 'Si')  %>% select(musica, lentes, mujer)
resp9 = nrow(r9) / n * 100
r9
##   musica lentes mujer
## 1     Si     Si    Si
## 2     Si     Si    Si
## 3     Si     Si    Si
## 4     Si     Si    Si
## 5     Si     Si    Si
## 6     Si     Si    Si
## 7     Si     Si    Si
## Hay  17.07317 % de probabilidades de que una persona le guste la música, use lentes y sea mujer.

Pregunta 10: ¿Cuál es la probabilidad de que una persona le guste la musica, use lentes y sea hombre?

r10 = filter(alumnos, musica == 'Si' & lentes == 'Si' & hombre == 'Si')  %>% select(musica, lentes, hombre)
resp10 = nrow(r10) / n * 100
r10
##   musica lentes hombre
## 1     Si     Si     Si
## 2     Si     Si     Si
## 3     Si     Si     Si
## 4     Si     Si     Si
## Hay  9.756098 % de probabilidades de que una persona le guste la música, use lentes y sea hombre.

Pregunta 11: ¿Cuál es la probabilida de que una persona use lentes, sea mujer, le guste la música y el deporte también?

r11 = filter(alumnos, lentes == 'Si' & mujer == 'Si' & musica == 'Si' & deporte == 'Si')  %>% select(lentes, mujer, musica, deporte)
resp11 = nrow(r11) / n * 100
r11
##   lentes mujer musica deporte
## 1     Si    Si     Si      Si
## 2     Si    Si     Si      Si
## Hay  4.878049 % de probabilidades de que una persona use lentes, sea mujer, y le gusten la música y el deporte.

Pregunta 12: ¿Cuál es la probabilidas de que una persona use lentes, sea hombre, le guste la música y el deporte también?

r12 = filter(alumnos, lentes == 'Si' & hombre == 'Si' & musica == 'Si' & deporte == 'Si')  %>% select(lentes, hombre, musica, deporte)
resp12 = nrow(r12) / n * 100
r12
##   lentes hombre musica deporte
## 1     Si     Si     Si      Si
## Hay  2.439024 % de probabilidades de que una persona use lentes, sea hombre, y le gusten la música y el deporte.

Pregunta 13: ¿Cuál es la probabilidad de que una persona use lentes, sea hombre, y le guste el deporte?

r13 = filter(alumnos, lentes == 'Si' & hombre == 'Si' & deporte == 'Si')  %>% select(lentes, hombre,  deporte)
resp13 = nrow(r13) / n * 100
r13
##   lentes hombre deporte
## 1     Si     Si      Si
## 2     Si     Si      Si
## Hay  4.878049 % de probabilidades de que una persona use lentes, sea hombre, y le guste el deporte.

Pregunta 14: ¿Cuál es la probabilidad de que una persona use lentes, sea mujer, y le guste el deporte?

r14 = filter(alumnos, lentes == 'Si' & mujer == 'Si' & deporte == 'Si')  %>% select(lentes, mujer,  deporte)
resp14 = nrow(r14) / n * 100
r14
##   lentes mujer deporte
## 1     Si    Si      Si
## 2     Si    Si      Si
## Hay  4.878049 % de probabilidades de que una persona use lentes, sea mujer, y le guste el deporte.

Pregunta 15: ¿Cuál es la probabilidad de que a una persona le guste el deporte?

r15 = filter(alumnos, deporte == 'Si')  %>% select(deporte)
resp15 = nrow(r15) / n * 100
r15
##    deporte
## 1       Si
## 2       Si
## 3       Si
## 4       Si
## 5       Si
## 6       Si
## 7       Si
## 8       Si
## 9       Si
## 10      Si
## 11      Si
## 12      Si
## 13      Si
## 14      Si
## 15      Si
## 16      Si
## 17      Si
## 18      Si
## 19      Si
## 20      Si
## Hay  48.78049 % de probabilidades de que a una persona le guste el deporte.

Pregunta 16: ¿Cuál es la probabilidad de que una persona sea hombre y mujer?

r16 = filter(alumnos, hombre == 'Si' & mujer == 'Si')  %>% select(hombre, mujer)
resp16 = nrow(r16) / n * 100
r16
## [1] hombre mujer 
## <0 rows> (or 0-length row.names)
## Hay  0 % de probabilidades de que a una persona sea hombre y mujer a la vez.