Isrrael Contreras Edgar Soto *Jesus Vergara ###probabilidades alumnos lentes deporte musica ver 2.0 Determinar probabilidades Obtener probabilidades de que un alumno tenga ciertas características mediante la frecuencia Se utilizan los datos de alumnos ver 2.0

library(readr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var

##Cargar Datos

alumnos <- read_csv("alumnos.genero.lentes.deporte.musica_ver_2.0.csv")
## Parsed with column specification:
## cols(
##   obs = col_double(),
##   mujer = col_character(),
##   hombre = col_character(),
##   lentes = col_character(),
##   deporte = col_character(),
##   musica = col_character()
## )
alumnos <- data.frame(alumnos) # Asegurarnos que es un df
alumnos
##    obs mujer hombre lentes deporte musica
## 1    1    Si     No     Si      Si     Si
## 2    2    Si     No     Si      Si     Si
## 3    3    Si     No     Si      No     Si
## 4    4    Si     No     Si      No     Si
## 5    5    Si     No     No      Si     Si
## 6    6    Si     No     No      Si     Si
## 7    7    Si     No     No      No     No
## 8    8    Si     No     No      No     Si
## 9    9    Si     No     No      No     Si
## 10  10    Si     No     No      No     Si
## 11  11    Si     No     No      Si     Si
## 12  12    No     Si     No      Si     Si
## 13  13    No     Si     Si      Si     Si
## 14  14    No     Si     Si      Si     No
## 15  15    No     Si     Si      No     Si
## 16  16    No     Si     Si      No     Si
## 17  17    No     Si     No      No     Si
## 18  18    No     Si     No      Si     Si
## 19  19    No     Si     No      Si     Si
## 20  20    No     Si     No      Si     No
## 21  21    No     Si     No      No     Si
## 22  22    No     Si     No      No     No
## 23  23    No     Si     No      No     Si
## 24  24    No     Si     No      No     No
## 25  25    No     Si     No      No     Si
## 26  26    No     Si     No      Si     Si
## 27  27    No     Si     No      Si     No
## 28  28    No     Si     No      Si     Si
## 29  29    No     Si     No      Si     Si
## 30  30    No     Si     No      Si     Si
## 31  31    No     Si     No      Si     No
## 32  32    No     Si     No      No     Si
## 33  33    No     Si     No      No     No
## 34  34    Si     No     Si      No     Si
## 35  35    No     Si     Si      Si     No
## 36  36    No     Si     No      No     Si
## 37  36    No     Si     Si      No     Si
## 38  38    Si     No     Si      No     Si
## 39  39    No     Si     No      Si     No
## 40  40    No     Si     No      Si     Si
## 41  41    Si     No     Si      No     Si
n <- nrow(alumnos) # Número de observaciones o registros

Depurar datos *Hacerlos tipo factor para que se puede sacar frecuencia

alumnos$mujer <- as.factor(alumnos$mujer)
alumnos$hombre <- as.factor(alumnos$hombre)
alumnos$lentes <- as.factor(alumnos$lentes)
alumnos$deporte <- as.factor(alumnos$deporte)
alumnos$musica <- as.factor(alumnos$musica)

#Explorar datos

summary(alumnos)
##       obs        mujer   hombre  lentes  deporte musica 
##  Min.   : 1.00   No:27   No:14   No:28   No:21   No:10  
##  1st Qu.:11.00   Si:14   Si:27   Si:13   Si:20   Si:31  
##  Median :21.00                                          
##  Mean   :20.98                                          
##  3rd Qu.:31.00                                          
##  Max.   :41.00

#Determinar frecuencias de cada variable

tablaFrecuencia.mujer <- fdt_cat(alumnos$mujer)
tablaFrecuencia.mujer
##  Category  f   rf rf(%) cf  cf(%)
##        No 27 0.66 65.85 27  65.85
##        Si 14 0.34 34.15 41 100.00
tablaFrecuencia.hombre <- fdt_cat(alumnos$hombre)
tablaFrecuencia.hombre
##  Category  f   rf rf(%) cf  cf(%)
##        Si 27 0.66 65.85 27  65.85
##        No 14 0.34 34.15 41 100.00
tablaFrecuencia.lentes <- fdt_cat(alumnos$lentes)
tablaFrecuencia.lentes
##  Category  f   rf rf(%) cf  cf(%)
##        No 28 0.68 68.29 28  68.29
##        Si 13 0.32 31.71 41 100.00
tablaFrecuencia.deporte <- fdt_cat(alumnos$deporte)
tablaFrecuencia.deporte
##  Category  f   rf rf(%) cf  cf(%)
##        No 21 0.51 51.22 21  51.22
##        Si 20 0.49 48.78 41 100.00
tablaFrecuencia.musica <- fdt_cat(alumnos$musica)
tablaFrecuencia.musica
##  Category  f   rf rf(%) cf  cf(%)
##        Si 31 0.76 75.61 31  75.61
##        No 10 0.24 24.39 41 100.00

#Análisis probabilístico ##¿Cual es la probabilidad de que una persona sea hombre?

cuantos <- filter(alumnos,hombre == 'Si')  %>% 
  select(hombre)

cuantos
##    hombre
## 1      Si
## 2      Si
## 3      Si
## 4      Si
## 5      Si
## 6      Si
## 7      Si
## 8      Si
## 9      Si
## 10     Si
## 11     Si
## 12     Si
## 13     Si
## 14     Si
## 15     Si
## 16     Si
## 17     Si
## 18     Si
## 19     Si
## 20     Si
## 21     Si
## 22     Si
## 23     Si
## 24     Si
## 25     Si
## 26     Si
## 27     Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 65.85366

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona sea hombre "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  27  casos de que una persona sea hombre   de  41   
##  observaciones que representan una probabilidad del  65.8537  %

##¿Cual es la probabilidad de que una persona sea mujer?

cuantos <- filter(alumnos,mujer == 'Si')  %>% 
  select(mujer)

cuantos
##    mujer
## 1     Si
## 2     Si
## 3     Si
## 4     Si
## 5     Si
## 6     Si
## 7     Si
## 8     Si
## 9     Si
## 10    Si
## 11    Si
## 12    Si
## 13    Si
## 14    Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 34.14634

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona sea mujer "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  14  casos de que una persona sea mujer   de  41   
##  observaciones que representan una probabilidad del  34.1463  %

##¿Cual es la probabilidad de que una persona use lentes?

cuantos <- filter(alumnos,lentes == 'Si')  %>% 
  select(lentes)

cuantos
##    lentes
## 1      Si
## 2      Si
## 3      Si
## 4      Si
## 5      Si
## 6      Si
## 7      Si
## 8      Si
## 9      Si
## 10     Si
## 11     Si
## 12     Si
## 13     Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 31.70732

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona use lentes "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  13  casos de que una persona use lentes   de  41   
##  observaciones que representan una probabilidad del  31.7073  %

##¿Cual es la probabilidad de que una persona le guste la musica?

cuantos <- filter(alumnos,musica == 'Si')  %>% 
  select(musica)

cuantos
##    musica
## 1      Si
## 2      Si
## 3      Si
## 4      Si
## 5      Si
## 6      Si
## 7      Si
## 8      Si
## 9      Si
## 10     Si
## 11     Si
## 12     Si
## 13     Si
## 14     Si
## 15     Si
## 16     Si
## 17     Si
## 18     Si
## 19     Si
## 20     Si
## 21     Si
## 22     Si
## 23     Si
## 24     Si
## 25     Si
## 26     Si
## 27     Si
## 28     Si
## 29     Si
## 30     Si
## 31     Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 75.60976

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la musica "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  31  casos de que una persona le guste la musica   de  41   
##  observaciones que representan una probabilidad del  75.6098  %

##¿Cual es la probabilidad de que una persona le guste el deporte?

cuantos <- filter(alumnos,deporte == 'Si')  %>% 
  select(deporte)

cuantos
##    deporte
## 1       Si
## 2       Si
## 3       Si
## 4       Si
## 5       Si
## 6       Si
## 7       Si
## 8       Si
## 9       Si
## 10      Si
## 11      Si
## 12      Si
## 13      Si
## 14      Si
## 15      Si
## 16      Si
## 17      Si
## 18      Si
## 19      Si
## 20      Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 48.78049

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona le guste el deporte "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  20  casos de que una persona le guste el deporte   de  41   
##  observaciones que representan una probabilidad del  48.7805  %

##¿Cual es la probabilidad de que una persona le guste el deporte y la musica?

cuantos <- filter(alumnos,musica == 'Si' & deporte == 'Si' )  %>% 
  select(musica,deporte)

cuantos
##    musica deporte
## 1      Si      Si
## 2      Si      Si
## 3      Si      Si
## 4      Si      Si
## 5      Si      Si
## 6      Si      Si
## 7      Si      Si
## 8      Si      Si
## 9      Si      Si
## 10     Si      Si
## 11     Si      Si
## 12     Si      Si
## 13     Si      Si
## 14     Si      Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 34.14634

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona le fuste deporte y musica "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  14  casos de que una persona le fuste deporte y musica   de  41   
##  observaciones que representan una probabilidad del  34.1463  %

##¿Cual es la probabilidad de que una persona le guste el deporte y sea hombre?

cuantos <- filter(alumnos,hombre == 'Si' & deporte == 'Si' )  %>% 
  select(hombre,deporte)

cuantos
##    hombre deporte
## 1      Si      Si
## 2      Si      Si
## 3      Si      Si
## 4      Si      Si
## 5      Si      Si
## 6      Si      Si
## 7      Si      Si
## 8      Si      Si
## 9      Si      Si
## 10     Si      Si
## 11     Si      Si
## 12     Si      Si
## 13     Si      Si
## 14     Si      Si
## 15     Si      Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 36.58537

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona le guste el deporte y sea hombre "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  15  casos de que una persona le guste el deporte y sea hombre   de  41   
##  observaciones que representan una probabilidad del  36.5854  %

##¿Cual es la probabilidad de que una persona le guste la musica y sea hombre?

cuantos <- filter(alumnos,musica == 'Si' & hombre == 'Si' )  %>% 
  select(musica,hombre)

cuantos
##    musica hombre
## 1      Si     Si
## 2      Si     Si
## 3      Si     Si
## 4      Si     Si
## 5      Si     Si
## 6      Si     Si
## 7      Si     Si
## 8      Si     Si
## 9      Si     Si
## 10     Si     Si
## 11     Si     Si
## 12     Si     Si
## 13     Si     Si
## 14     Si     Si
## 15     Si     Si
## 16     Si     Si
## 17     Si     Si
## 18     Si     Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 43.90244

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la musica y sea hombre "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  18  casos de que una persona le guste la musica y sea hombre   de  41   
##  observaciones que representan una probabilidad del  43.9024  %

##¿Cuál es la probabilidad de que una persona le guste la musica y use lentes además de que sea mujer?

cuantos <- filter(alumnos, musica == 'Si' & lentes == 'Si' & mujer == 'Si')  %>% 
  select(musica, lentes, mujer)

cuantos
##   musica lentes mujer
## 1     Si     Si    Si
## 2     Si     Si    Si
## 3     Si     Si    Si
## 4     Si     Si    Si
## 5     Si     Si    Si
## 6     Si     Si    Si
## 7     Si     Si    Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 17.07317

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la música y use lentes además de que sea mujer "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  7  casos de que una persona le guste la música y use lentes además de que sea mujer   de  41   
##  observaciones que representan una probabilidad del  17.0732  %

##¿Cuál es la probabilidad de que una persona le guste la musica y use lentes además de que sea hombre?

cuantos <- filter(alumnos, musica == 'Si' & lentes == 'Si' & hombre == 'Si')  %>% 
  select(musica, lentes, hombre)

cuantos
##   musica lentes hombre
## 1     Si     Si     Si
## 2     Si     Si     Si
## 3     Si     Si     Si
## 4     Si     Si     Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 9.756098

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la música y use lentes además de que sea hombre "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  4  casos de que una persona le guste la música y use lentes además de que sea hombre   de  41   
##  observaciones que representan una probabilidad del  9.7561  %

##¿Cuál es la probabilida de que una persona use lentes, sea mujer, le guste la música y el deporte también?

cuantos <- filter(alumnos, musica == 'Si' & lentes == 'Si' & mujer == 'Si' & deporte == 'Si')  %>% 
  select(musica, lentes, deporte,mujer)

cuantos
##   musica lentes deporte mujer
## 1     Si     Si      Si    Si
## 2     Si     Si      Si    Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 4.878049

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la música y use lentes y le guste la musica y el deporte además de que sea mujer "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  2  casos de que una persona le guste la música y use lentes y le guste la musica y el deporte además de que sea mujer   de  41   
##  observaciones que representan una probabilidad del  4.878  %

##¿Cuál es la probabilida de que una persona use lentes, sea hombre, le guste la música y el deporte también?

cuantos <- filter(alumnos, musica == 'Si' & lentes == 'Si' & hombre == 'Si' & deporte == 'Si')  %>% 
  select(musica, lentes, deporte,hombre)

cuantos
##   musica lentes deporte hombre
## 1     Si     Si      Si     Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 2.439024

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona le guste la música y use lentes y le guste la musica y el deporte además de que sea hombre "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  1  casos de que una persona le guste la música y use lentes y le guste la musica y el deporte además de que sea hombre   de  41   
##  observaciones que representan una probabilidad del  2.439  %

##¿Cuál es la probabilida de que una persona use lentes, sea hombre, le guste deporte también?

cuantos <- filter(alumnos, lentes == 'Si' & hombre == 'Si' & deporte == 'Si')  %>% 
  select(lentes, deporte,hombre)

cuantos
##   lentes deporte hombre
## 1     Si      Si     Si
## 2     Si      Si     Si
## 3     Si      Si     Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 7.317073

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona  use lentes y le guste la musica y el deporte además de que sea hombre "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  3  casos de que una persona  use lentes y le guste la musica y el deporte además de que sea hombre   de  41   
##  observaciones que representan una probabilidad del  7.3171  %

##¿Cuál es la probabilida de que una persona use lentes, sea mujer, le guste deporte también?

cuantos <- filter(alumnos, lentes == 'Si' & mujer == 'Si' & deporte == 'Si')  %>% 
  select(lentes, deporte, mujer)

cuantos
##   lentes deporte mujer
## 1     Si      Si    Si
## 2     Si      Si    Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 4.878049

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona  use lentes y le guste la musica y el deporte además de que sea mujer "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  2  casos de que una persona  use lentes y le guste la musica y el deporte además de que sea mujer   de  41   
##  observaciones que representan una probabilidad del  4.878  %

##¿Cuál es la probabilida de que una persona le guste el deporte?

cuantos <- filter(alumnos, deporte == 'Si')  %>% 
  select(deporte)

cuantos
##    deporte
## 1       Si
## 2       Si
## 3       Si
## 4       Si
## 5       Si
## 6       Si
## 7       Si
## 8       Si
## 9       Si
## 10      Si
## 11      Si
## 12      Si
## 13      Si
## 14      Si
## 15      Si
## 16      Si
## 17      Si
## 18      Si
## 19      Si
## 20      Si
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 48.78049

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona  le guste el deporte "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  20  casos de que una persona  le guste el deporte   de  41   
##  observaciones que representan una probabilidad del  48.7805  %

##¿Cuál es la probabilida de que una persona sea hombre y sea mujer?

cuantos <- filter(alumnos, hombre == 'Si'& mujer == 'Si')  %>% 
  select(hombre,mujer)

cuantos
## [1] hombre mujer 
## <0 rows> (or 0-length row.names)
frecuencia <- nrow(cuantos) / n * 100
frecuencia
## [1] 0

*Respuesta 1

cat(" Hay ",nrow(cuantos), " casos de que una persona sea hombre y mujer "," de ", n, "  \n observaciones que representan una probabilidad del ",round(frecuencia, 4), " % "
)
##  Hay  0  casos de que una persona sea hombre y mujer   de  41   
##  observaciones que representan una probabilidad del  0  %