Cargar datos de direccion
datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/practicas%20R/unidad%202/alumnos.deportes.2020.csv")
datos
## X nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 1 1 Ana F FALSE FALSE FALSE FALSE FALSE FALSE
## 2 2 Antonio M FALSE FALSE FALSE FALSE FALSE FALSE
## 3 3 Aracely F FALSE FALSE FALSE FALSE FALSE TRUE
## 4 4 Carmen F FALSE TRUE FALSE FALSE FALSE FALSE
## 5 5 Eduardo M TRUE FALSE FALSE FALSE FALSE FALSE
## 6 6 Ernesto M FALSE TRUE FALSE FALSE FALSE FALSE
## 7 7 Gabino M FALSE TRUE FALSE FALSE FALSE FALSE
## 8 8 Gerardo M TRUE FALSE TRUE FALSE FALSE TRUE
## 9 9 Javier M FALSE TRUE FALSE FALSE FALSE FALSE
## 10 10 Jeorgina F FALSE TRUE FALSE FALSE FALSE FALSE
## 11 11 Juan M TRUE FALSE FALSE TRUE FALSE FALSE
## 12 12 Lalo M FALSE FALSE TRUE FALSE FALSE FALSE
## 13 13 Laura F FALSE TRUE FALSE FALSE FALSE FALSE
## 14 14 Lucy F TRUE FALSE TRUE TRUE FALSE FALSE
## 15 15 Luis M FALSE FALSE TRUE FALSE FALSE FALSE
## 16 16 Luisa F FALSE FALSE FALSE FALSE FALSE FALSE
## 17 17 Lupita F TRUE TRUE FALSE FALSE FALSE FALSE
## 18 18 Margarita F FALSE TRUE FALSE TRUE FALSE FALSE
## 19 19 Margarito M FALSE FALSE FALSE FALSE FALSE TRUE
## 20 20 Maria F FALSE TRUE FALSE FALSE FALSE FALSE
## 21 21 Memo M TRUE FALSE FALSE FALSE TRUE FALSE
## 22 22 Oscar M FALSE FALSE FALSE FALSE FALSE FALSE
## 23 23 Paco M TRUE FALSE TRUE FALSE TRUE FALSE
## 24 24 Patricia F TRUE FALSE FALSE TRUE FALSE FALSE
## 25 25 Paty F TRUE TRUE FALSE FALSE FALSE FALSE
## 26 26 Raul M TRUE FALSE FALSE FALSE FALSE FALSE
## 27 27 Romualdo M TRUE FALSE FALSE FALSE FALSE FALSE
## 28 28 Rosario F FALSE FALSE FALSE FALSE FALSE FALSE
## 29 29 Rubén M TRUE FALSE FALSE FALSE FALSE FALSE
## 30 30 Salvador M TRUE FALSE FALSE TRUE FALSE FALSE
## 31 31 Sandra F FALSE FALSE FALSE FALSE FALSE FALSE
## 32 32 Sandro M FALSE FALSE FALSE FALSE FALSE TRUE
## 33 33 Saul M TRUE FALSE TRUE FALSE FALSE FALSE
## 34 34 Yuri F TRUE FALSE FALSE FALSE FALSE FALSE
## 35 35 Arturo M FALSE FALSE FALSE FALSE FALSE FALSE
## 36 36 Angélica F TRUE TRUE TRUE FALSE FALSE FALSE
## 37 37 Arnulfo M FALSE FALSE TRUE FALSE FALSE FALSE
## 38 38 Bety F TRUE TRUE FALSE FALSE FALSE FALSE
## 39 39 Carlos M TRUE FALSE FALSE FALSE FALSE FALSE
## 40 40 Dagoberto M FALSE FALSE TRUE FALSE FALSE FALSE
## 41 41 Dany F TRUE TRUE FALSE FALSE FALSE FALSE
## 42 42 Dalia F TRUE FALSE FALSE FALSE FALSE FALSE
## 43 43 Efren M TRUE FALSE FALSE TRUE FALSE FALSE
## 44 44 Ernestina F TRUE FALSE TRUE FALSE TRUE FALSE
## 45 45 Fernando M TRUE FALSE FALSE TRUE FALSE FALSE
## 46 46 Fabián M FALSE TRUE TRUE FALSE FALSE FALSE
## 47 47 Fernanda F FALSE FALSE FALSE FALSE FALSE FALSE
## 48 48 Gabriela F FALSE FALSE FALSE FALSE FALSE FALSE
## 49 49 Gabriel M TRUE FALSE FALSE FALSE FALSE FALSE
## 50 50 Guille F TRUE FALSE FALSE FALSE TRUE FALSE
## 51 51 Jorge M TRUE TRUE FALSE FALSE FALSE FALSE
## 52 52 Lorenzo M TRUE FALSE TRUE FALSE FALSE FALSE
## 53 53 Mikaela F FALSE TRUE FALSE FALSE FALSE FALSE
## 54 54 Miguel M TRUE TRUE FALSE FALSE FALSE FALSE
## 55 55 Marcela F FALSE FALSE FALSE TRUE FALSE FALSE
## 56 56 Orlando M TRUE FALSE FALSE FALSE FALSE FALSE
## 57 57 Otilia F TRUE FALSE FALSE TRUE FALSE FALSE
## 58 58 Pedro M TRUE TRUE FALSE FALSE FALSE FALSE
## 59 59 Perla F FALSE FALSE FALSE FALSE FALSE FALSE
## 60 60 Raquel F TRUE TRUE FALSE FALSE FALSE FALSE
## 61 61 Susana F FALSE FALSE FALSE FALSE FALSE FALSE
## 62 62 Sandy F FALSE TRUE FALSE FALSE FALSE FALSE
## 63 63 Sotelo M FALSE FALSE TRUE TRUE FALSE FALSE
## 64 64 Tiburcio M FALSE FALSE FALSE TRUE FALSE FALSE
## 65 65 Teresa F FALSE FALSE FALSE FALSE FALSE FALSE
## 66 66 Walter F TRUE TRUE FALSE FALSE FALSE FALSE
## 67 67 Xóchitl F FALSE TRUE TRUE TRUE TRUE FALSE
Conjunto de observaciones o renglones
n <- nrow(datos)
Conjunto Hombres y Mujeres
Se determinan los conjuntos según el género de la persona mediante la función subset() que permite filtrar datos
1. ¿Cuál es la probabilidad de que un alumno sea hombre?
hombres <- subset(datos, sexo =='M')
hombres
## X nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 2 2 Antonio M FALSE FALSE FALSE FALSE FALSE FALSE
## 5 5 Eduardo M TRUE FALSE FALSE FALSE FALSE FALSE
## 6 6 Ernesto M FALSE TRUE FALSE FALSE FALSE FALSE
## 7 7 Gabino M FALSE TRUE FALSE FALSE FALSE FALSE
## 8 8 Gerardo M TRUE FALSE TRUE FALSE FALSE TRUE
## 9 9 Javier M FALSE TRUE FALSE FALSE FALSE FALSE
## 11 11 Juan M TRUE FALSE FALSE TRUE FALSE FALSE
## 12 12 Lalo M FALSE FALSE TRUE FALSE FALSE FALSE
## 15 15 Luis M FALSE FALSE TRUE FALSE FALSE FALSE
## 19 19 Margarito M FALSE FALSE FALSE FALSE FALSE TRUE
## 21 21 Memo M TRUE FALSE FALSE FALSE TRUE FALSE
## 22 22 Oscar M FALSE FALSE FALSE FALSE FALSE FALSE
## 23 23 Paco M TRUE FALSE TRUE FALSE TRUE FALSE
## 26 26 Raul M TRUE FALSE FALSE FALSE FALSE FALSE
## 27 27 Romualdo M TRUE FALSE FALSE FALSE FALSE FALSE
## 29 29 Rubén M TRUE FALSE FALSE FALSE FALSE FALSE
## 30 30 Salvador M TRUE FALSE FALSE TRUE FALSE FALSE
## 32 32 Sandro M FALSE FALSE FALSE FALSE FALSE TRUE
## 33 33 Saul M TRUE FALSE TRUE FALSE FALSE FALSE
## 35 35 Arturo M FALSE FALSE FALSE FALSE FALSE FALSE
## 37 37 Arnulfo M FALSE FALSE TRUE FALSE FALSE FALSE
## 39 39 Carlos M TRUE FALSE FALSE FALSE FALSE FALSE
## 40 40 Dagoberto M FALSE FALSE TRUE FALSE FALSE FALSE
## 43 43 Efren M TRUE FALSE FALSE TRUE FALSE FALSE
## 45 45 Fernando M TRUE FALSE FALSE TRUE FALSE FALSE
## 46 46 Fabián M FALSE TRUE TRUE FALSE FALSE FALSE
## 49 49 Gabriel M TRUE FALSE FALSE FALSE FALSE FALSE
## 51 51 Jorge M TRUE TRUE FALSE FALSE FALSE FALSE
## 52 52 Lorenzo M TRUE FALSE TRUE FALSE FALSE FALSE
## 54 54 Miguel M TRUE TRUE FALSE FALSE FALSE FALSE
## 56 56 Orlando M TRUE FALSE FALSE FALSE FALSE FALSE
## 58 58 Pedro M TRUE TRUE FALSE FALSE FALSE FALSE
## 63 63 Sotelo M FALSE FALSE TRUE TRUE FALSE FALSE
## 64 64 Tiburcio M FALSE FALSE FALSE TRUE FALSE FALSE
2. ¿Cuál es la probabilidad de que un alumno sea mujer?
mujeres <- subset(datos, sexo =='F')
mujeres
## X nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 1 1 Ana F FALSE FALSE FALSE FALSE FALSE FALSE
## 3 3 Aracely F FALSE FALSE FALSE FALSE FALSE TRUE
## 4 4 Carmen F FALSE TRUE FALSE FALSE FALSE FALSE
## 10 10 Jeorgina F FALSE TRUE FALSE FALSE FALSE FALSE
## 13 13 Laura F FALSE TRUE FALSE FALSE FALSE FALSE
## 14 14 Lucy F TRUE FALSE TRUE TRUE FALSE FALSE
## 16 16 Luisa F FALSE FALSE FALSE FALSE FALSE FALSE
## 17 17 Lupita F TRUE TRUE FALSE FALSE FALSE FALSE
## 18 18 Margarita F FALSE TRUE FALSE TRUE FALSE FALSE
## 20 20 Maria F FALSE TRUE FALSE FALSE FALSE FALSE
## 24 24 Patricia F TRUE FALSE FALSE TRUE FALSE FALSE
## 25 25 Paty F TRUE TRUE FALSE FALSE FALSE FALSE
## 28 28 Rosario F FALSE FALSE FALSE FALSE FALSE FALSE
## 31 31 Sandra F FALSE FALSE FALSE FALSE FALSE FALSE
## 34 34 Yuri F TRUE FALSE FALSE FALSE FALSE FALSE
## 36 36 Angélica F TRUE TRUE TRUE FALSE FALSE FALSE
## 38 38 Bety F TRUE TRUE FALSE FALSE FALSE FALSE
## 41 41 Dany F TRUE TRUE FALSE FALSE FALSE FALSE
## 42 42 Dalia F TRUE FALSE FALSE FALSE FALSE FALSE
## 44 44 Ernestina F TRUE FALSE TRUE FALSE TRUE FALSE
## 47 47 Fernanda F FALSE FALSE FALSE FALSE FALSE FALSE
## 48 48 Gabriela F FALSE FALSE FALSE FALSE FALSE FALSE
## 50 50 Guille F TRUE FALSE FALSE FALSE TRUE FALSE
## 53 53 Mikaela F FALSE TRUE FALSE FALSE FALSE FALSE
## 55 55 Marcela F FALSE FALSE FALSE TRUE FALSE FALSE
## 57 57 Otilia F TRUE FALSE FALSE TRUE FALSE FALSE
## 59 59 Perla F FALSE FALSE FALSE FALSE FALSE FALSE
## 60 60 Raquel F TRUE TRUE FALSE FALSE FALSE FALSE
## 61 61 Susana F FALSE FALSE FALSE FALSE FALSE FALSE
## 62 62 Sandy F FALSE TRUE FALSE FALSE FALSE FALSE
## 65 65 Teresa F FALSE FALSE FALSE FALSE FALSE FALSE
## 66 66 Walter F TRUE TRUE FALSE FALSE FALSE FALSE
## 67 67 Xóchitl F FALSE TRUE TRUE TRUE TRUE FALSE
Frecuencias de Hombres y Mujeres
Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable
* ¿Cuántos casos hay que son hombres?
* ¿Cuántos casos hay que son mujeres?
table(datos$sexo)
##
## F M
## 33 34
Frecuencias relativas de Hombres y Mujeres
¿Cuál es la probabilidad al seleccionar a una persona de todo un conjunto de datos sea hombre y cuál es la probabilidad al seleccionar a una persona de todo conjunto de datos sea mujer?
round(prop.table(table(datos$sexo)),4)
##
## F M
## 0.4925 0.5075
round(prop.table(table(datos$sexo)),4) * 100
##
## F M
## 49.25 50.75
Conjunto Futbol
3. ¿Cuál es la probabilidad de que un alumno juegue fúbol?
futbol <- subset(datos, futbol == TRUE)
futbol
## X nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 5 5 Eduardo M TRUE FALSE FALSE FALSE FALSE FALSE
## 8 8 Gerardo M TRUE FALSE TRUE FALSE FALSE TRUE
## 11 11 Juan M TRUE FALSE FALSE TRUE FALSE FALSE
## 14 14 Lucy F TRUE FALSE TRUE TRUE FALSE FALSE
## 17 17 Lupita F TRUE TRUE FALSE FALSE FALSE FALSE
## 21 21 Memo M TRUE FALSE FALSE FALSE TRUE FALSE
## 23 23 Paco M TRUE FALSE TRUE FALSE TRUE FALSE
## 24 24 Patricia F TRUE FALSE FALSE TRUE FALSE FALSE
## 25 25 Paty F TRUE TRUE FALSE FALSE FALSE FALSE
## 26 26 Raul M TRUE FALSE FALSE FALSE FALSE FALSE
## 27 27 Romualdo M TRUE FALSE FALSE FALSE FALSE FALSE
## 29 29 Rubén M TRUE FALSE FALSE FALSE FALSE FALSE
## 30 30 Salvador M TRUE FALSE FALSE TRUE FALSE FALSE
## 33 33 Saul M TRUE FALSE TRUE FALSE FALSE FALSE
## 34 34 Yuri F TRUE FALSE FALSE FALSE FALSE FALSE
## 36 36 Angélica F TRUE TRUE TRUE FALSE FALSE FALSE
## 38 38 Bety F TRUE TRUE FALSE FALSE FALSE FALSE
## 39 39 Carlos M TRUE FALSE FALSE FALSE FALSE FALSE
## 41 41 Dany F TRUE TRUE FALSE FALSE FALSE FALSE
## 42 42 Dalia F TRUE FALSE FALSE FALSE FALSE FALSE
## 43 43 Efren M TRUE FALSE FALSE TRUE FALSE FALSE
## 44 44 Ernestina F TRUE FALSE TRUE FALSE TRUE FALSE
## 45 45 Fernando M TRUE FALSE FALSE TRUE FALSE FALSE
## 49 49 Gabriel M TRUE FALSE FALSE FALSE FALSE FALSE
## 50 50 Guille F TRUE FALSE FALSE FALSE TRUE FALSE
## 51 51 Jorge M TRUE TRUE FALSE FALSE FALSE FALSE
## 52 52 Lorenzo M TRUE FALSE TRUE FALSE FALSE FALSE
## 54 54 Miguel M TRUE TRUE FALSE FALSE FALSE FALSE
## 56 56 Orlando M TRUE FALSE FALSE FALSE FALSE FALSE
## 57 57 Otilia F TRUE FALSE FALSE TRUE FALSE FALSE
## 58 58 Pedro M TRUE TRUE FALSE FALSE FALSE FALSE
## 60 60 Raquel F TRUE TRUE FALSE FALSE FALSE FALSE
## 66 66 Walter F TRUE TRUE FALSE FALSE FALSE FALSE
Frecuencias de personas en Fútbol
¿Cuántas personas hay que practican Fútbol?
table(datos$futbol)
##
## FALSE TRUE
## 34 33
Frecuencias relativas del conjunto Fútbol
¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue fútbol?
round(prop.table(table(datos$futbol)),4)
##
## FALSE TRUE
## 0.5075 0.4925
round(prop.table(table(datos$futbol)),4) * 100
##
## FALSE TRUE
## 50.75 49.25
Conjunto Basquetbol
4. ¿Cuál es la probabilidad de que un alumno juegue basquetbol?
basquetbol <- subset(datos, basquetbol == TRUE)
basquetbol
## X nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 4 4 Carmen F FALSE TRUE FALSE FALSE FALSE FALSE
## 6 6 Ernesto M FALSE TRUE FALSE FALSE FALSE FALSE
## 7 7 Gabino M FALSE TRUE FALSE FALSE FALSE FALSE
## 9 9 Javier M FALSE TRUE FALSE FALSE FALSE FALSE
## 10 10 Jeorgina F FALSE TRUE FALSE FALSE FALSE FALSE
## 13 13 Laura F FALSE TRUE FALSE FALSE FALSE FALSE
## 17 17 Lupita F TRUE TRUE FALSE FALSE FALSE FALSE
## 18 18 Margarita F FALSE TRUE FALSE TRUE FALSE FALSE
## 20 20 Maria F FALSE TRUE FALSE FALSE FALSE FALSE
## 25 25 Paty F TRUE TRUE FALSE FALSE FALSE FALSE
## 36 36 Angélica F TRUE TRUE TRUE FALSE FALSE FALSE
## 38 38 Bety F TRUE TRUE FALSE FALSE FALSE FALSE
## 41 41 Dany F TRUE TRUE FALSE FALSE FALSE FALSE
## 46 46 Fabián M FALSE TRUE TRUE FALSE FALSE FALSE
## 51 51 Jorge M TRUE TRUE FALSE FALSE FALSE FALSE
## 53 53 Mikaela F FALSE TRUE FALSE FALSE FALSE FALSE
## 54 54 Miguel M TRUE TRUE FALSE FALSE FALSE FALSE
## 58 58 Pedro M TRUE TRUE FALSE FALSE FALSE FALSE
## 60 60 Raquel F TRUE TRUE FALSE FALSE FALSE FALSE
## 62 62 Sandy F FALSE TRUE FALSE FALSE FALSE FALSE
## 66 66 Walter F TRUE TRUE FALSE FALSE FALSE FALSE
## 67 67 Xóchitl F FALSE TRUE TRUE TRUE TRUE FALSE
Frecuencias de personas en Basquetbol
¿Cuántas personas hay que practican Basquetbol?
table(datos$basquetbol)
##
## FALSE TRUE
## 45 22
Frecuencias relativas del conjunto Basquetbol
¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue basquetbol?
round(prop.table(table(datos$basquetbol)),4)
##
## FALSE TRUE
## 0.6716 0.3284
round(prop.table(table(datos$basquetbol)),4) * 100
##
## FALSE TRUE
## 67.16 32.84
Conjunto Voleybol
5. ¿Cuál es la probabilidad de que un alumno juegue voleybol?
voleybol <- subset(datos, voleybol == TRUE)
voleybol
## X nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 8 8 Gerardo M TRUE FALSE TRUE FALSE FALSE TRUE
## 12 12 Lalo M FALSE FALSE TRUE FALSE FALSE FALSE
## 14 14 Lucy F TRUE FALSE TRUE TRUE FALSE FALSE
## 15 15 Luis M FALSE FALSE TRUE FALSE FALSE FALSE
## 23 23 Paco M TRUE FALSE TRUE FALSE TRUE FALSE
## 33 33 Saul M TRUE FALSE TRUE FALSE FALSE FALSE
## 36 36 Angélica F TRUE TRUE TRUE FALSE FALSE FALSE
## 37 37 Arnulfo M FALSE FALSE TRUE FALSE FALSE FALSE
## 40 40 Dagoberto M FALSE FALSE TRUE FALSE FALSE FALSE
## 44 44 Ernestina F TRUE FALSE TRUE FALSE TRUE FALSE
## 46 46 Fabián M FALSE TRUE TRUE FALSE FALSE FALSE
## 52 52 Lorenzo M TRUE FALSE TRUE FALSE FALSE FALSE
## 63 63 Sotelo M FALSE FALSE TRUE TRUE FALSE FALSE
## 67 67 Xóchitl F FALSE TRUE TRUE TRUE TRUE FALSE
Frecuencias de personas en Voleybol
¿Cuántas personas hay que practican voleybol?
table(datos$voleybol)
##
## FALSE TRUE
## 53 14
Frecuencias relativas del conjunto Voleybol
¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue voleybol?
round(prop.table(table(datos$voleybol)),4)
##
## FALSE TRUE
## 0.791 0.209
round(prop.table(table(datos$voleybol)),4) * 100
##
## FALSE TRUE
## 79.1 20.9
Conjunto Atletismo
6. ¿Cuál es la probabilidad de que un alumno practique atletismo?
atletismo <- subset(datos, atletismo == TRUE)
atletismo
## X nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 11 11 Juan M TRUE FALSE FALSE TRUE FALSE FALSE
## 14 14 Lucy F TRUE FALSE TRUE TRUE FALSE FALSE
## 18 18 Margarita F FALSE TRUE FALSE TRUE FALSE FALSE
## 24 24 Patricia F TRUE FALSE FALSE TRUE FALSE FALSE
## 30 30 Salvador M TRUE FALSE FALSE TRUE FALSE FALSE
## 43 43 Efren M TRUE FALSE FALSE TRUE FALSE FALSE
## 45 45 Fernando M TRUE FALSE FALSE TRUE FALSE FALSE
## 55 55 Marcela F FALSE FALSE FALSE TRUE FALSE FALSE
## 57 57 Otilia F TRUE FALSE FALSE TRUE FALSE FALSE
## 63 63 Sotelo M FALSE FALSE TRUE TRUE FALSE FALSE
## 64 64 Tiburcio M FALSE FALSE FALSE TRUE FALSE FALSE
## 67 67 Xóchitl F FALSE TRUE TRUE TRUE TRUE FALSE
Frecuencias de personas en atletismo
¿Cuántas personas hay que practican atletismo?
table(datos$atletismo)
##
## FALSE TRUE
## 55 12
Frecuencias relativas del conjunto Atletismo
¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue atletismo?
round(prop.table(table(datos$atletismo )),4)
##
## FALSE TRUE
## 0.8209 0.1791
round(prop.table(table(datos$atletismo )),4) * 100
##
## FALSE TRUE
## 82.09 17.91
Conjunto Tenis
7. ¿Cuál es la probabilidad de que un alumno juegue Tenis?
tenis<- subset(datos, tenis == TRUE)
tenis
## X nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 3 3 Aracely F FALSE FALSE FALSE FALSE FALSE TRUE
## 8 8 Gerardo M TRUE FALSE TRUE FALSE FALSE TRUE
## 19 19 Margarito M FALSE FALSE FALSE FALSE FALSE TRUE
## 32 32 Sandro M FALSE FALSE FALSE FALSE FALSE TRUE
Frecuencias de personas en Tenis
¿Cuántas personas hay que practican tenis?
table(datos$tenis)
##
## FALSE TRUE
## 63 4
Conjunto Ajedrez
8. ¿Cuál es la probabilidad de que un alumno practique Ajedrez?
ajedrez <- subset(datos, ajedrez == TRUE)
ajedrez
## X nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 21 21 Memo M TRUE FALSE FALSE FALSE TRUE FALSE
## 23 23 Paco M TRUE FALSE TRUE FALSE TRUE FALSE
## 44 44 Ernestina F TRUE FALSE TRUE FALSE TRUE FALSE
## 50 50 Guille F TRUE FALSE FALSE FALSE TRUE FALSE
## 67 67 Xóchitl F FALSE TRUE TRUE TRUE TRUE FALSE
Frecuencias de personas en Ajedrez
¿Cuántas personas hay que practican ajedrez?
table(datos$ajedrez)
##
## FALSE TRUE
## 62 5
Frecuencias relativas del conjunto Ajedrez
¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue ajedrez?
round(prop.table(table(datos$ajedrez )),4)
##
## FALSE TRUE
## 0.9254 0.0746
round(prop.table(table(datos$ajedrez )),4) * 100
##
## FALSE TRUE
## 92.54 7.46
Unión de conjuntos
1. Determine la probabilidad de que juegue fútbol o basquetbol
Unión de fútbol y basquetbol
futUbas <- union(futbol$nombres, basquetbol$nombres)
futUbas
## [1] "Eduardo" "Gerardo" "Juan" "Lucy" "Lupita" "Memo"
## [7] "Paco" "Patricia" "Paty" "Raul" "Romualdo" "Rubén"
## [13] "Salvador" "Saul" "Yuri" "Angélica" "Bety" "Carlos"
## [19] "Dany" "Dalia" "Efren" "Ernestina" "Fernando" "Gabriel"
## [25] "Guille" "Jorge" "Lorenzo" "Miguel" "Orlando" "Otilia"
## [31] "Pedro" "Raquel" "Walter" "Carmen" "Ernesto" "Gabino"
## [37] "Javier" "Jeorgina" "Laura" "Margarita" "Maria" "Fabián"
## [43] "Mikaela" "Sandy" "Xóchitl"
¿Cuántos alumnos hay que juegan fútbol o basquetbol?
cat("Hay ", length(futUbas), " alumnos que juegan fútbol o basquetbol de un total de ",n)
## Hay 45 alumnos que juegan fútbol o basquetbol de un total de 67
prob.futUbas <- length(futUbas) / n
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
", prob.futUbas)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
## 0.6716418
Intersección de conjuntos
Intersección entre futbol y basquetbol
futIbas <- intersect(futbol$nombres, basquetbol$nombres)
futIbas
## [1] "Lupita" "Paty" "Angélica" "Bety" "Dany" "Jorge"
## [7] "Miguel" "Pedro" "Raquel" "Walter"
Cálculo de probabilidad por frecuencia relativa de la intersección entre futbol y basquetbol
cat("Hay ", length(futIbas), " alumnos que juegan fútbol y que también juegan basquetbol de un total de ",n)
## Hay 10 alumnos que juegan fútbol y que también juegan basquetbol de un total de 67
prob.futIbas <- length(futIbas) / n
cat("¿Cuántos alumnos hay que juegan fútbol y basquetbol?", prob.futIbas)
## ¿Cuántos alumnos hay que juegan fútbol y basquetbol? 0.1492537
Ley de la adición para determinar probabilidades
Probabilidad de que juegue fútbol o que juegue basquetbol
prob.futbol <- prop.table(table(datos$futbol))
prob.basquetbol <- prop.table(table(datos$basquetbol))
prob.futbol <- prob.futbol[2]
prob.basquetbol <- prob.basquetbol[2]
prob.futbol
## TRUE
## 0.4925373
prob.basquetbol
## TRUE
## 0.3283582
Cálculo de probabilidad de P(futbol U basquetbol)
as.numeric(prob.futbol)
## [1] 0.4925373
as.numeric(prob.basquetbol)
## [1] 0.3283582
as.numeric(prob.futIbas)
## [1] 0.1492537
prob.futUbas <- as.numeric(prob.futbol) + as.numeric(prob.basquetbol) - as.numeric(prob.futIbas)
prob.futUbas
## [1] 0.6716418
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
", prob.futUbas)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
## 0.6716418
Tablas cruzadas
table(datos$futbol, datos$basquetbol)
##
## FALSE TRUE
## FALSE 22 12
## TRUE 23 10
Frecuencias utilizando tablas cruzadas
tabla.cruzada <- table(datos$futbol, datos$basquetbol, dnn = c('fútbol','basquetbol'))
tabla.cruzada
## basquetbol
## fútbol FALSE TRUE
## FALSE 22 12
## TRUE 23 10
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))
tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))
tabla.cruzada.s
## FALSE TRUE
## FALSE 22 12 34
## TRUE 23 10 33
## 45 22 67
Cálculo de probabilidades utilizando tablas cruzadas
prob.tabla.cruzada <- round(prop.table(table(datos$futbol, datos$basquetbol, dnn = c('fútbol','basquetbol'))),4)
prob.tabla.cruzada
## basquetbol
## fútbol FALSE TRUE
## FALSE 0.3284 0.1791
## TRUE 0.3433 0.1493
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum))
prob.tabla.cruzada
## FALSE TRUE
## FALSE 0.3284 0.1791 0.5075
## TRUE 0.3433 0.1493 0.4926
## 0.6717 0.3284 1.0001
2. Determine la probabilidad de que juegue tenis o ajedrez
Unión de tenis y ajedrez
tenUaje <- union(tenis$nombres, ajedrez$nombres)
tenUaje
## [1] "Aracely" "Gerardo" "Margarito" "Sandro" "Memo" "Paco"
## [7] "Ernestina" "Guille" "Xóchitl"
¿Cuántos alumnos hay que juegan tenis o ajedrez?
cat("Hay ", length(tenUaje), " alumnos que juegan tenis o ajedrez de un total de ",n)
## Hay 9 alumnos que juegan tenis o ajedrez de un total de 67
prob.tenUaje <- length(tenUaje) / n
cat("* ¿Cuál es la probabilidad de que existan alumnos que practiquen tenis o ajedrez?
", prob.tenUaje)
## * ¿Cuál es la probabilidad de que existan alumnos que practiquen tenis o ajedrez?
## 0.1343284
Intersección de conjuntos
Intersección entre tenis y ajedrez
tenIaje <- intersect(tenis$nombres, ajedrez$nombres)
tenIaje
## character(0)
Cálculo de probabilidad por frecuencia relativa de la intersección entre tenis y ajedrez
cat("Hay ", length(tenIaje), " alumnos que juegan tenis y que también juegan ajedrez de un total de ",n)
## Hay 0 alumnos que juegan tenis y que también juegan ajedrez de un total de 67
prob.tenIaje <- length(tenIaje) / n
cat("¿Cuántos alumnos hay que juegan tenis y ajedrez?", prob.tenIaje)
## ¿Cuántos alumnos hay que juegan tenis y ajedrez? 0
Ley de la adición para determinar probabilidades
Probabilidad de que juegue tenis o que juegue ajedrez
prob.tenis <- prop.table(table(datos$tenis))
prob.ajedrez <- prop.table(table(datos$ajedrez))
prob.tenis <- prob.tenis[2]
prob.ajedrez <- prob.ajedrez[2]
prob.tenis
## TRUE
## 0.05970149
prob.ajedrez
## TRUE
## 0.07462687
Cálculo de probabilidad de P(tenis U ajedrez)
as.numeric(prob.tenis)
## [1] 0.05970149
as.numeric(prob.ajedrez)
## [1] 0.07462687
as.numeric(prob.tenIaje)
## [1] 0
prob.tenUaje <- as.numeric(prob.tenis) + as.numeric(prob.ajedrez) - as.numeric(prob.tenIaje)
prob.tenUaje
## [1] 0.1343284
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen tenis o ajedrez?
", prob.tenUaje)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen tenis o ajedrez?
## 0.1343284
Tablas cruzadas
table(datos$tenis, datos$ajedrez)
##
## FALSE TRUE
## FALSE 58 5
## TRUE 4 0
Frecuencias utilizando tablas cruzadas
tabla.cruzada <- table(datos$tenis, datos$ajedrez, dnn = c('tenis','ajedrez'))
tabla.cruzada
## ajedrez
## tenis FALSE TRUE
## FALSE 58 5
## TRUE 4 0
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))
tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))
tabla.cruzada.s
## FALSE TRUE
## FALSE 58 5 63
## TRUE 4 0 4
## 62 5 67
Cálculo de probabilidades utilizando tablas cruzadas
prob.tabla.cruzada <- round(prop.table(table(datos$tenis, datos$ajedrez, dnn = c('tenis','ajedrez'))),4)
prob.tabla.cruzada
## ajedrez
## tenis FALSE TRUE
## FALSE 0.8657 0.0746
## TRUE 0.0597 0.0000
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum))
prob.tabla.cruzada
## FALSE TRUE
## FALSE 0.8657 0.0746 0.9403
## TRUE 0.0597 0.0000 0.0597
## 0.9254 0.0746 1.0000
3. Determine la probabilidad de que practique atletismo o juegue voleybol
Unión de atletismo y voleybol
atlUvol <- union(atletismo$nombres, voleybol$nombres)
atlUvol
## [1] "Juan" "Lucy" "Margarita" "Patricia" "Salvador" "Efren"
## [7] "Fernando" "Marcela" "Otilia" "Sotelo" "Tiburcio" "Xóchitl"
## [13] "Gerardo" "Lalo" "Luis" "Paco" "Saul" "Angélica"
## [19] "Arnulfo" "Dagoberto" "Ernestina" "Fabián" "Lorenzo"
¿Cuántos alumnos hay que juegan atletismo o voleybol?
cat("Hay ", length(atlUvol ), " alumnos que juegan atletismo o voleybol de un total de ",n)
## Hay 23 alumnos que juegan atletismo o voleybol de un total de 67
prob.atlUvol <- length(atlUvol) / n
cat("* ¿Cuál es la probabilidad de que existan alumnos que practiquen atletismo o voleybol?
", prob.atlUvol )
## * ¿Cuál es la probabilidad de que existan alumnos que practiquen atletismo o voleybol?
## 0.3432836
Intersección de conjuntos
Intersección entre atletismo y voleybol
atlIvol <- intersect(atletismo$nombres, voleybol$nombres)
atlIvol
## [1] "Lucy" "Sotelo" "Xóchitl"
Cálculo de probabilidad por frecuencia relativa de la intersección entre atletismo y voleybol
cat("Hay ", length(atlIvol), " alumnos que juegan atletismo y que también juegan voleybol de un total de ",n)
## Hay 3 alumnos que juegan atletismo y que también juegan voleybol de un total de 67
prob.atlIvol <- length(atlIvol) / n
cat("¿Cuántos alumnos hay que juegan atletismo y voleybol?", prob.atlIvol)
## ¿Cuántos alumnos hay que juegan atletismo y voleybol? 0.04477612
Ley de la adición para determinar probabilidades
Probabilidad de que practique atletismo o que juegue voleybol
prob.atletismo <- prop.table(table(datos$atletismo))
prob.voleybol <- prop.table(table(datos$voleybol))
prob.atletismo <- prob.atletismo[2]
prob.voleybol <- prob.voleybol[2]
prob.atletismo
## TRUE
## 0.1791045
prob.voleybol
## TRUE
## 0.2089552
Cálculo de probabilidad de P(atletismo U voleybol)
as.numeric(prob.atletismo)
## [1] 0.1791045
as.numeric(prob.voleybol)
## [1] 0.2089552
as.numeric(prob.atlIvol)
## [1] 0.04477612
prob.atlUvol <- as.numeric(prob.atletismo) + as.numeric(prob.voleybol) - as.numeric(prob.atlIvol)
prob.atlUvol
## [1] 0.3432836
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen atletismo o voleybol?
", prob.atlUvol)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen atletismo o voleybol?
## 0.3432836
Tablas cruzadas
table(datos$atletismo, datos$voleybol)
##
## FALSE TRUE
## FALSE 44 11
## TRUE 9 3
Frecuencias utilizando tablas cruzadas
tabla.cruzada <- table(datos$atletismo, datos$voleybol, dnn = c('atletismo','voleybol'))
tabla.cruzada
## voleybol
## atletismo FALSE TRUE
## FALSE 44 11
## TRUE 9 3
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))
tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))
tabla.cruzada.s
## FALSE TRUE
## FALSE 44 11 55
## TRUE 9 3 12
## 53 14 67
Cálculo de probabilidades utilizando tablas cruzadas
prob.tabla.cruzada <- round(prop.table(table(datos$atletismo, datos$voleybol, dnn = c('atletismo','voleybol'))),4)
prob.tabla.cruzada
## voleybol
## atletismo FALSE TRUE
## FALSE 0.6567 0.1642
## TRUE 0.1343 0.0448
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum))
prob.tabla.cruzada
## FALSE TRUE
## FALSE 0.6567 0.1642 0.8209
## TRUE 0.1343 0.0448 0.1791
## 0.7910 0.2090 1.0000
4. Determine la probabilidad de que juegue voleybol o fútbol
Unión de voleybol y futbol
volUfut <- union(voleybol$nombres, futbol$nombres)
volUfut
## [1] "Gerardo" "Lalo" "Lucy" "Luis" "Paco" "Saul"
## [7] "Angélica" "Arnulfo" "Dagoberto" "Ernestina" "Fabián" "Lorenzo"
## [13] "Sotelo" "Xóchitl" "Eduardo" "Juan" "Lupita" "Memo"
## [19] "Patricia" "Paty" "Raul" "Romualdo" "Rubén" "Salvador"
## [25] "Yuri" "Bety" "Carlos" "Dany" "Dalia" "Efren"
## [31] "Fernando" "Gabriel" "Guille" "Jorge" "Miguel" "Orlando"
## [37] "Otilia" "Pedro" "Raquel" "Walter"
¿Cuántos alumnos hay que juegan voleybol o futbol?
cat("Hay ", length(volUfut), " alumnos que juegan voleybol o futbol de un total de ",n)
## Hay 40 alumnos que juegan voleybol o futbol de un total de 67
prob.volUfut <- length(volUfut) / n
cat("* ¿Cuál es la probabilidad de que existan alumnos que practiquen voleybol o futbol?
", prob.volUfut )
## * ¿Cuál es la probabilidad de que existan alumnos que practiquen voleybol o futbol?
## 0.5970149
Intersección de conjuntos
Intersección entre voleybol y futbol
volIfut <- intersect(voleybol$nombres, futbol$nombres)
volIfut
## [1] "Gerardo" "Lucy" "Paco" "Saul" "Angélica" "Ernestina"
## [7] "Lorenzo"
Cálculo de probabilidad por frecuencia relativa de la intersección entre voleybol y futbol
cat("Hay ", length(volIfut), " alumnos que juegan voleybol y que también juegan futbol de un total de ",n)
## Hay 7 alumnos que juegan voleybol y que también juegan futbol de un total de 67
prob.volIfut <- length(volIfut) / n
cat("¿Cuántos alumnos hay que juegan voleybol y futbol?", prob.volIfut)
## ¿Cuántos alumnos hay que juegan voleybol y futbol? 0.1044776
Ley de la adición para determinar probabilidades
Probabilidad de que practique voleybol o que juegue futbol
prob.voleybol <- prop.table(table(datos$voleybol))
prob.futbol <- prop.table(table(datos$futbol))
pprob.voleybol<- prob.voleybol[2]
prob.futbol <- prob.futbol[2]
prob.voleybol
##
## FALSE TRUE
## 0.7910448 0.2089552
prob.futbol
## TRUE
## 0.4925373
Cálculo de probabilidad de P(voleybol U futbol)
as.numeric(prob.voleybol)
## [1] 0.7910448 0.2089552
as.numeric(prob.futbol)
## [1] 0.4925373
as.numeric(prob.volIfut)
## [1] 0.1044776
prob.volIfut <- as.numeric(prob.voleybol) + as.numeric(prob.futbol) - as.numeric(prob.volIfut)
prob.volIfut
## [1] 1.1791045 0.5970149
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen voleybol o futbol?
", prob.volIfut)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen voleybol o futbol?
## 1.179104 0.5970149
Tablas cruzadas
table(datos$voleybol, datos$futbol)
##
## FALSE TRUE
## FALSE 27 26
## TRUE 7 7
Frecuencias utilizando tablas cruzadas
tabla.cruzada <- table(datos$voleybol, datos$futbol, dnn = c('voleybol','futbol'))
tabla.cruzada
## futbol
## voleybol FALSE TRUE
## FALSE 27 26
## TRUE 7 7
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))
tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))
tabla.cruzada.s
## FALSE TRUE
## FALSE 27 26 53
## TRUE 7 7 14
## 34 33 67
Cálculo de probabilidades utilizando tablas cruzadas
prob.tabla.cruzada <- round(prop.table(table(datos$voleybol, datos$futbol, dnn = c('voleybol','futbol'))),4)
prob.tabla.cruzada
## futbol
## voleybol FALSE TRUE
## FALSE 0.4030 0.3881
## TRUE 0.1045 0.1045
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum))
prob.tabla.cruzada
## FALSE TRUE
## FALSE 0.4030 0.3881 0.7911
## TRUE 0.1045 0.1045 0.2090
## 0.5075 0.4926 1.0001
Determinación punto 5
Unión de basquetbol y voleybol
basUvol <- union(basquetbol$nombres, voleybol$nombres)
basUvol
## [1] "Carmen" "Ernesto" "Gabino" "Javier" "Jeorgina" "Laura"
## [7] "Lupita" "Margarita" "Maria" "Paty" "Angélica" "Bety"
## [13] "Dany" "Fabián" "Jorge" "Mikaela" "Miguel" "Pedro"
## [19] "Raquel" "Sandy" "Walter" "Xóchitl" "Gerardo" "Lalo"
## [25] "Lucy" "Luis" "Paco" "Saul" "Arnulfo" "Dagoberto"
## [31] "Ernestina" "Lorenzo" "Sotelo"
¿Cuántos alumnos hay que juegan basquetbol o voleybol?
cat("Hay ", length(basUvol), " alumnos que juegan basquetbol o voleybol de un total de ",n)
## Hay 33 alumnos que juegan basquetbol o voleybol de un total de 67
prob.basUvol <- length(basUvol) / n
cat("* ¿Cuál es la probabilidad de que existan alumnos que practiquen basquetbol o voleybol?
", prob.basUvol )
## * ¿Cuál es la probabilidad de que existan alumnos que practiquen basquetbol o voleybol?
## 0.4925373
Intersección de conjuntos
Intersección entre basquetbol y voleybol
basIvol <- intersect(basquetbol$nombres, voleybol$nombres)
basIvol
## [1] "Angélica" "Fabián" "Xóchitl"
Cálculo de probabilidad por frecuencia relativa de la intersección entre basquetbol y voleybol
cat("Hay ", length(basIvol), " alumnos que juegan basquetbol y que también juegan voleybol de un total de ",n)
## Hay 3 alumnos que juegan basquetbol y que también juegan voleybol de un total de 67
prob.basIvol <- length(basIvol) / n
cat("¿Cuántos alumnos hay que juegan basquetbol y voleybol?", prob.basIvol)
## ¿Cuántos alumnos hay que juegan basquetbol y voleybol? 0.04477612
Ley de la adición para determinar probabilidades
Probabilidad de que practique basquetbol o que juegue voleybol
prob.basquetbol <- prop.table(table(datos$basquetbol))
prob.voleybol <- prop.table(table(datos$voleybol))
pprob.basquetbol<- prob.basquetbol[2]
prob.voleybol <- prob.voleybol[2]
prob.basquetbol
##
## FALSE TRUE
## 0.6716418 0.3283582
prob.voleybol
## TRUE
## 0.2089552
Cálculo de probabilidad de P(basquetbol U voleybol)
as.numeric(prob.basquetbol)
## [1] 0.6716418 0.3283582
as.numeric(prob.voleybol)
## [1] 0.2089552
as.numeric(prob.basIvol)
## [1] 0.04477612
prob.basIvol <- as.numeric(prob.basquetbol) + as.numeric(prob.voleybol) - as.numeric(prob.basIvol)
prob.basIvol
## [1] 0.8358209 0.4925373
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen basquetbol o voleybol?
", prob.basIvol)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen basquetbol o voleybol?
## 0.8358209 0.4925373
Tablas cruzadas
table(datos$basquetbol, datos$voleybol)
##
## FALSE TRUE
## FALSE 34 11
## TRUE 19 3
Frecuencias utilizando tablas cruzadas
tabla.cruzada <- table(datos$basquetbol, datos$voleybol, dnn = c('basquetbol','voleybol'))
tabla.cruzada
## voleybol
## basquetbol FALSE TRUE
## FALSE 34 11
## TRUE 19 3
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))
tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))
tabla.cruzada.s
## FALSE TRUE
## FALSE 34 11 45
## TRUE 19 3 22
## 53 14 67
Cálculo de probabilidades utilizando tablas cruzadas
prob.tabla.cruzada <- round(prop.table(table(datos$basquetbol, datos$voleybol, dnn = c('basquetbol','voleybol'))),4)
prob.tabla.cruzada
## voleybol
## basquetbol FALSE TRUE
## FALSE 0.5075 0.1642
## TRUE 0.2836 0.0448
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum))
prob.tabla.cruzada
## FALSE TRUE
## FALSE 0.5075 0.1642 0.6717
## TRUE 0.2836 0.0448 0.3284
## 0.7911 0.2090 1.0001
Conclusión
Durante este ejercicio en Rstudio de probabilidad y estadística, se practico el uso y calculo de frecuencias relativas para varios conjuntos de personas que practican las actividades de futbol, basquetbol, voleibol, atletismo, tenis y ajedrez. Después de cargar estos datos desde un link de gifthub, se trabajo con la probabilidad de ciertos eventos para ocurrir, ya sea, que una persona juegue básquet y voleibol o futbol y básquet. Para determinar la probabilidad en estas condiciones se utilizaron los métodos de la ley de adición y el de las tablas cruzadas que nos proporcionaron los resultados de las probabilidades previamente mencionadas.