--- title: "Calculo de Probabilidades" author: "Irving Alonso Galvan Carabez" date: "28/3/2020" output: html_document --- ## Cargar libreria ```{r} library(readr) ``` ## Importar los datos ```{r} datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/practicas%20R/unidad%202/alumnos.deportes.2020.csv") datos ``` ## Cantidad de datos ```{r} n <- nrow(datos) ``` ##Conjunto tanto de hombres y mujeres con la funcion subset() ```{r} hombres <- subset(datos, sexo =='M') mujeres <- subset(datos, sexo =='F') hombres ``` ```{r} hombres <- subset(datos, sexo =='M') mujeres <- subset(datos, sexo =='F') mujeres ``` ##Frecuencias de Hombres y Mujeres ```{r} table(datos$sexo) ``` ##Frecuencias relativas de Hombres y Mujeres mediante la funcion prop.table(table()). ```{r} round(prop.table(table(datos$sexo)),4) ``` ```{r} round(prop.table(table(datos$sexo)),4) * 100 ``` ##Pregunta 1: ¿Cual es la probabilidad de que un alumno sea hombre? 50.75% ##Pregunta 2: ¿Cual es la probabilidad de que un alumno sea mujer? 49.25% ##Conjunto Fútbol ```{r} futbol <- subset(datos, futbol == TRUE) futbol ``` ##Frecuencias de personas en Fútbol ```{r} table(datos$futbol) ``` ##Frecuencias relativas del conjunto Fútbol ```{r} round(prop.table(table(datos$futbol)),4) ``` ```{r} round(prop.table(table(datos$futbol)),4) * 100 ``` ##Pregunta 3: ¿Cuál es la probabilidad de que un alumno juegue fútbol? 49.25% ##Conjunto Basquetbol ```{r} basquetbol <- subset(datos, basquetbol == TRUE) basquetbol ``` ##Frecuencias de personas en basquetbol ```{r} table(datos$basquetbol ) ``` ##Frecuencias relativas del conjunto basquetbol ```{r} round(prop.table(table(datos$basquetbol )),4) ``` ```{r} round(prop.table(table(datos$basquetbol )),4) * 100 ``` ##Pregunta 4: ¿Cuál es la probabilidad de que un alumno juegue basquetbol ? 32.84% ##Conjunto voleybol ```{r} voleybol <- subset(datos, voleybol == TRUE) voleybol ``` ##Frecuencias de personas en voleybol ```{r} table(datos$voleybol ) ``` ##Frecuencias relativas del conjunto voleybol ```{r} round(prop.table(table(datos$voleybol )),4) ``` ```{r} round(prop.table(table(datos$voleybol )),4) * 100 ``` ##Pregunta 5: ¿Cuál es la probabilidad de que un alumno juegue voleybol? 20.9% ##Conjunto atletismo ```{r} atletismo <- subset(datos, atletismo == TRUE) atletismo ``` ##Frecuencias de personas en atletismo ```{r} table(datos$atletismo ) ``` ##Frecuencias relativas del conjunto atletismo ```{r} round(prop.table(table(datos$atletismo )),4) ``` ```{r} round(prop.table(table(datos$atletismo )),4) * 100 ``` ##Pregunta 6: ¿Cuál es la probabilidad de que un alumno practique atletismo? 17.91% ##Conjunto tenis ```{r} tenis <- subset(datos, tenis == TRUE) tenis ``` ##Frecuencias de personas en tenis ```{r} table(datos$tenis ) ``` ##Frecuencias relativas del conjunto tenis ```{r} round(prop.table(table(datos$tenis )),4) ``` ```{r} round(prop.table(table(datos$tenis )),4) * 100 ``` ##Pregunta 7: ¿Cuál es la probabilidad de que un alumno practique tenis? 5.97% ##Conjunto ajedrez ```{r} ajedrez <- subset(datos, ajedrez == TRUE) ajedrez ``` ##Frecuencias de personas en ajedrez ```{r} table(datos$ajedrez ) ``` ##Frecuencias relativas del conjunto ajedrez ```{r} round(prop.table(table(datos$ajedrez )),4) ``` ```{r} round(prop.table(table(datos$ajedrez )),4) * 100 ``` ##Pregunta 8: ¿Cuál es la probabilidad de que un alumno juegue ajedrez? 7.46% ##Unión de conjuntos ##Unión de fútbol y basquetbol ```{r} futUbas <- union(futbol$nombres, basquetbol$nombres) futUbas ``` ##Cálculo de probabilidad por frecuencia relativa ```{r} cat("Hay ", length(futUbas), " alumnos que juegan fútbol o basquetbol de un total de ",n) ``` ```{r} prob.futUbas <- length(futUbas) / n cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol? ", prob.futUbas) ``` ##Intersección de conjuntos de futbol y basquetbol ```{r} futIbas <- intersect(futbol$nombres, basquetbol$nombres) futIbas ``` ##Cálculo de probabilidad por frecuencia relativa de la intersección entre futbol y basquetbol ```{r} cat("Hay ", length(futIbas), " alumnos que juegan fútbol y que también juegan basquetbol de un total de ",n) ``` ```{r} prob.futIbas <- length(futIbas) / n cat("¿Cuántos alumnos hay que juegan fútbol y basquetbol?", prob.futIbas) ``` ##Probabilidad por medio de la ley de adicion ##Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ```{r} prob.futbol <- prop.table(table(datos$futbol)) prob.basquetbol <- prop.table(table(datos$basquetbol)) prob.futbol <- prob.futbol[2] prob.basquetbol <- prob.basquetbol[2] prob.futbol ``` ```{r} prob.basquetbol ``` ```{r} as.numeric(prob.futbol) ``` ```{r} as.numeric(prob.basquetbol) ``` ```{r} as.numeric(prob.futIbas) ``` ```{r} prob.futUbas <- as.numeric(prob.futbol) + as.numeric(prob.basquetbol) - as.numeric(prob.futIbas) prob.futUbas ``` ```{r} cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol? ", prob.futUbas) ``` ##Unión de tenis y ajedrez ```{r} tenUaje <- union(tenis$nombres, ajedrez$nombres) tenUaje ``` ##Cálculo de probabilidad por frecuencia relativa ```{r} cat("Hay ", length(tenUaje), " alumnos que juegan tenis o ajedrez de un total de ",n) ``` ```{r} prob.tenUaje <- length(tenUaje) / n cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen tenis o ajedrez? ", prob.tenUaje) ``` ##Intersección de conjuntos de tenis y ajedrez ```{r} tenIaje <- intersect(tenis$nombres, ajedrez$nombres) tenIaje ``` ##Cálculo de probabilidad por frecuencia relativa de la intersección entre tenis y ajedrez ```{r} cat("Hay ", length(tenIaje), " alumnos que juegan tenis y que también juegan ajedrez de un total de ",n) ``` ```{r} prob.tenIaje <- length(tenIaje) / n cat("¿Cuántos alumnos hay que juegan tenis y ajedrez?", prob.futIbas) ``` ##Probabilidad por medio de la ley de adicion ##Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ```{r} prob.tenis <- prop.table(table(datos$tenis)) prob.ajedrez <- prop.table(table(datos$ajedrez)) prob.tenis <- prob.tenis[2] prob.ajedrez <- prob.ajedrez[2] prob.tenis ``` ```{r} prob.ajedrez ``` ```{r} as.numeric(prob.tenis) ``` ```{r} as.numeric(prob.ajedrez) ``` ```{r} as.numeric(prob.tenIaje) ``` ```{r} prob.tenUaje <- as.numeric(prob.tenis) + as.numeric(prob.ajedrez) - as.numeric(prob.tenIaje) prob.tenUaje ``` ```{r} cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen tenis o ajedrez? ", prob.tenUaje) ``` ##Unión de atletismo y voleybol ```{r} atleUvol <- union(atletismo$nombres, voleybol$nombres) atleUvol ``` ##Cálculo de probabilidad por frecuencia relativa ```{r} cat("Hay ", length(atleUvol), " alumnos que juegan atletismo o voleybol de un total de ",n) ``` ```{r} prob.atleUvol <- length(atleUvol) / n cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen atletismo o voleybol? ", prob.atleUvol) ``` ##Intersección de conjuntos de atletismo y voleybol ```{r} atleIvol <- intersect(atletismo$nombres, voleybol$nombres) atleIvol ``` ##Cálculo de probabilidad por frecuencia relativa de la intersección entre atletismo y voleybol ```{r} cat("Hay ", length(atleIvol), " alumnos que juegan atletismo y que también juegan voleybol de un total de ",n) ``` ```{r} prob.atleIvol <- length(atleIvol) / n cat("¿Cuántos alumnos hay que juegan atletismo y voleybol?", prob.atleIvol) ``` ##Probabilidad por medio de la ley de adicion ##Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ```{r} prob.atletismo <- prop.table(table(datos$atletismo)) prob.voleybol <- prop.table(table(datos$voleybol)) prob.atletismo <- prob.atletismo[2] prob.voleybol <- prob.voleybol[2] prob.atletismo ``` ```{r} prob.voleybol ``` ```{r} as.numeric(prob.atletismo) ``` ```{r} as.numeric(prob.voleybol) ``` ```{r} as.numeric(prob.atleIvol) ``` ```{r} prob.atleUvol <- as.numeric(prob.atletismo) + as.numeric(prob.voleybol) - as.numeric(prob.atleIvol) prob.atleUvol ``` ```{r} cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen atletismo o voleybol? ", prob.atleUvol) ``` ##Unión de voleybol y futbol ```{r} volUfut <- union(voleybol$nombres, futbol$nombres) volUfut ``` ##Cálculo de probabilidad por frecuencia relativa ```{r} cat("Hay ", length(volUfut), " alumnos que juegan voleybol o futbol de un total de ",n) ``` ```{r} prob.volUfut <- length(volUfut) / n cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol? ", prob.volUfut) ``` ##Intersección de conjuntos de voleybol y futbol ```{r} volIfut <- intersect(voleybol$nombres, futbol$nombres) volIfut ``` ##Cálculo de probabilidad por frecuencia relativa de la intersección entre voleybol y futbol ```{r} cat("Hay ", length(volIfut), " alumnos que juegan voleybol y que también juegan futbol de un total de ",n) ``` ```{r} prob.volIfut <- length(volIfut) / n cat("¿Cuántos alumnos hay que juegan fútbol y basquetbol?", prob.volIfut) ``` ##Probabilidad por medio de la ley de adicion ##Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ```{r} prob.futbol <- prop.table(table(datos$futbol)) prob.voleybol <- prop.table(table(datos$voleybol)) prob.futbol <- prob.futbol[2] prob.voleybol <- prob.voleybol[2] prob.futbol ``` ```{r} prob.voleybol ``` ```{r} as.numeric(prob.futbol) ``` ```{r} as.numeric(prob.voleybol) ``` ```{r} as.numeric(prob.volIfut) ``` ```{r} prob.volUfut <- as.numeric(prob.futbol) + as.numeric(prob.voleybol) - as.numeric(prob.volIfut) prob.volUfut ``` ```{r} cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen voleybol o futbol ? ", prob.volUfut) ``` ##Unión de basquetbol y voleybol ```{r} basUvol <- union(voleybol$nombres, basquetbol$nombres) basUvol ``` ##Cálculo de probabilidad por frecuencia relativa ```{r} cat("Hay ", length(basUvol), " alumnos que juegan basquetbol o voleybol de un total de ",n) ``` ```{r} prob.basUvol <- length(basUvol) / n cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen basquetbol o voleybol? ", prob.basUvol) ``` ##Intersección de conjuntos de basquetbol y voleybol ```{r} basIvol <- intersect(voleybol$nombres, basquetbol$nombres) basIvol ``` ##Cálculo de probabilidad por frecuencia relativa de la intersección entre basquetbol y voleybol ```{r} cat("Hay ", length(basIvol), " alumnos que juegan basquetbol y que también juegan voleybol de un total de ",n) ``` ```{r} prob.basIvol <- length(basIvol) / n cat("¿Cuántos alumnos hay que juegan basquetbol y voleybol?", prob.basIvol) ``` ##Probabilidad por medio de la ley de adicion ##Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ```{r} prob.basquetbol <- prop.table(table(datos$basquetbol)) prob.voleybol <- prop.table(table(datos$voleybol)) prob.basquetbol <- prob.basquetbol[2] prob.voleybol <- prob.voleybol[2] prob.basquetbol ``` ```{r} prob.voleybol ``` ```{r} as.numeric(prob.basquetbol) ``` ```{r} as.numeric(prob.voleybol) ``` ```{r} as.numeric(prob.basIvol) ``` ```{r} prob.basUvol <- as.numeric(prob.basquetbol) + as.numeric(prob.voleybol) - as.numeric(prob.basIvol) prob.basUvol ``` ```{r} cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen basquetbol o voleybol ? ", prob.basUvol) ``` ##Tablas cruzadas ##futbol y basquetbol ```{r} table(datos$futbol, datos$basquetbol) ``` ##Frecuencias utilizando tablas cruzadas ```{r} tabla.cruzada <- table(datos$futbol, datos$basquetbol, dnn = c('fútbol','basquetbol')) tabla.cruzada ``` ```{r} tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum)) tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum)) tabla.cruzada.s ``` ##Interpretación de la tabla cruzada frecuencias ##Hay 34 alumnos que juegan futbol; renglón 2 de un total de 67 ##Hay 22 personas que juegan basquetbol columna 2 de un total de 67 ##Hay 10 personas que juegan futbol y basquetbol al mismo tiempo de un total de 67 ##Cálculo de probabilidades utilizando tablas cruzadas ```{r} prob.tabla.cruzada <- round(prop.table(table(datos$futbol, datos$basquetbol, dnn = c('fútbol','basquetbol'))),4) prob.tabla.cruzada ``` ```{r} prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum)) prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) prob.tabla.cruzada ``` ##Interpretación de la tabla cruzada probabilidades ##34 alumnos que juegan futbol que representan el 49.26% del 100% ##Hay 22 personas que juegan basquetbol que representan el 32.84% del 100% ##Hay 10c personas que juegan futbol y basquetbol al mismo tiempo que representan el 14.93% del 100% o del total de alumnos ###Tenis o Ajedrez ```{r} table(datos$tenis, datos$ajedrez) ``` ##Frecuencias utilizando tablas cruzadas ```{r} tabla.cruzada <- table(datos$tenis, datos$ajedrez, dnn = c('tenis','ajedrez')) tabla.cruzada ``` ```{r} tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum)) tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum)) tabla.cruzada.s ``` ##Interpretación de la tabla cruzada frecuencias ##Hay 5 alumnos que juegan ajedrez; renglón 2 de un total de 67 ##Hay 4 personas que juegan tenis columna 2 de un total de 67 ##Hay 0 personas que juegan futbol y basquetbol al mismo tiempo de un total de 67 ##Cálculo de probabilidades utilizando tablas cruzadas ```{r} prob.tabla.cruzada <- round(prop.table(table(datos$tenis, datos$ajedrez, dnn = c('tenis','ajedrez'))),4) prob.tabla.cruzada ``` ```{r} prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum)) prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) prob.tabla.cruzada ``` ##Interpretación de la tabla cruzada probabilidades ##5 alumnos que juegan ajedrez que representan el 7.46% del 100% ##Hay 4 personas que juegan tenis que representan el 5.97% del 100% ##Hay 58 personas que juegan no juegan ni ajedrez ni tenis al mismo tiempo que representan el 86.56% del 100% o del total de alumnos ##Atletismo o Voleybol ```{r} table(datos$atletismo, datos$voleybol) ``` ##Frecuencias utilizando tablas cruzadas ```{r} tabla.cruzada <- table(datos$atletismo, datos$voleybol, dnn = c('atletismo','voleybol ')) tabla.cruzada ``` ```{r} tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum)) tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum)) tabla.cruzada.s ``` ##Interpretación de la tabla cruzada frecuencias ##Hay 12 alumnos que juegan atletismo; renglón 2 de un total de 67 ##Hay 14 personas que juegan voleyvol columna 2 de un total de 67 ##Hay 3 personas que juegan voleybol y atletismo al mismo tiempo de un total de 67 ##Cálculo de probabilidades utilizando tablas cruzadas ```{r} prob.tabla.cruzada <- round(prop.table(table(datos$atletismo, datos$voleybol, dnn = c('atletismo','voleybol'))),4) prob.tabla.cruzada ``` ```{r} prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum)) prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) prob.tabla.cruzada ``` ##Interpretación de la tabla cruzada probabilidades ##12 alumnos que juegan atletismo que representan el 17.91% del 100% ##Hay 14 personas que juegan voleybol que representan el 20.89% del 100% ##Hay 3 personas que juegan boleybol y atletismo al mismo tiempo que representan el 4.47% del 100% o del total de alumnos ##Hay 41 personas que no juegan ni voleybol ni atletismo y representan el 61.19% ##Voleybol o futbol ```{r} table(datos$voleybol, datos$futbol) ``` ##Frecuencias utilizando tablas cruzadas ```{r} tabla.cruzada <- table(datos$voleybol, datos$futbol, dnn = c('voleybol','futbol ')) tabla.cruzada ``` ```{r} tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum)) tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum)) tabla.cruzada.s ``` ##Interpretación de la tabla cruzada frecuencias ##Hay 33 alumnos que juegan futbol; renglón 2 de un total de 67 ##Hay 14 personas que juegan voleyvol columna 2 de un total de 67 ##Hay 7 personas que juegan voleybol y atletismo al mismo tiempo de un total de 67 ##Cálculo de probabilidades utilizando tablas cruzadas ```{r} prob.tabla.cruzada <- round(prop.table(table(datos$voleybol, datos$futbol, dnn = c('voleybol','futbol'))),4) prob.tabla.cruzada ``` ```{r} prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum)) prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) prob.tabla.cruzada ``` ##Interpretación de la tabla cruzada probabilidades ##33 alumnos que juegan futbol que representan el 49.25% del 100% ##Hay 14 personas que juegan voleybol que representan el 20.89% del 100% ##Hay 7 personas que juegan voleybol y futbol al mismo tiempo que representan el 10.44% del 100% o del total de alumnos ##Hay 20 personas que no juegan ni voleybol ni futbol y representan el 29.85% ##basquetbol o voleybol ```{r} table(datos$basquetbol, datos$voleybol) ``` ##Frecuencias utilizando tablas cruzadas ```{r} tabla.cruzada <- table(datos$basquetbol, datos$voleybol, dnn = c('basquetbol','voleybol ')) tabla.cruzada ``` ```{r} tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum)) tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum)) tabla.cruzada.s ``` ##Interpretación de la tabla cruzada frecuencias ##Hay 22 alumnos que juegan basquetbol; columna 2 de un total de 67 ##Hay 14 personas que juegan voleyvol renglon 2 de un total de 67 ##Hay 3 personas que juegan basquetbol y voleybol al mismo tiempo de un total de 67 ##Cálculo de probabilidades utilizando tablas cruzadas ```{r} prob.tabla.cruzada <- round(prop.table(table(datos$basquetbol, datos$voleybol, dnn = c('basquetbol','voleybol'))),4) prob.tabla.cruzada ``` ```{r} prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum)) prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) prob.tabla.cruzada ``` ##Interpretación de la tabla cruzada probabilidades ##22 alumnos que juegan basquetbol que representan el 32.83% del 100% ##Hay 14 personas que juegan voleybol que representan el 20.89% del 100% ##Hay 3 personas que juegan voleybol y basquetbol al mismo tiempo que representan el 4.4% del 100% o del total de alumnos ##Hay 31 personas que no juegan ni voleybol ni basquet y representan el 46.26%