¿Qué es la probabilidad? La probabilidad es simplemente qué tan posible es que ocurra un evento determinado.

Objetivo. Calcular y evaluar probabilidades por el método de frecuencia relativa y por la ley de la adición.

Descripción De un grupo de alumnos se les pregunta su género y las disciplinas deportivas que practica de entre futbol, basquebol, voleybol, atletismo y ajedrez. Puede haber casos que practiquen dos disciplinas deportivas Preparar los datos. Cargar un conjunto de datos con la finalidad de identificar conjuntos para determinar probabilidaes por dos opciones: por frecuencia relativas y por la fórmula de la ley de la adición Proceso Generar conjuntos de alumnos o personas que practican alguna o varias actividades deportivas Se identifican las probabilidades por medio del método de frecuencia relativa Se determina la unión de conjuntos Se determina la diferencia de conjuntos Se determinan probabilidad por medio de la ley de la adición con la fórmula. Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) Demostrar las igualdades en el cálculo de las probabilidades por ambos métodos. Las librerías

library(readr)

Los datos

datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/practicas%20R/unidad%202/alumnos.deportes.2020.csv")

datos
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 1   1       Ana    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 2   2   Antonio    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 3   3   Aracely    F  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 4   4    Carmen    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 5   5   Eduardo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 6   6   Ernesto    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 7   7    Gabino    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 8   8   Gerardo    M   TRUE      FALSE     TRUE     FALSE   FALSE  TRUE
## 9   9    Javier    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 10 10  Jeorgina    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 11 11      Juan    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 12 12      Lalo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 13 13     Laura    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 14 14      Lucy    F   TRUE      FALSE     TRUE      TRUE   FALSE FALSE
## 15 15      Luis    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 16 16     Luisa    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 17 17    Lupita    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 18 18 Margarita    F  FALSE       TRUE    FALSE      TRUE   FALSE FALSE
## 19 19 Margarito    M  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 20 20     Maria    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 21 21      Memo    M   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 22 22     Oscar    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 23 23      Paco    M   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 24 24  Patricia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 25 25      Paty    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 26 26      Raul    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 27 27  Romualdo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 28 28   Rosario    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 29 29     Rubén    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 30 30  Salvador    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 31 31    Sandra    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 32 32    Sandro    M  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 33 33      Saul    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 34 34      Yuri    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 35 35    Arturo    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 36 36  Angélica    F   TRUE       TRUE     TRUE     FALSE   FALSE FALSE
## 37 37   Arnulfo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 38 38      Bety    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 39 39    Carlos    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 40 40 Dagoberto    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 41 41      Dany    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 42 42     Dalia    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 43 43     Efren    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 44 44 Ernestina    F   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 45 45  Fernando    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 46 46    Fabián    M  FALSE       TRUE     TRUE     FALSE   FALSE FALSE
## 47 47  Fernanda    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 48 48  Gabriela    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 49 49   Gabriel    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 50 50    Guille    F   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 51 51     Jorge    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 52 52   Lorenzo    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 53 53   Mikaela    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 54 54    Miguel    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 55 55   Marcela    F  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
## 56 56   Orlando    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 57 57    Otilia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 58 58     Pedro    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 59 59     Perla    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 60 60    Raquel    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 61 61    Susana    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 62 62     Sandy    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 63 63    Sotelo    M  FALSE      FALSE     TRUE      TRUE   FALSE FALSE
## 64 64  Tiburcio    M  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
## 65 65    Teresa    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 66 66    Walter    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE
n <- nrow(datos) # Determina conjunto de obesrvaciones o renglones

Conjunto Hombres y Mujeres Se determinan los conjuntos según el género de la persona mediante la función subset() que permite filtrar datos hombres mujeres

hombres <- subset(datos, sexo =='M')
mujeres <- subset(datos, sexo =='F')

hombres
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 2   2   Antonio    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 5   5   Eduardo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 6   6   Ernesto    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 7   7    Gabino    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 8   8   Gerardo    M   TRUE      FALSE     TRUE     FALSE   FALSE  TRUE
## 9   9    Javier    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 11 11      Juan    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 12 12      Lalo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 15 15      Luis    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 19 19 Margarito    M  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 21 21      Memo    M   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 22 22     Oscar    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 23 23      Paco    M   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 26 26      Raul    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 27 27  Romualdo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 29 29     Rubén    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 30 30  Salvador    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 32 32    Sandro    M  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 33 33      Saul    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 35 35    Arturo    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 37 37   Arnulfo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 39 39    Carlos    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 40 40 Dagoberto    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 43 43     Efren    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 45 45  Fernando    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 46 46    Fabián    M  FALSE       TRUE     TRUE     FALSE   FALSE FALSE
## 49 49   Gabriel    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 51 51     Jorge    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 52 52   Lorenzo    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 54 54    Miguel    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 56 56   Orlando    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 58 58     Pedro    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 63 63    Sotelo    M  FALSE      FALSE     TRUE      TRUE   FALSE FALSE
## 64 64  Tiburcio    M  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
mujeres
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 1   1       Ana    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 3   3   Aracely    F  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 4   4    Carmen    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 10 10  Jeorgina    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 13 13     Laura    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 14 14      Lucy    F   TRUE      FALSE     TRUE      TRUE   FALSE FALSE
## 16 16     Luisa    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 17 17    Lupita    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 18 18 Margarita    F  FALSE       TRUE    FALSE      TRUE   FALSE FALSE
## 20 20     Maria    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 24 24  Patricia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 25 25      Paty    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 28 28   Rosario    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 31 31    Sandra    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 34 34      Yuri    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 36 36  Angélica    F   TRUE       TRUE     TRUE     FALSE   FALSE FALSE
## 38 38      Bety    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 41 41      Dany    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 42 42     Dalia    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 44 44 Ernestina    F   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 47 47  Fernanda    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 48 48  Gabriela    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 50 50    Guille    F   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 53 53   Mikaela    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 55 55   Marcela    F  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
## 57 57    Otilia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 59 59     Perla    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 60 60    Raquel    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 61 61    Susana    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 62 62     Sandy    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 65 65    Teresa    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 66 66    Walter    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE

Frecuencias de Hombres y Mujeres Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable ¿Cuántos casos hay que son hombres? ¿Cuántos casos hay que son mujeres?

round(prop.table(table(datos$sexo)),4)
## 
##      F      M 
## 0.4925 0.5075
round(prop.table(table(datos$sexo)),4) * 100
## 
##     F     M 
## 49.25 50.75

Conjunto Fútbol Se determina el conjunto de personas que practican el deporte del fútbol según la disciplina de fubol futbol

futbol <- subset(datos, futbol  == TRUE)

futbol
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 5   5   Eduardo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 8   8   Gerardo    M   TRUE      FALSE     TRUE     FALSE   FALSE  TRUE
## 11 11      Juan    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 14 14      Lucy    F   TRUE      FALSE     TRUE      TRUE   FALSE FALSE
## 17 17    Lupita    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 21 21      Memo    M   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 23 23      Paco    M   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 24 24  Patricia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 25 25      Paty    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 26 26      Raul    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 27 27  Romualdo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 29 29     Rubén    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 30 30  Salvador    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 33 33      Saul    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 34 34      Yuri    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 36 36  Angélica    F   TRUE       TRUE     TRUE     FALSE   FALSE FALSE
## 38 38      Bety    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 39 39    Carlos    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 41 41      Dany    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 42 42     Dalia    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 43 43     Efren    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 44 44 Ernestina    F   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 45 45  Fernando    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 49 49   Gabriel    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 50 50    Guille    F   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 51 51     Jorge    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 52 52   Lorenzo    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 54 54    Miguel    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 56 56   Orlando    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 57 57    Otilia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 58 58     Pedro    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 60 60    Raquel    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 66 66    Walter    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE

Frecuencias de personas en Fútbol Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable ¿Cuántas personas hay que practican Fútbol?

table(datos$futbol)
## 
## FALSE  TRUE 
##    34    33

Frecuencias relativas del conjunto Fútbol Determinar frecuencias relativas mediante función prop.table(table()). ¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue fútbol? Se redondea a 4 posiciones decimales Se determinala probabilidad en %

round(prop.table(table(datos$futbol)),4)
## 
##  FALSE   TRUE 
## 0.5075 0.4925
round(prop.table(table(datos$futbol)),4) * 100
## 
## FALSE  TRUE 
## 50.75 49.25

Conjunto Basquetbol Se determina el conjunto de personas que practican el deporte del basquetbol según la disciplina de basquetbol basquetbol

basquetbol <- subset(datos, basquetbol == TRUE)

basquetbol
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 4   4    Carmen    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 6   6   Ernesto    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 7   7    Gabino    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 9   9    Javier    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 10 10  Jeorgina    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 13 13     Laura    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 17 17    Lupita    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 18 18 Margarita    F  FALSE       TRUE    FALSE      TRUE   FALSE FALSE
## 20 20     Maria    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 25 25      Paty    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 36 36  Angélica    F   TRUE       TRUE     TRUE     FALSE   FALSE FALSE
## 38 38      Bety    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 41 41      Dany    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 46 46    Fabián    M  FALSE       TRUE     TRUE     FALSE   FALSE FALSE
## 51 51     Jorge    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 53 53   Mikaela    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 54 54    Miguel    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 58 58     Pedro    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 60 60    Raquel    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 62 62     Sandy    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 66 66    Walter    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE

Frecuencias de personas en Basquetbol Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable ¿Cuántas personas hay que practican Basquetbol?

table(datos$basquetbol)
## 
## FALSE  TRUE 
##    45    22

Frecuencias relativas del conjunto Basquetbol Determinar frecuencias relativas mediante función prop.table(table()). ¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue basquetbol? Se redondea a 4 posiciones decimales Se determinala probabilidad en %

round(prop.table(table(datos$basquetbol)),4)
## 
##  FALSE   TRUE 
## 0.6716 0.3284
round(prop.table(table(datos$basquetbol)),4) * 100
## 
## FALSE  TRUE 
## 67.16 32.84

Conjunto Voleybol Se determina el conjunto de personas que practican el deporte del Voleybol según la disciplina de Voleybol voleybol

voleybol <- subset(datos, voleybol == TRUE)

voleybol
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 8   8   Gerardo    M   TRUE      FALSE     TRUE     FALSE   FALSE  TRUE
## 12 12      Lalo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 14 14      Lucy    F   TRUE      FALSE     TRUE      TRUE   FALSE FALSE
## 15 15      Luis    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 23 23      Paco    M   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 33 33      Saul    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 36 36  Angélica    F   TRUE       TRUE     TRUE     FALSE   FALSE FALSE
## 37 37   Arnulfo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 40 40 Dagoberto    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 44 44 Ernestina    F   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 46 46    Fabián    M  FALSE       TRUE     TRUE     FALSE   FALSE FALSE
## 52 52   Lorenzo    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 63 63    Sotelo    M  FALSE      FALSE     TRUE      TRUE   FALSE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE

Frecuencias de personas en Voleybol Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable ¿Cuántas personas hay que practican voleybol?

table(datos$voleybol)
## 
## FALSE  TRUE 
##    53    14

Frecuencias relativas del conjunto Voleybol Determinar frecuencias relativas mediante función prop.table(table()). ¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue voleybol? Se redondea a 4 posiciones decimales Se determina la probabilidad en %

round(prop.table(table(datos$voleybol)),4)
## 
## FALSE  TRUE 
## 0.791 0.209
round(prop.table(table(datos$voleybol)),4) * 100
## 
## FALSE  TRUE 
##  79.1  20.9

Conjunto Atletismo Se determina el conjunto de personas que practican el deporte del atletismo según la disciplina de atletismo atletismo

atletismo  <- subset(datos, atletismo  == TRUE)

atletismo
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 11 11      Juan    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 14 14      Lucy    F   TRUE      FALSE     TRUE      TRUE   FALSE FALSE
## 18 18 Margarita    F  FALSE       TRUE    FALSE      TRUE   FALSE FALSE
## 24 24  Patricia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 30 30  Salvador    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 43 43     Efren    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 45 45  Fernando    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 55 55   Marcela    F  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
## 57 57    Otilia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 63 63    Sotelo    M  FALSE      FALSE     TRUE      TRUE   FALSE FALSE
## 64 64  Tiburcio    M  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE

Frecuencias de personas en atletismo Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable ¿Cuántas personas hay que practican atletismo?

table(datos$atletismo )
## 
## FALSE  TRUE 
##    55    12

Frecuencias relativas del conjunto Atletismo Determinar frecuencias relativas mediante función prop.table(table()). ¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue atletismo? Se redondea a 4 posiciones decimales Se determina la probabilidad en %

round(prop.table(table(datos$atletismo )),4)
## 
##  FALSE   TRUE 
## 0.8209 0.1791
round(prop.table(table(datos$atletismo )),4) * 100
## 
## FALSE  TRUE 
## 82.09 17.91

Conjunto Ajedrez Se determina el conjunto de personas que practican el deporte del ajedrez según la disciplina de ajedrez ajedrez

ajedrez  <- subset(datos, ajedrez  == TRUE)

ajedrez 
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 21 21      Memo    M   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 23 23      Paco    M   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 44 44 Ernestina    F   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 50 50    Guille    F   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE

Frecuencias de personas en Ajedrez Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable ¿Cuántas personas hay que practican ajedrez?

table(datos$ajedrez )
## 
## FALSE  TRUE 
##    62     5

Frecuencias relativas del conjunto Ajedrez Determinar frecuencias relativas mediante función prop.table(table()). ¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue ajedrez? Se redondea a 4 posiciones decimales Se determina la probabilidad en %

round(prop.table(table(datos$ajedrez )),4)
## 
##  FALSE   TRUE 
## 0.9254 0.0746
round(prop.table(table(datos$ajedrez )),4) * 100
## 
## FALSE  TRUE 
## 92.54  7.46

Unión de conjuntos La unión significa los de un conjunto integrando los del otro conjunto, si se repite se omite su valor. Unión de fútbol y basquetbol Todos los nombres de alumnos que juegan fútbol y también los nombres de alumnos que juegan basquetbol. futbol basquetbol ¿Cuántos alumnos hay que juegan fútbol o basquetbol? ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol basquetbol? Se determina su probabilidad por medio de la frecuencia relativa del conjunto fútbol union con basquetbol. (frecuencia / n)

futUbas <- union(futbol$nombres, basquetbol$nombres)
futUbas
##  [1] "Eduardo"   "Gerardo"   "Juan"      "Lucy"      "Lupita"    "Memo"     
##  [7] "Paco"      "Patricia"  "Paty"      "Raul"      "Romualdo"  "Rubén"    
## [13] "Salvador"  "Saul"      "Yuri"      "Angélica"  "Bety"      "Carlos"   
## [19] "Dany"      "Dalia"     "Efren"     "Ernestina" "Fernando"  "Gabriel"  
## [25] "Guille"    "Jorge"     "Lorenzo"   "Miguel"    "Orlando"   "Otilia"   
## [31] "Pedro"     "Raquel"    "Walter"    "Carmen"    "Ernesto"   "Gabino"   
## [37] "Javier"    "Jeorgina"  "Laura"     "Margarita" "Maria"     "Fabián"   
## [43] "Mikaela"   "Sandy"     "Xóchitl"

Cálculo de probabilidad por frecuencia relativa ¿Cuántos alumnos hay que juegan fútbol o basquetbol? ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol basquetbol? Se determina su probabilidad por medio de la frecuencia relativa del conjunto fútbol union con basquetbol. (frecuencia / n)

cat("Hay ", length(futUbas), " alumnos que juegan fútbol o basquetbol de un total de ",n)
## Hay  45  alumnos que juegan fútbol o basquetbol de un total de  67
# Probabilidad por medio de frecuencia relativa
prob.futUbas <- length(futUbas) / n 

cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
", prob.futUbas)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
##  0.6716418

Intersección de conjuntos La intersección significa los que están en un conjunto y tambien están en el otro conjunto por, por ejemplo futbol intersección con basquetbol Intersección entre futbol y basquetbol Los que juegan futbol y que también juegan basquetbol

futIbas <- intersect(futbol$nombres, basquetbol$nombres)
futIbas
##  [1] "Lupita"   "Paty"     "Angélica" "Bety"     "Dany"     "Jorge"   
##  [7] "Miguel"   "Pedro"    "Raquel"   "Walter"

Cálculo de probabilidad por frecuenai relativa de la intersección entre futbol y basquetbol Los que juegan futbol y que también juegan basquetbol Se determina su probabilidad por medio de la frecuencia relativa del conjunto fútbol intersección con basquetbol. (frecuencia / n)

cat("Hay ", length(futIbas), " alumnos que juegan fútbol y que también  juegan basquetbol de un total de ",n)
## Hay  10  alumnos que juegan fútbol y que también  juegan basquetbol de un total de  67
# Probabilidad por medio de frecuencia relativa
prob.futIbas <- length(futIbas) / n 

cat("¿Cuántos alumnos hay que juegan fútbol y basquetbol?", prob.futIbas)
## ¿Cuántos alumnos hay que juegan fútbol y basquetbol? 0.1492537

Ley de la adición para determinar probabilidades Al tener elementos en común se determina el cálculo de la probailidad por medio de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ¿ Cuál es la probabilidad de que juegue futbol o basquetbol una persona por medio de la ley de la adición para conjuntos no excluyentes que significa que hay elementos en común? Probabilida de que juegue fútbol o que juegue basquetbol Anteriormente por medio de prop.table(table()) se observaron las probabilidades, aquí se vuelven a determinar Se almacenan las probabilidades en variables correspondientes prob.futbol[2] porque es la que es TRUE prob.basquetbol[2] porque es la que es TRUE

prob.futbol <- prop.table(table(datos$futbol))
prob.basquetbol <- prop.table(table(datos$basquetbol))

prob.futbol <- prob.futbol[2] 
prob.basquetbol <- prob.basquetbol[2]

prob.futbol
##      TRUE 
## 0.4925373
prob.basquetbol
##      TRUE 
## 0.3283582

Cálculo de probabilidad de P(futbol U basquetbol) Ya se tiene las probabilidad de prob.futbol prob.basquetbol futIbas Se genera la probabailida de futbol union con basquetbol (prob.futUbas) por medio de la fórmula Se sustituye en la fórmula de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) Comprobar que la probabilidad es la misma que por medio del métoto de frecuencia relativa Se utiliza la función as.numeric() para garantizar que son numéricos y se pueden hacer operaciones aritiméticas

# Las probabilidades listas para sustituir en la fóromula
as.numeric(prob.futbol)
## [1] 0.4925373
as.numeric(prob.basquetbol)
## [1] 0.3283582
as.numeric(prob.futIbas)
## [1] 0.1492537
# Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B)

prob.futUbas <- as.numeric(prob.futbol) + as.numeric(prob.basquetbol) - as.numeric(prob.futIbas)

prob.futUbas
## [1] 0.6716418
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
", prob.futUbas)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
##  0.6716418

Tablas cruzadas

table(datos$futbol, datos$basquetbol)
##        
##         FALSE TRUE
##   FALSE    22   12
##   TRUE     23   10

Frecuencias utilizando tablas cruzadas futbol basquetbol La función table() generan frecuencias El atributo dnn son los encabezados de la tabla, arriba y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

tabla.cruzada <- table(datos$futbol, datos$basquetbol, dnn = c('fútbol','basquetbol'))

tabla.cruzada
##        basquetbol
## fútbol  FALSE TRUE
##   FALSE    22   12
##   TRUE     23   10
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))

tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))

tabla.cruzada.s
##       FALSE TRUE   
## FALSE    22   12 34
## TRUE     23   10 33
##          45   22 67

Interpretación de la tabla cruzada frecuencias Hay 33 alumnos que juegan futbol; renglón 2 de un total de 67 Hay 22 personas que juegan basquetbol columna 2 de un total de 67 Hay 10 personas que juegan futbol y basquetbol al mismo tiempo de un total de 67 Cálculo de probabilidades utilizando tablas cruzadas futbol basquetbol La función prop.table(table()) generacia probabailidades El atributo dnn son los encabezados de la tabla, arribay y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

prob.tabla.cruzada <- round(prop.table(table(datos$futbol, datos$basquetbol, dnn = c('fútbol','basquetbol'))),4)

prob.tabla.cruzada
##        basquetbol
## fútbol   FALSE   TRUE
##   FALSE 0.3284 0.1791
##   TRUE  0.3433 0.1493
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
                            
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) 

prob.tabla.cruzada
##        FALSE   TRUE       
## FALSE 0.3284 0.1791 0.5075
## TRUE  0.3433 0.1493 0.4926
##       0.6717 0.3284 1.0001

Interpretación de la tabla cruzada probabilidades Hay 34 alumnos que juegan futbol que representan el 49.26% del 100% Hay 22 personas que juegan basquetbol que representan el 32.84% del 100% Hay 22 personas que juegan futbol y basquetbol al mismo tiempo que representan el 14.93% del 100% o del total de alumnos

##Cuál es la probabilidad de que un alumno sea hombre?

prob.hombres <- length(hombres) / n 

cat("¿Cuál es la probabilidad de que un alumno sea hombre? ?", prob.hombres)
## ¿Cuál es la probabilidad de que un alumno sea hombre? ? 0.1343284

Cuál es la probabilidad de que un alumno sea mujer?

prob.mujeres <- length(mujeres) / n 

cat("¿Cuál es la probabilidad de que un alumno sea mujer? ?", prob.mujeres)
## ¿Cuál es la probabilidad de que un alumno sea mujer? ? 0.1343284

¿Cuál es la probabilidad de que un alumno juegue fúbol?

prob.futbol <- length(futbol) / n 

cat("¿Cual es la probabilidad de que jueguen futbol?", prob.futbol)
## ¿Cual es la probabilidad de que jueguen futbol? 0.1343284

¿Cuál es la probabilidad de que un alumno juegue basquetbol

prob.basquetbol <- length(basquetbol) / n 

cat("¿Cual es la probabilidad de que jueguen basquetbol?", prob.basquetbol)
## ¿Cual es la probabilidad de que jueguen basquetbol? 0.1343284

Cuál es la probabilidad de que un alumno juegue voleybol?

prob.voleybol <- length(voleybol) / n 

cat("¿Cual es la probabilidad de que jueguen voleybol?", prob.voleybol)
## ¿Cual es la probabilidad de que jueguen voleybol? 0.1343284

¿Cuál es la probabilidad de que un alumno practique atletismo?

prob.atletismo <- length(atletismo) / n 

cat("¿Cual es la probabilidad de que jueguen atletismo?", prob.atletismo)
## ¿Cual es la probabilidad de que jueguen atletismo? 0.1343284

¿Cuál es la probabilidad de que un alumno juegue ajedrez

prob.ajedrez <- length(ajedrez) / n 

cat("¿Cual es la probabilidad de que jueguen ajedrez?", prob.ajedrez)
## ¿Cual es la probabilidad de que jueguen ajedrez? 0.1343284

###Ley de ADICION Determine la probabilidad de que practique atletismo o juegue voleybol

prob.atletismo <- prop.table(table(datos$atletismo))
prob.voleybol <- prop.table(table(datos$voleybol))

prob.atletismo <- prob.atletismo[2] 
prob.voleybol <- prob.voleybol[2]

prob.atletismo
##      TRUE 
## 0.1791045
prob.voleybol
##      TRUE 
## 0.2089552
as.numeric(prob.atletismo)
## [1] 0.1791045
as.numeric(prob.voleybol)
## [1] 0.2089552

Determine la probabilidad de que practique futbol o juegue voleybol

prob.futbol <- prop.table(table(datos$futbol))
prob.voleybol <- prop.table(table(datos$voleybol))

prob.futbol <- prob.futbol[2] 
prob.voleybol <- prob.voleybol[2]

prob.futbol
##      TRUE 
## 0.4925373
prob.voleybol
##      TRUE 
## 0.2089552
as.numeric(prob.futbol)
## [1] 0.4925373
as.numeric(prob.voleybol)
## [1] 0.2089552

Determine la probabilidad de que practique basquetbol o juegue voleybol

prob.basquetbol <- prop.table(table(datos$basquetbol))
prob.voleybol <- prop.table(table(datos$voleybol))

prob.basquetbol <- prob.basquetbol[2] 
prob.voleybol <- prob.voleybol[2]

prob.basquetbol
##      TRUE 
## 0.3283582
prob.voleybol
##      TRUE 
## 0.2089552
as.numeric(prob.basquetbol)
## [1] 0.3283582
as.numeric(prob.voleybol)
## [1] 0.2089552