¿Que es la probabilidad?

La probabilidad es simplemmente qué tan posible es que ocurra un evento determinado

Objetivo

Calcular y evaluar probabilidades por el metodo de frecuencia relativa y por la ley de la adicion

Descripcion

De un grupo de alumnos se les pregunta su genero y ls disciplinas deportivas que practic de entre futbol, basquetbol, voleybol, atletismo y ajedrez ### Puede hacer casos que practiquen dos disciplinas deportivas

*Preparar los datos. Cargar un conjunto de datos con la finalidad de identificar conjuntos para determinar probabilidades por dos opciones: por fracuencia relaticas y por la formula de la ley de adicion

*Proceso

*Generar cojuntos de alumno o personas que practican alguna o varias actividades deportivas

*Se identifican las probabilidades por medio del metodo de frecuencia relativa

*Se determina la union de conjuntos

*Se determina la diferencia de conjuntos

*Se determinan probabilidad por medio de la ley de adicion con la formula

*Prob(A u B)= prob(A)+Prob(B)-Prob(AnB)

*Demostrar las igualdades en el calculo de las probabilidades por ambos metodos

Las librerías

library(readr)

Los datos

Como son pocos datos se pueden cargar dirctamente de la WEB así como también se pueden descargar y tratarlos localmente.

datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/practicas%20R/unidad%202/alumnos.deportes.2020.csv")

datos
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 1   1       Ana    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 2   2   Antonio    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 3   3   Aracely    F  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 4   4    Carmen    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 5   5   Eduardo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 6   6   Ernesto    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 7   7    Gabino    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 8   8   Gerardo    M   TRUE      FALSE     TRUE     FALSE   FALSE  TRUE
## 9   9    Javier    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 10 10  Jeorgina    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 11 11      Juan    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 12 12      Lalo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 13 13     Laura    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 14 14      Lucy    F   TRUE      FALSE     TRUE      TRUE   FALSE FALSE
## 15 15      Luis    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 16 16     Luisa    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 17 17    Lupita    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 18 18 Margarita    F  FALSE       TRUE    FALSE      TRUE   FALSE FALSE
## 19 19 Margarito    M  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 20 20     Maria    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 21 21      Memo    M   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 22 22     Oscar    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 23 23      Paco    M   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 24 24  Patricia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 25 25      Paty    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 26 26      Raul    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 27 27  Romualdo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 28 28   Rosario    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 29 29     Rubén    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 30 30  Salvador    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 31 31    Sandra    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 32 32    Sandro    M  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 33 33      Saul    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 34 34      Yuri    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 35 35    Arturo    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 36 36  Angélica    F   TRUE       TRUE     TRUE     FALSE   FALSE FALSE
## 37 37   Arnulfo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 38 38      Bety    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 39 39    Carlos    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 40 40 Dagoberto    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 41 41      Dany    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 42 42     Dalia    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 43 43     Efren    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 44 44 Ernestina    F   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 45 45  Fernando    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 46 46    Fabián    M  FALSE       TRUE     TRUE     FALSE   FALSE FALSE
## 47 47  Fernanda    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 48 48  Gabriela    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 49 49   Gabriel    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 50 50    Guille    F   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 51 51     Jorge    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 52 52   Lorenzo    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 53 53   Mikaela    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 54 54    Miguel    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 55 55   Marcela    F  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
## 56 56   Orlando    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 57 57    Otilia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 58 58     Pedro    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 59 59     Perla    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 60 60    Raquel    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 61 61    Susana    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 62 62     Sandy    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 63 63    Sotelo    M  FALSE      FALSE     TRUE      TRUE   FALSE FALSE
## 64 64  Tiburcio    M  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
## 65 65    Teresa    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 66 66    Walter    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE
n <- nrow(datos)

Conjunto de hombres y Mujeres

*Se determinan los conjuntos segun el genero de la persona mediante la funcion subset() que permite filtrar los datos

*hombres

*mujeres

hombres <- subset(datos, sexo=="M")
mujeres <- subset(datos, sexo=="F")

hombres
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 2   2   Antonio    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 5   5   Eduardo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 6   6   Ernesto    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 7   7    Gabino    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 8   8   Gerardo    M   TRUE      FALSE     TRUE     FALSE   FALSE  TRUE
## 9   9    Javier    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 11 11      Juan    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 12 12      Lalo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 15 15      Luis    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 19 19 Margarito    M  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 21 21      Memo    M   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 22 22     Oscar    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 23 23      Paco    M   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 26 26      Raul    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 27 27  Romualdo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 29 29     Rubén    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 30 30  Salvador    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 32 32    Sandro    M  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 33 33      Saul    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 35 35    Arturo    M  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 37 37   Arnulfo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 39 39    Carlos    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 40 40 Dagoberto    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 43 43     Efren    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 45 45  Fernando    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 46 46    Fabián    M  FALSE       TRUE     TRUE     FALSE   FALSE FALSE
## 49 49   Gabriel    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 51 51     Jorge    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 52 52   Lorenzo    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 54 54    Miguel    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 56 56   Orlando    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 58 58     Pedro    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 63 63    Sotelo    M  FALSE      FALSE     TRUE      TRUE   FALSE FALSE
## 64 64  Tiburcio    M  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
mujeres
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 1   1       Ana    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 3   3   Aracely    F  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 4   4    Carmen    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 10 10  Jeorgina    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 13 13     Laura    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 14 14      Lucy    F   TRUE      FALSE     TRUE      TRUE   FALSE FALSE
## 16 16     Luisa    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 17 17    Lupita    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 18 18 Margarita    F  FALSE       TRUE    FALSE      TRUE   FALSE FALSE
## 20 20     Maria    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 24 24  Patricia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 25 25      Paty    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 28 28   Rosario    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 31 31    Sandra    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 34 34      Yuri    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 36 36  Angélica    F   TRUE       TRUE     TRUE     FALSE   FALSE FALSE
## 38 38      Bety    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 41 41      Dany    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 42 42     Dalia    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 44 44 Ernestina    F   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 47 47  Fernanda    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 48 48  Gabriela    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 50 50    Guille    F   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 53 53   Mikaela    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 55 55   Marcela    F  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
## 57 57    Otilia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 59 59     Perla    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 60 60    Raquel    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 61 61    Susana    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 62 62     Sandy    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 65 65    Teresa    F  FALSE      FALSE    FALSE     FALSE   FALSE FALSE
## 66 66    Walter    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE

Frecuencia de Hombres y Mujeres

Determinar Frecuencias mediante funcion table() que permite generar la frecuencia de una variable

¿Cúantos casos hay en los que son hombres?

¿Cúantos casos hay en los que son mujeres?

table(datos$sexo)
## 
##  F  M 
## 33 34

Frecuencias relativas de Hombres y Mujeres

*Determinar frecuencias relativas mediante la funcion prop.table(table()).

¿Cúal es la probabilidad al seleccionar una persona de todo el conjunto de datos sea hombre?

¿Cúal es la probabilidad al seleccionar a una persona de todo el conjunto de datos sea mujer?

*Se redondea a 4 posiciones decimal

*Se determina la probabilidad en %

round(prop.table(table(datos$sexo)),4)
## 
##      F      M 
## 0.4925 0.5075
round(prop.table(table(datos$sexo)),4)*100
## 
##     F     M 
## 49.25 50.75

Conjunto Fútbol

*Se determina el conjunto de personas que practican del futbol segun la disciplina de futbol

*Futbol

Futbol <- subset(datos, futbol == TRUE)

Futbol
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 5   5   Eduardo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 8   8   Gerardo    M   TRUE      FALSE     TRUE     FALSE   FALSE  TRUE
## 11 11      Juan    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 14 14      Lucy    F   TRUE      FALSE     TRUE      TRUE   FALSE FALSE
## 17 17    Lupita    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 21 21      Memo    M   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 23 23      Paco    M   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 24 24  Patricia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 25 25      Paty    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 26 26      Raul    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 27 27  Romualdo    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 29 29     Rubén    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 30 30  Salvador    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 33 33      Saul    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 34 34      Yuri    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 36 36  Angélica    F   TRUE       TRUE     TRUE     FALSE   FALSE FALSE
## 38 38      Bety    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 39 39    Carlos    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 41 41      Dany    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 42 42     Dalia    F   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 43 43     Efren    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 44 44 Ernestina    F   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 45 45  Fernando    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 49 49   Gabriel    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 50 50    Guille    F   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 51 51     Jorge    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 52 52   Lorenzo    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 54 54    Miguel    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 56 56   Orlando    M   TRUE      FALSE    FALSE     FALSE   FALSE FALSE
## 57 57    Otilia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 58 58     Pedro    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 60 60    Raquel    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 66 66    Walter    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE

Frecuencias de personas que juegan Futbol

*DEterminar frecuencias meidiante funcion table() que permite generar la frecuencias de una variable

¿Cúantas personas hay que practican Fútbol?

table(datos$futbol)
## 
## FALSE  TRUE 
##    34    33

Frecuencias relativas del conjunto Fútbol

+Determinar frecuencias relativas mediante función prop.table(table()).

¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue fútbol?

+Se redondea a 4 posiciones decimales

+Se determinala probabilidad en %

round(prop.table(table(datos$futbol)),4)
## 
##  FALSE   TRUE 
## 0.5075 0.4925
round(prop.table(table(datos$futbol)),4)*100
## 
## FALSE  TRUE 
## 50.75 49.25

Conjunto Basquetbol

+Se determina el conjunto de personas que practican el deporte del basquetbol según la disciplina de basquetbol

+basquetbol

Basquetbol <- subset(datos, basquetbol == TRUE)
Basquetbol
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 4   4    Carmen    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 6   6   Ernesto    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 7   7    Gabino    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 9   9    Javier    M  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 10 10  Jeorgina    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 13 13     Laura    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 17 17    Lupita    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 18 18 Margarita    F  FALSE       TRUE    FALSE      TRUE   FALSE FALSE
## 20 20     Maria    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 25 25      Paty    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 36 36  Angélica    F   TRUE       TRUE     TRUE     FALSE   FALSE FALSE
## 38 38      Bety    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 41 41      Dany    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 46 46    Fabián    M  FALSE       TRUE     TRUE     FALSE   FALSE FALSE
## 51 51     Jorge    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 53 53   Mikaela    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 54 54    Miguel    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 58 58     Pedro    M   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 60 60    Raquel    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 62 62     Sandy    F  FALSE       TRUE    FALSE     FALSE   FALSE FALSE
## 66 66    Walter    F   TRUE       TRUE    FALSE     FALSE   FALSE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE

Frecuencias de personas en Basquetbol

+Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable

+¿Cuántas personas hay que practican Basquetbol?

table(datos$basquetbol)
## 
## FALSE  TRUE 
##    45    22

Frecuencias relativas del conjunto Basquetbol

Determinar frecuencias relativas mediante función prop.table(table()).

¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue basquetbol?

Se redondea a 4 posiciones decimales

Se determinala probabilidad en %

round(prop.table(table(datos$basquetbol)),4)
## 
##  FALSE   TRUE 
## 0.6716 0.3284
round(prop.table(table(datos$basquetbol)),4) * 100
## 
## FALSE  TRUE 
## 67.16 32.84

Conjunto Voleybol

+Se determina el conjunto de personas que practican el deporte del Voleybol según la disciplina de Voleybol

+voleybol

Voleybol <- subset(datos, voleybol == TRUE)
Voleybol
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 8   8   Gerardo    M   TRUE      FALSE     TRUE     FALSE   FALSE  TRUE
## 12 12      Lalo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 14 14      Lucy    F   TRUE      FALSE     TRUE      TRUE   FALSE FALSE
## 15 15      Luis    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 23 23      Paco    M   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 33 33      Saul    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 36 36  Angélica    F   TRUE       TRUE     TRUE     FALSE   FALSE FALSE
## 37 37   Arnulfo    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 40 40 Dagoberto    M  FALSE      FALSE     TRUE     FALSE   FALSE FALSE
## 44 44 Ernestina    F   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 46 46    Fabián    M  FALSE       TRUE     TRUE     FALSE   FALSE FALSE
## 52 52   Lorenzo    M   TRUE      FALSE     TRUE     FALSE   FALSE FALSE
## 63 63    Sotelo    M  FALSE      FALSE     TRUE      TRUE   FALSE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE

Frecuencias de personas en Voleybol

Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable ¿Cuántas personas hay que practican voleybol?

table(datos$voleybol)
## 
## FALSE  TRUE 
##    53    14

Frecuencias relativas del conjunto Voleybol

Determinar frecuencias relativas mediante función prop.table(table()). ¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue voleybol? Se redondea a 4 posiciones decimales Se determina la probabilidad en %

round(prop.table(table(datos$voleybol)),4)
## 
## FALSE  TRUE 
## 0.791 0.209
round(prop.table(table(datos$voleybol)),4)*100
## 
## FALSE  TRUE 
##  79.1  20.9

Conjunto Atletismo

Se determina el conjunto de personas que practican el deporte del atletismo según la disciplina de atletismo atletismo

Atletismo <- subset(datos, atletismo == TRUE)
Atletismo
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 11 11      Juan    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 14 14      Lucy    F   TRUE      FALSE     TRUE      TRUE   FALSE FALSE
## 18 18 Margarita    F  FALSE       TRUE    FALSE      TRUE   FALSE FALSE
## 24 24  Patricia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 30 30  Salvador    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 43 43     Efren    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 45 45  Fernando    M   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 55 55   Marcela    F  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
## 57 57    Otilia    F   TRUE      FALSE    FALSE      TRUE   FALSE FALSE
## 63 63    Sotelo    M  FALSE      FALSE     TRUE      TRUE   FALSE FALSE
## 64 64  Tiburcio    M  FALSE      FALSE    FALSE      TRUE   FALSE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE

Frecuencias de personas en atletismo

Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable ¿Cuántas personas hay que practican atletismo?

table(datos$atletismo)
## 
## FALSE  TRUE 
##    55    12

Frecuencias relativas del conjunto Atletismo

Determinar frecuencias relativas mediante función prop.table(table()). ¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue atletismo? Se redondea a 4 posiciones decimales Se determina la probabilidad en %

round(prop.table(table(datos$atletismo)),4)
## 
##  FALSE   TRUE 
## 0.8209 0.1791
round(prop.table(table(datos$atletismo)),4)*100
## 
## FALSE  TRUE 
## 82.09 17.91

Conjunto Ajedrez

Se determina el conjunto de personas que practican el deporte del ajedrez según la disciplina de ajedrez ajedrez

Ajedrez <- subset(datos, ajedrez == TRUE)

Ajedrez
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 21 21      Memo    M   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 23 23      Paco    M   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 44 44 Ernestina    F   TRUE      FALSE     TRUE     FALSE    TRUE FALSE
## 50 50    Guille    F   TRUE      FALSE    FALSE     FALSE    TRUE FALSE
## 67 67   Xóchitl    F  FALSE       TRUE     TRUE      TRUE    TRUE FALSE

Frecuencias de personas en Ajedrez

Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable ¿Cuántas personas hay que practican ajedrez?

table(datos$ajedrez)
## 
## FALSE  TRUE 
##    62     5

Frecuencias relativas del conjunto Ajedrez

Determinar frecuencias relativas mediante función prop.table(table()). ¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue ajedrez? Se redondea a 4 posiciones decimales Se determina la probabilidad en %

round(prop.table(table(datos$ajedres)),4)
## numeric(0)
round(prop.table(table(datos$ajedres)),4)*100
## numeric(0)

Conjunto tenis

Se determina el conjunto de personas que practican el deporte del tenis según la disciplina de atenis tenis

Tenis <- subset(datos,tenis == TRUE)
Tenis
##     X   nombres sexo futbol basquetbol voleybol atletismo ajedrez tenis
## 3   3   Aracely    F  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 8   8   Gerardo    M   TRUE      FALSE     TRUE     FALSE   FALSE  TRUE
## 19 19 Margarito    M  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE
## 32 32    Sandro    M  FALSE      FALSE    FALSE     FALSE   FALSE  TRUE

Frecuencias de personas en tenis

Determinar frecuencias mediante función table() que permite generar la frecuencia de una variable ¿Cuántas personas hay que practican tenis?

table(datos$tenis)
## 
## FALSE  TRUE 
##    63     4

Frecuencias relativas del conjunto tenis

Determinar frecuencias relativas mediante función prop.table(table()). ¿Cuál es la probabilidad al seleccionar a una persona de de todo conjunto de datos y que juegue tenis? Se redondea a 4 posiciones decimales Se determina la probabilidad en %

round(prop.table(table(datos$tenis)),4)
## 
##  FALSE   TRUE 
## 0.9403 0.0597
round(prop.table(table(datos$tenis)),4)*100
## 
## FALSE  TRUE 
## 94.03  5.97

Unión de conjuntos

La unión significa los de un conjunto integrando los del otro conjunto, si se repite se omite su valor. ### Unión de fútbol y basquetbol Todos los nombres de alumnos que juegan fútbol y también los nombres de alumnos que juegan basquetbol. futbol basquetbol ¿Cuántos alumnos hay que juegan fútbol o basquetbol? ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol basquetbol? Se determina su probabilidad por medio de la frecuencia relativa del conjunto fútbol union con basquetbol. (frecuencia / n)

futUbas <- union(Futbol$nombres, Basquetbol$nombres)
futUbas
##  [1] "Eduardo"   "Gerardo"   "Juan"      "Lucy"      "Lupita"    "Memo"     
##  [7] "Paco"      "Patricia"  "Paty"      "Raul"      "Romualdo"  "Rubén"    
## [13] "Salvador"  "Saul"      "Yuri"      "Angélica"  "Bety"      "Carlos"   
## [19] "Dany"      "Dalia"     "Efren"     "Ernestina" "Fernando"  "Gabriel"  
## [25] "Guille"    "Jorge"     "Lorenzo"   "Miguel"    "Orlando"   "Otilia"   
## [31] "Pedro"     "Raquel"    "Walter"    "Carmen"    "Ernesto"   "Gabino"   
## [37] "Javier"    "Jeorgina"  "Laura"     "Margarita" "Maria"     "Fabián"   
## [43] "Mikaela"   "Sandy"     "Xóchitl"

Unión de Tenis o ajedrez

Todos los nombres de alumnos que juegan tenis y también los nombres de alumnos que juegan ajedrez. tenis ajedrez ¿Cuántos alumnos hay que juegan tenis o ajedrez? ¿Cuál es la probabilidad de que existan alumnos que jueguen tenis ajedrez? Se determina su probabilidad por medio de la frecuencia relativa del conjunto tenis union con ajedrez. (frecuencia / n)

tenUaj <- union(Tenis$nombres, Ajedrez$nombres)
tenUaj
## [1] "Aracely"   "Gerardo"   "Margarito" "Sandro"    "Memo"      "Paco"     
## [7] "Ernestina" "Guille"    "Xóchitl"

Unión de atletismo y voleybol

Todos los nombres de alumnos que practican atletismo y también los nombres de alumnos que juegan voleybol. atletismo voleybol ¿Cuántos alumnos hay que practican atletismo o jueguen voleybol? ¿Cuál es la probabilidad de que existan alumnos que practiquen atletismo o voleybol? Se determina su probabilidad por medio de la frecuencia relativa del conjunto atletismo union con voleybol. (frecuencia / n)

atlUvol <- union(Atletismo$nombres , Voleybol$nombres)
atlUvol
##  [1] "Juan"      "Lucy"      "Margarita" "Patricia"  "Salvador"  "Efren"    
##  [7] "Fernando"  "Marcela"   "Otilia"    "Sotelo"    "Tiburcio"  "Xóchitl"  
## [13] "Gerardo"   "Lalo"      "Luis"      "Paco"      "Saul"      "Angélica" 
## [19] "Arnulfo"   "Dagoberto" "Ernestina" "Fabián"    "Lorenzo"

Unión de voleybol y futbol

Todos los nombres de alumnos que juegan voleybol y también los nombres de alumnos que juegan fútbol. voleybol futbol ¿Cuántos alumnos hay que juegan voleybol o fútbol? ¿Cuál es la probabilidad de que existan alumnos que jueguen voleybol fútbol? Se determina su probabilidad por medio de la frecuencia relativa del conjunto voleybol union con futbol. (frecuencia / n)

volUfut <- union(Voleybol$nombres, Futbol$nombres)
volUfut
##  [1] "Gerardo"   "Lalo"      "Lucy"      "Luis"      "Paco"      "Saul"     
##  [7] "Angélica"  "Arnulfo"   "Dagoberto" "Ernestina" "Fabián"    "Lorenzo"  
## [13] "Sotelo"    "Xóchitl"   "Eduardo"   "Juan"      "Lupita"    "Memo"     
## [19] "Patricia"  "Paty"      "Raul"      "Romualdo"  "Rubén"     "Salvador" 
## [25] "Yuri"      "Bety"      "Carlos"    "Dany"      "Dalia"     "Efren"    
## [31] "Fernando"  "Gabriel"   "Guille"    "Jorge"     "Miguel"    "Orlando"  
## [37] "Otilia"    "Pedro"     "Raquel"    "Walter"

Unión de basquetbol y voleybol

Todos los nombres de alumnos que juegan basquetbol y también los nombres de alumnos que juegan voleybol. basquetbol voleybol ¿Cuántos alumnos hay que juegan basquetbol o voleybol? ¿Cuál es la probabilidad de que existan alumnos que jueguen basquetbol voleybol? Se determina su probabilidad por medio de la frecuencia relativa del conjunto basquetbol union con voleybol. (frecuencia / n)

basUvol <- union(Basquetbol$nombres, Voleybol$nombres)
basUvol
##  [1] "Carmen"    "Ernesto"   "Gabino"    "Javier"    "Jeorgina"  "Laura"    
##  [7] "Lupita"    "Margarita" "Maria"     "Paty"      "Angélica"  "Bety"     
## [13] "Dany"      "Fabián"    "Jorge"     "Mikaela"   "Miguel"    "Pedro"    
## [19] "Raquel"    "Sandy"     "Walter"    "Xóchitl"   "Gerardo"   "Lalo"     
## [25] "Lucy"      "Luis"      "Paco"      "Saul"      "Arnulfo"   "Dagoberto"
## [31] "Ernestina" "Lorenzo"   "Sotelo"

Cálculo de probabilidad por frecuencia relativa

¿Cuántos alumnos hay que juegan fútbol o basquetbol? ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol basquetbol? Se determina su probabilidad por medio de la frecuencia relativa del conjunto fútbol union con basquetbol. (frecuencia / n)

cat("Hay",length(futUbas),"alumnos que juegan futbol o basquetbol de un total de ",n)
## Hay 45 alumnos que juegan futbol o basquetbol de un total de  67
prob.futUbas <- length(futUbas)/n


cat("¿Cual es la probabilidad de que existen alumnos que jueguen futbol o basquetbol?", prob.futUbas)
## ¿Cual es la probabilidad de que existen alumnos que jueguen futbol o basquetbol? 0.6716418

Cálculo de probabilidad por frecuencia relativa

¿Cuántos alumnos hay que juegan Tenis o ajedrez? ¿Cuál es la probabilidad de que existan alumnos que jueguen Tenis Ajedrez? Se determina su probabilidad por medio de la frecuencia relativa del conjunto tenis union con ajedrez. (frecuencia / n)

cat("Hay",length(tenUaj),"alumnos que juegan tenis y ajedrez de un total de ",n)
## Hay 9 alumnos que juegan tenis y ajedrez de un total de  67
prob.tenUaj <- length(tenUaj)/n


cat("¿Cual es la probabilidad de que existen alumnos que jueguen tenis o ajedrez?", prob.tenUaj)
## ¿Cual es la probabilidad de que existen alumnos que jueguen tenis o ajedrez? 0.1343284

Cálculo de probabilidad por frecuencia relativa

¿Cuántos alumnos hay que practiquen atletismo o jueguen voleybol? ¿Cuál es la probabilidad de que existan alumnos que practiquen atletismo voleybol? Se determina su probabilidad por medio de la frecuencia relativa del conjunto atletismo union con voleybol. (frecuencia / n)

cat("Hay",length(atlUvol),"alumnos que practiquen atletismo o voleybol de un total de ",n)
## Hay 23 alumnos que practiquen atletismo o voleybol de un total de  67
prob.atlUvol <- length(atlUvol)/n


cat("¿Cual es la probabilidad de que existen alumnos que practiquen atletismo o voleybol? ", prob.atlUvol)
## ¿Cual es la probabilidad de que existen alumnos que practiquen atletismo o voleybol?  0.3432836

Cálculo de probabilidad por frecuencia relativa

¿Cuántos alumnos hay que juegan voleybol o futbol? ¿Cuál es la probabilidad de que existan alumnos que jueguen voleybol fútbol? Se determina su probabilidad por medio de la frecuencia relativa del conjunto voleybol union con futbol. (frecuencia / n)

cat("Hay",length(volUfut),"alumnos que juegan voleybol o futbol de un total de ",n)
## Hay 40 alumnos que juegan voleybol o futbol de un total de  67
prob.volUfut <- length(volUfut)/n


cat("¿Cual es la probabilidad de que existen alumnos que jueguen voleybol o futbol?", prob.volUfut)
## ¿Cual es la probabilidad de que existen alumnos que jueguen voleybol o futbol? 0.5970149

Cálculo de probabilidad por frecuencia relativa

¿Cuántos alumnos hay que juegan basquetbol o voleybol? ¿Cuál es la probabilidad de que existan alumnos que jueguen basquetbol voleybol? Se determina su probabilidad por medio de la frecuencia relativa del conjunto basquetbol union con voleybol. (frecuencia / n)

cat("Hay",length(basUvol),"alumnos que juegan basquetbol o voleybol de un total de ",n)
## Hay 33 alumnos que juegan basquetbol o voleybol de un total de  67
prob.basUvol <- length(basUvol)/n


cat("¿Cual es la probabilidad de que existn alumnos que jueguen ", prob.basUvol)
## ¿Cual es la probabilidad de que existn alumnos que jueguen  0.4925373

Intersección de conjuntos

La intersección significa los que están en un conjunto y tambien están en el otro conjunto por, por ejemplo futbol intersección con basquetbol

Intersección entre futbol y basquetbol

Los que juegan futbol y que también juegan basquetbol

futIbas <- intersect(Futbol$nombres, Basquetbol$nombres)
futIbas
##  [1] "Lupita"   "Paty"     "Angélica" "Bety"     "Dany"     "Jorge"   
##  [7] "Miguel"   "Pedro"    "Raquel"   "Walter"

Cálculo de probabilidad por frecuencia relativa de la intersección entre futbol y basquetbol

Los que juegan futbol y que también juegan basquetbol Se determina su probabilidad por medio de la frecuencia relativa del conjunto fútbol intersección con basquetbol. (frecuencia / n)

cat("Hay ", length(futIbas), " alumnos que juegan fútbol y que también  juegan basquetbol de un total de ",n)
## Hay  10  alumnos que juegan fútbol y que también  juegan basquetbol de un total de  67
# Probabilidad por medio de frecuencia relativa
prob.futIbas <- length(futIbas) / n 

cat("¿Cuántos alumnos hay que juegan fútbol y basquetbol?", prob.futIbas)
## ¿Cuántos alumnos hay que juegan fútbol y basquetbol? 0.1492537

Intersección entre tenis y ajedrez

Los que juegan tenis y que también juegan ajedrez

tenIaj <- intersect(Tenis$nombres, Ajedrez$nombres)
tenIaj
## character(0)

Cálculo de probabilidad por frecuencia relativa de la intersección entre tenis y ajedrez

Los que juegan tenis y que también juegan ajedrez Se determina su probabilidad por medio de la frecuencia relativa del conjunto tenis intersección con ajedrez. (frecuencia / n)

cat("Hay ", length(tenIaj), " alumnos que juegan tenis y que también  juegan ajedrez de un total de ",n)
## Hay  0  alumnos que juegan tenis y que también  juegan ajedrez de un total de  67
# Probabilidad por medio de frecuencia relativa
prob.teniIaj <- length(tenIaj) / n 

cat("¿Cuántos alumnos hay que juegan tenis y ajedrez?", prob.teniIaj)
## ¿Cuántos alumnos hay que juegan tenis y ajedrez? 0

Intersección entre atletismo y voleybol

Los que practiquen atletismo y que también juegan voleybol

atlIvol <- intersect(Atletismo$nombres, Voleybol$nombres)
atlIvol
## [1] "Lucy"    "Sotelo"  "Xóchitl"

Cálculo de probabilidad por frecuencia relativa de la intersección entre atletismo y voleybol

Los que practican atletismo y que también juegan voleybol Se determina su probabilidad por medio de la frecuencia relativa del conjunto atletismo intersección con voleybol. (frecuencia / n)

cat("Hay ", length(atlIvol), " alumnos que practican atletismo y que también  juegan voleybol de un total de ",n)
## Hay  3  alumnos que practican atletismo y que también  juegan voleybol de un total de  67
# Probabilidad por medio de frecuencia relativa
prob.atlIvol <- length(atlIvol) / n 

cat("¿Cuántos alumnos hay que practican atletismo y voleybol?", prob.atlIvol)
## ¿Cuántos alumnos hay que practican atletismo y voleybol? 0.04477612

Intersección entre voleybol y futbol

Los que juegan voleybol y que también juegan futbol

volIfut <- intersect(Voleybol$nombres, Futbol$nombres)
volIfut
## [1] "Gerardo"   "Lucy"      "Paco"      "Saul"      "Angélica"  "Ernestina"
## [7] "Lorenzo"

Cálculo de probabilidad por frecuencia relativa de la intersección entre voleybol y futbol

Los que juegan voleybol y que también juegan futbol Se determina su probabilidad por medio de la frecuencia relativa del conjunto voleybol intersección con futbol. (frecuencia / n)

cat("Hay ", length(volIfut), " alumnos que juegan fútbol y que también  juegan basquetbol de un total de ",n)
## Hay  7  alumnos que juegan fútbol y que también  juegan basquetbol de un total de  67
# Probabilidad por medio de frecuencia relativa
prob.volIfut <- length(volIfut) / n 

cat("¿Cuántos alumnos hay que juegan fútbol y basquetbol?", prob.volIfut)
## ¿Cuántos alumnos hay que juegan fútbol y basquetbol? 0.1044776

Intersección entre basquetbol y voleybol

Los que juegan basquetbol y que también juegan voleybol

basIvol <- intersect(Basquetbol$nombres, Voleybol$nombres)
basIvol
## [1] "Angélica" "Fabián"   "Xóchitl"

Cálculo de probabilidad por frecuenai relativa de la intersección entre basquetbol y voleybol

Los que juegan basquetbol y que también juegan voleybol Se determina su probabilidad por medio de la frecuencia relativa del conjunto basquetbol intersección con voleybol. (frecuencia / n)

cat("Hay ", length(basIvol), " alumnos que juegan basquetbol y que también  juegan voleybol de un total de ",n)
## Hay  3  alumnos que juegan basquetbol y que también  juegan voleybol de un total de  67
# Probabilidad por medio de frecuencia relativa
prob.basIvol<- length(basIvol) / n 

cat("¿Cuántos alumnos hay que juegan basquetbol y voleybol?", prob.basIvol)
## ¿Cuántos alumnos hay que juegan basquetbol y voleybol? 0.04477612

Ley de la adición para determinar probabilidades Futbol y Basquetbol

Al tener elementos en común se determina el cálculo de la probailidad por medio de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ¿ Cuál es la probabilidad de que juegue futbol o basquetbol una persona por medio de la ley de la adición para conjuntos no excluyentes que significa que hay elementos en común? Probabilida de que juegue fútbol o que juegue basquetbol Anteriormente por medio de prop.table(table()) se observaron las probabilidades, aquí se vuelven a determinar Se almacenan las probabilidades en variables correspondientes prob.futbol[2] porque es la que es TRUE prob.basquetbol[2] porque es la que es TRUE

prob.futbol <- prop.table(table(datos$futbol))
prob.basquetbol <- prop.table(table(datos$basquetbol))

prob.futbol <- prob.futbol[2] 
prob.basquetbol <- prob.basquetbol[2]

prob.futbol
##      TRUE 
## 0.4925373
prob.basquetbol
##      TRUE 
## 0.3283582

Cálculo de probabilidad de P(futbol U basquetbol)

Ya se tiene las probabilidad de prob.futbol prob.basquetbol futIbas Se genera la probabailida de futbol union con basquetbol (prob.futUbas) por medio de la fórmula Se sustituye en la fórmula de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) Comprobar que la probabilidad es la misma que por medio del métoto de frecuencia relativa Se utiliza la función as.numeric() para garantizar que son numéricos y se pueden hacer operaciones aritiméticas

as.numeric(prob.futbol)
## [1] 0.4925373
as.numeric(prob.basquetbol)
## [1] 0.3283582
as.numeric(prob.futIbas)
## [1] 0.1492537
prob.futUbas <- as.numeric(prob.futbol) + as.numeric(prob.basquetbol) - as.numeric(prob.futIbas)

prob.futUbas
## [1] 0.6716418
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
", prob.futUbas)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
##  0.6716418

Tablas cruzadas

table(datos$futbol, datos$basquetbol)
##        
##         FALSE TRUE
##   FALSE    22   12
##   TRUE     23   10

Frecuencias utilizando tablas cruzadas

futbol basquetbol La función table() generan frecuencias El atributo dnn son los encabezados de la tabla, arriba y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

tabla.cruzada <- table(datos$futbol, datos$basquetbol, dnn = c('fútbol','basquetbol'))

tabla.cruzada
##        basquetbol
## fútbol  FALSE TRUE
##   FALSE    22   12
##   TRUE     23   10
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))

tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))

tabla.cruzada.s
##       FALSE TRUE   
## FALSE    22   12 34
## TRUE     23   10 33
##          45   22 67

Interpretación de la tabla cruzada frecuencias

Hay 33 alumnos que juegan futbol; renglón 2 de un total de 67 Hay 22 personas que juegan basquetbol columna 2 de un total de 67 Hay 10 personas que juegan futbol y basquetbol al mismo tiempo de un total de 67

Cálculo de probabilidades utilizando tablas cruzadas

futbol basquetbol La función prop.table(table()) generacia probabailidades El atributo dnn son los encabezados de la tabla, arribay y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

prob.tabla.cruzada <- round(prop.table(table(datos$futbol, datos$basquetbol, dnn = c('fútbol','basquetbol'))),4)

prob.tabla.cruzada
##        basquetbol
## fútbol   FALSE   TRUE
##   FALSE 0.3284 0.1791
##   TRUE  0.3433 0.1493
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
                            
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) 

prob.tabla.cruzada
##        FALSE   TRUE       
## FALSE 0.3284 0.1791 0.5075
## TRUE  0.3433 0.1493 0.4926
##       0.6717 0.3284 1.0001

Interpretación de la tabla cruzada probabilidades

Hay 34 alumnos que juegan futbol que representan el 49.26% del 100% Hay 22 personas que juegan basquetbol que representan el 32.84% del 100% Hay 22 personas que juegan futbol y basquetbol al mismo tiempo que representan el 14.93% del 100% o del total de alumnos

Ley de la adición para determinar probabilidades Tenis Y Ajedrez

Al tener elementos en común se determina el cálculo de la probailidad por medio de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ¿ Cuál es la probabilidad de que juegue tenis o ajedrez una persona por medio de la ley de la adición para conjuntos no excluyentes que significa que hay elementos en común? Probabilida de que juegue tenis o que juegue ajedrez Anteriormente por medio de prop.table(table()) se observaron las probabilidades, aquí se vuelven a determinar Se almacenan las probabilidades en variables correspondientes prob.tenis[2] porque es la que es TRUE prob.ajedrez[2] porque es la que es TRUE

prob.tenis <- prop.table(table(datos$tenis))
prob.ajedrez <- prop.table(table(datos$ajedrez))

prob.tenis <- prob.tenis[2] 
prob.ajedrez <- prob.ajedrez[2]

prob.tenis
##       TRUE 
## 0.05970149
prob.ajedrez
##       TRUE 
## 0.07462687

Cálculo de probabilidad de P(tenis U ajedrez)

Ya se tiene las probabilidad de prob.tenis prob.ajedrez tenIaj Se genera la probabailida de tenis union con ajedrez (prob.tenUaj) por medio de la fórmula Se sustituye en la fórmula de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) Comprobar que la probabilidad es la misma que por medio del métoto de frecuencia relativa Se utiliza la función as.numeric() para garantizar que son numéricos y se pueden hacer operaciones aritiméticas

as.numeric(prob.tenis)
## [1] 0.05970149
as.numeric(prob.ajedrez)
## [1] 0.07462687
as.numeric(prob.teniIaj)
## [1] 0
prob.tenUaj <- as.numeric(prob.tenis) + as.numeric(prob.ajedrez) - as.numeric(prob.teniIaj)

prob.tenUaj
## [1] 0.1343284
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen tenis o ajedrez?
", prob.tenUaj)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen tenis o ajedrez?
##  0.1343284

Tablas cruzadas

table(datos$tenis, datos$ajedrez)
##        
##         FALSE TRUE
##   FALSE    58    5
##   TRUE      4    0

Frecuencias utilizando tablas cruzadas

tenis ajedrez La función table() generan frecuencias El atributo dnn son los encabezados de la tabla, arriba y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

tabla.cruzada <- table(datos$tenis, datos$ajedrez, dnn = c('tenis','ajedrez'))

tabla.cruzada
##        ajedrez
## tenis   FALSE TRUE
##   FALSE    58    5
##   TRUE      4    0
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))

tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))

tabla.cruzada.s
##       FALSE TRUE   
## FALSE    58    5 63
## TRUE      4    0  4
##          62    5 67

Interpretación de la tabla cruzada frecuencias

Hay 4 alumnos que juegan tenis; renglón 2 de un total de 67 Hay 5 personas que juegan ajedrez columna 2 de un total de 67 Hay 0 personas que juegan tenis y ajedrez al mismo tiempo de un total de 67

Cálculo de probabilidades utilizando tablas cruzadas

tenis ajedrez La función prop.table(table()) generacia probabailidades El atributo dnn son los encabezados de la tabla, arribay y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

prob.tabla.cruzada <- round(prop.table(table(datos$tenis, datos$ajedrez, dnn = c('fútbol','basquetbol'))),4)

prob.tabla.cruzada
##        basquetbol
## fútbol   FALSE   TRUE
##   FALSE 0.8657 0.0746
##   TRUE  0.0597 0.0000
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
                            
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) 

prob.tabla.cruzada
##        FALSE   TRUE       
## FALSE 0.8657 0.0746 0.9403
## TRUE  0.0597 0.0000 0.0597
##       0.9254 0.0746 1.0000

Interpretación de la tabla cruzada probabilidades

Hay 4 alumnos que juegan tenis que representan el 5.97%% del 100% Hay 5 personas que juegan ajedrez que representan el 7.46% del 100% Hay 0 personas que juegan tenis y ajedrez al mismo tiempo que representan el 0% del 100% o del total de alumnos

Ley de la adición para determinar probabilidades atletismo y voleybol

Al tener elementos en común se determina el cálculo de la probailidad por medio de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ¿ Cuál es la probabilidad de que practique atletismo o voleybol una persona por medio de la ley de la adición para conjuntos no excluyentes que significa que hay elementos en común? Probabilida de que practique atletismo o que juegue voleybol Anteriormente por medio de prop.table(table()) se observaron las probabilidades, aquí se vuelven a determinar Se almacenan las probabilidades en variables correspondientes prob.atletismo[2] porque es la que es TRUE prob.voleybol[2] porque es la que es TRUE

prob.atletismo <- prop.table(table(datos$atletismo))
prob.voleybol <- prop.table(table(datos$voleybol))

prob.atletismo <- prob.atletismo[2] 
prob.voleybol <- prob.voleybol[2]

prob.atletismo
##      TRUE 
## 0.1791045
prob.voleybol
##      TRUE 
## 0.2089552

Cálculo de probabilidad de P(atletismo U voleybol)

Ya se tiene las probabilidad de prob.atletismo prob.voleybol futIbas Se genera la probabailida de atletismo union con voleybol (prob.atlUvol) por medio de la fórmula Se sustituye en la fórmula de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) Comprobar que la probabilidad es la misma que por medio del métoto de frecuencia relativa Se utiliza la función as.numeric() para garantizar que son numéricos y se pueden hacer operaciones aritiméticas

as.numeric(prob.atletismo)
## [1] 0.1791045
as.numeric(prob.voleybol)
## [1] 0.2089552
as.numeric(prob.atlIvol)
## [1] 0.04477612
prob.atlUvol <- as.numeric(prob.atletismo) + as.numeric(prob.voleybol) - as.numeric(prob.atlIvol)

prob.atlUvol
## [1] 0.3432836
cat("* ¿Cuál es la probabilidad de que existan alumnos que practique atletismo o voleybol?
", prob.atlUvol)
## * ¿Cuál es la probabilidad de que existan alumnos que practique atletismo o voleybol?
##  0.3432836

Tablas cruzadas

table(datos$atletismo, datos$voleybol)
##        
##         FALSE TRUE
##   FALSE    44   11
##   TRUE      9    3

Frecuencias utilizando tablas cruzadas

atletismo voleybol La función table() generan frecuencias El atributo dnn son los encabezados de la tabla, arriba y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

tabla.cruzada <- table(datos$atletismo, datos$voleybol, dnn = c('atletismo','voleybol'))

tabla.cruzada
##          voleybol
## atletismo FALSE TRUE
##     FALSE    44   11
##     TRUE      9    3
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))

tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))

tabla.cruzada.s
##       FALSE TRUE   
## FALSE    44   11 55
## TRUE      9    3 12
##          53   14 67

Interpretación de la tabla cruzada frecuencias

Hay 12 alumnos que juegan atletismo; renglón 2 de un total de 67 Hay 14 personas que juegan voleybol columna 2 de un total de 67 Hay 3 personas que practican atletismo y voleybol al mismo tiempo de un total de 67

Cálculo de probabilidades utilizando tablas cruzadas

atletismo voleybol La función prop.table(table()) generacia probabailidades El atributo dnn son los encabezados de la tabla, arribay y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

prob.tabla.cruzada <- round(prop.table(table(datos$atletismo, datos$voleybol, dnn = c('atletismo','voleybol'))),4)

prob.tabla.cruzada
##          voleybol
## atletismo  FALSE   TRUE
##     FALSE 0.6567 0.1642
##     TRUE  0.1343 0.0448
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
                            
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) 

prob.tabla.cruzada
##        FALSE   TRUE       
## FALSE 0.6567 0.1642 0.8209
## TRUE  0.1343 0.0448 0.1791
##       0.7910 0.2090 1.0000

Interpretación de la tabla cruzada probabilidades

Hay 12 alumnos que practican atletismo que representan el 17.91% del 100% Hay 14 personas que juegan voleybol que representan el 20.90% del 100% Hay 3 personas que practican atletismo y volebol al mismo tiempo que representan el 4.48% del 100% o del total de alumnos

Ley de la adición para determinar probabilidades Voleybol y Futbol

Al tener elementos en común se determina el cálculo de la probailidad por medio de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ¿ Cuál es la probabilidad de que juegue voleybol o futbol una persona por medio de la ley de la adición para conjuntos no excluyentes que significa que hay elementos en común? Probabilida de que juegue voleybol o que juegue futbol Anteriormente por medio de prop.table(table()) se observaron las probabilidades, aquí se vuelven a determinar Se almacenan las probabilidades en variables correspondientes prob.voleybol[2] porque es la que es TRUE prob.futbol[2] porque es la que es TRUE

prob.voleybol <- prop.table(table(datos$voleybol))
prob.futbol <- prop.table(table(datos$futbol))


prob.voleybol <- prob.voleybol[2]
prob.futbol <- prob.futbol[2] 

prob.voleybol
##      TRUE 
## 0.2089552
prob.futbol
##      TRUE 
## 0.4925373

Cálculo de probabilidad de P(voleybol U futbol)

Ya se tiene las probabilidad de prob.voleybol prob.futbol volIfut Se genera la probabailida de voleybol union con futbol (prob.volUfut) por medio de la fórmula Se sustituye en la fórmula de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) Comprobar que la probabilidad es la misma que por medio del métoto de frecuencia relativa Se utiliza la función as.numeric() para garantizar que son numéricos y se pueden hacer operaciones aritiméticas

as.numeric(prob.voleybol)
## [1] 0.2089552
as.numeric(prob.futbol)
## [1] 0.4925373
as.numeric(prob.volIfut)
## [1] 0.1044776
prob.volUfut <- as.numeric(prob.voleybol) + as.numeric(prob.futbol) - as.numeric(prob.volIfut)

prob.volUfut
## [1] 0.5970149
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen voleybol o futbol?
", prob.volUfut)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen voleybol o futbol?
##  0.5970149

Tablas cruzadas

table(datos$voleybol, datos$futbol)
##        
##         FALSE TRUE
##   FALSE    27   26
##   TRUE      7    7

Frecuencias utilizando tablas cruzadas

voleybol futbol La función table() generan frecuencias El atributo dnn son los encabezados de la tabla, arriba y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

tabla.cruzada <- table(datos$voleybol, datos$futbol, dnn = c('voleybol','futbol'))

tabla.cruzada
##         futbol
## voleybol FALSE TRUE
##    FALSE    27   26
##    TRUE      7    7
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))

tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))

tabla.cruzada.s
##       FALSE TRUE   
## FALSE    27   26 53
## TRUE      7    7 14
##          34   33 67

Interpretación de la tabla cruzada frecuencias

Hay 14 alumnos que juegan voleybol ; renglón 2 de un total de 67 Hay 33 personas que juegan futbol columna 2 de un total de 67 Hay 7 personas que juegan voleybol y futbol al mismo tiempo de un total de 67

Cálculo de probabilidades utilizando tablas cruzadas

voleybol futbol La función prop.table(table()) generacia probabailidades El atributo dnn son los encabezados de la tabla, arribay y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

prob.tabla.cruzada <- round(prop.table(table(datos$voleybol, datos$futbol, dnn = c('voleybol','futbol'))),4)

prob.tabla.cruzada
##         futbol
## voleybol  FALSE   TRUE
##    FALSE 0.4030 0.3881
##    TRUE  0.1045 0.1045
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
                            
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) 

prob.tabla.cruzada
##        FALSE   TRUE       
## FALSE 0.4030 0.3881 0.7911
## TRUE  0.1045 0.1045 0.2090
##       0.5075 0.4926 1.0001

###Interpretación de la tabla cruzada probabilidades Hay 14 alumnos que juegan voleybol que representan el 20.90 % del 100% Hay 33 personas que juegan futbol que representan el 49.26% del 100% Hay 7 personas que juegan volebol y futbol al mismo tiempo que representan el 10.45% del 100% o del total de alumnos

Ley de la adición para determinar probabilidades Basquetbol y Voleybol

Al tener elementos en común se determina el cálculo de la probailidad por medio de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) ¿ Cuál es la probabilidad de que juegue basquetbol o voleybol una persona por medio de la ley de la adición para conjuntos no excluyentes que significa que hay elementos en común? Probabilida de que juegue basquetbol o que juegue voleybol Anteriormente por medio de prop.table(table()) se observaron las probabilidades, aquí se vuelven a determinar Se almacenan las probabilidades en variables correspondientes prob.basquetbol[2] porque es la que es TRUE prob.voleybol[2] porque es la que es TRUE

prob.basquetbol <- prop.table(table(datos$basquetbol))
prob.voleybol <- prop.table(table(datos$voleybol))

prob.basquetbol <- prob.basquetbol[2] 
prob.voleybol <- prob.voleybol[2]

prob.basquetbol
##      TRUE 
## 0.3283582
prob.voleybol
##      TRUE 
## 0.2089552

Cálculo de probabilidad de P(basquetbol U voleybol)

Ya se tiene las probabilidad de prob.voleybol prob.basquetbol basIvol Se genera la probabailida de basquetbol union con voleybol (prob.basUvol) por medio de la fórmula Se sustituye en la fórmula de la ley de la adición Prob(A ∪ B) = Prob(A) + Prob(B) - Prob(A ∩ B) Comprobar que la probabilidad es la misma que por medio del métoto de frecuencia relativa Se utiliza la función as.numeric() para garantizar que son numéricos y se pueden hacer operaciones aritiméticas

as.numeric(prob.basquetbol)
## [1] 0.3283582
as.numeric(prob.voleybol)
## [1] 0.2089552
as.numeric(prob.basIvol)
## [1] 0.04477612
prob.basUvol <- as.numeric(prob.futbol) + as.numeric(prob.basquetbol) - as.numeric(prob.futIbas)

prob.basUvol
## [1] 0.6716418
cat("* ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
", prob.basUvol)
## * ¿Cuál es la probabilidad de que existan alumnos que jueguen fútbol o basquetbol?
##  0.6716418

Tablas cruzadas

table(datos$basquetbol, datos$voleybol)
##        
##         FALSE TRUE
##   FALSE    34   11
##   TRUE     19    3

Frecuencias utilizando tablas cruzadas

voleybol basquetbol La función table() generan frecuencias El atributo dnn son los encabezados de la tabla, arriba y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

tabla.cruzada <- table(datos$basquetbol, datos$voleybol, dnn = c('basquetbol','voleybol'))

tabla.cruzada
##           voleybol
## basquetbol FALSE TRUE
##      FALSE    34   11
##      TRUE     19    3
tabla.cruzada.s <- rbind(tabla.cruzada, apply(tabla.cruzada,2,sum))

tabla.cruzada.s <- cbind(tabla.cruzada.s, apply(tabla.cruzada.s,1,sum))

tabla.cruzada.s
##       FALSE TRUE   
## FALSE    34   11 45
## TRUE     19    3 22
##          53   14 67

Interpretación de la tabla cruzada frecuencias

Hay 22 alumnos que juegan basquetbol; renglón 2 de un total de 67 Hay 14 personas que juegan voleybol columna 2 de un total de 67 Hay 3 personas que juegan basquetbol y voleybol al mismo tiempo de un total de 67

Cálculo de probabilidades utilizando tablas cruzadas

basquetbol voleybol La función prop.table(table()) generacia probabailidades El atributo dnn son los encabezados de la tabla, arribay y a la izquierda Con la matriz es mas fácil determinar probabilidades de conjuntos función rbind() para agregar renglon función cbind() para agregar columna apply() para alicar por ejemplo sum a cad renglon o columna

prob.tabla.cruzada <- round(prop.table(table(datos$basquetbol, datos$voleybol, dnn = c('basquetbol','voleybol'))),4)

prob.tabla.cruzada
##           voleybol
## basquetbol  FALSE   TRUE
##      FALSE 0.5075 0.1642
##      TRUE  0.2836 0.0448
prob.tabla.cruzada <- rbind(prob.tabla.cruzada,apply(prob.tabla.cruzada,2,sum))
                            
prob.tabla.cruzada <- cbind(prob.tabla.cruzada, apply(prob.tabla.cruzada,1,sum)) 

prob.tabla.cruzada
##        FALSE   TRUE       
## FALSE 0.5075 0.1642 0.6717
## TRUE  0.2836 0.0448 0.3284
##       0.7911 0.2090 1.0001

Interpretación de la tabla cruzada probabilidades

Hay 22 alumnos que jueganbasquetbol que representan el 32.84 % del 100% Hay 14 personas que juegan voleybol que representan el 20.90% del 100% Hay 3 personas que juegan basquetbol y voleybol al mismo tiempo que representan el 4.48 % del 100% o del total de alumnos

Ya para concluir con la practica podemos tomar como el aprendizaje y al mismo tiempo describir un poco del mismo se puede recalcar que los aprendizajes de las practicas es el mostrarnos las veces que puede ocurrir un evento y vomo puede enlazarse con otro similar