Objetivo

Determinar la probabilidad condicional con datos de personas

Descripción

Cargar los datos de personas y determinar los subconjungos y sus probabilidades iniciales para posteriormente calcular probabilidad condicionales que se piden

Proceso

1. Cargar librerías

library(knitr)
library(dplyr)

2. Cargar los datos

source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/construir%20datos%20y%20funciones%20caso%209.r", encoding = "UTF-8")

kable(personas)
nombres generos ajedrez beisbol tiro.arco pesas futbol softbol atletismo folklorico tahitiano teatro rondalla pantomima
JUAN M NO NO NO SI NO SI NO NO NO NO NO SI
JOSÉ LUIS M NO NO NO NO NO NO NO SI NO NO NO NO
JOSÉ M NO SI NO SI NO NO NO NO NO NO SI SI
MARÍA GUADALUPE F NO SI NO NO NO NO NO NO NO NO SI SI
FRANCISCO M NO NO NO NO NO NO SI NO NO NO NO NO
GUADALUPE F NO NO NO NO NO NO NO NO NO NO NO NO
MARÍA F NO SI NO NO SI NO NO NO NO NO NO NO
JUANA F NO NO NO NO SI NO NO SI NO NO NO NO
ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO
JESÚS M NO NO SI NO NO SI NO NO SI NO NO NO
MIGUEL ÁNGEL M NO NO NO NO NO NO NO NO SI NO NO NO
PEDRO M NO NO NO NO NO NO NO NO NO NO NO NO
ALEJANDRO M NO NO SI NO SI NO SI NO SI NO NO NO
MANUEL M NO NO NO NO NO NO SI NO NO NO NO NO
MARGARITA F NO NO NO NO NO NO SI NO NO NO NO NO
MARÍA DEL CARMEN F NO NO NO NO NO SI NO NO NO NO NO NO
JUAN CARLOS M SI NO NO NO NO NO SI NO SI NO NO NO
ROBERTO M NO SI NO NO NO NO NO NO NO NO SI NO
FERNANDO M NO NO NO NO SI NO NO NO NO NO SI NO
DANIEL M NO NO NO NO NO NO SI NO NO NO NO NO
CARLOS M NO NO NO NO NO NO NO NO NO NO SI NO
JORGE M SI NO NO NO NO NO NO NO NO NO NO NO
RICARDO M NO NO NO NO SI NO NO NO NO SI NO NO
MIGUEL M NO NO NO SI NO NO NO NO NO NO NO NO
EDUARDO M NO NO NO SI NO NO NO NO NO SI SI SI
JAVIER F NO NO NO NO NO SI NO NO NO NO SI NO
RAFAEL M NO NO NO NO NO NO NO SI NO NO NO NO
MARTÍN M NO NO NO NO NO NO SI NO NO NO NO NO
RAÚL M NO SI NO SI NO NO NO SI NO NO SI NO
DAVID M NO NO NO NO NO NO NO NO NO NO NO NO
JOSEFINA M NO NO NO NO NO SI NO NO NO SI NO SI
JOSÉ ANTONIO M NO NO SI NO NO NO NO SI NO NO NO NO
ARTURO F NO NO NO NO SI NO NO NO NO NO NO SI
MARCO ANTONIO M NO NO NO NO NO NO NO NO NO NO NO NO
JOSÉ MANUEL F NO NO NO SI NO NO NO SI NO NO NO NO
FRANCISCO JAVIER F SI NO NO NO NO NO NO SI NO NO SI NO
ENRIQUE M NO NO NO NO NO NO NO NO SI NO SI NO
VERÓNICA M NO NO NO SI NO NO NO NO NO NO SI NO
GERARDO F NO NO NO NO NO NO NO SI NO NO NO NO
MARÍA ELENA M NO NO NO NO NO NO SI SI NO NO NO NO
LETICIA F NO NO NO NO NO NO NO SI NO NO SI NO
ROSA F SI NO NO NO NO SI NO NO NO NO NO NO
MARIO M NO NO SI SI NO NO NO NO NO NO NO NO
FRANCISCA F NO NO SI NO NO NO SI NO NO NO NO NO
ALFREDO M NO NO NO SI NO NO NO NO NO SI NO NO
TERESA F NO NO NO NO NO NO NO SI NO NO NO NO
ALICIA F NO SI NO NO NO SI NO NO NO SI NO NO
MARÍA FERNANDA F NO SI SI NO NO NO SI SI NO SI NO NO
SERGIO M SI NO NO NO NO NO NO NO NO NO NO NO
ALBERTO M NO NO NO NO NO NO SI NO NO NO NO NO
LUIS M NO NO NO NO NO NO NO NO SI NO NO SI
ARMANDO M NO NO SI NO NO NO SI NO NO NO NO NO
ALEJANDRA F NO NO NO NO NO NO NO SI NO NO NO NO
MARTHA F NO NO NO NO NO NO NO NO NO NO SI NO
SANTIAGO M NO NO NO NO NO SI NO SI SI NO NO NO
YOLANDA F SI NO NO NO SI NO NO NO NO NO NO NO
PATRICIA F NO NO NO NO NO NO NO NO NO NO NO NO
MARÍA DE LOS ÁNGELES F NO NO NO SI NO NO NO NO NO NO SI NO
JUAN MANUEL M NO NO NO NO NO NO NO SI NO SI SI NO
ROSA MARÍA F NO NO NO NO NO SI NO SI NO NO NO NO
ELIZABETH F NO NO NO NO NO NO NO SI NO NO NO NO
GLORIA F NO NO NO NO NO NO NO NO NO NO NO NO
ÁNGEL M NO NO NO NO NO NO NO NO NO NO NO NO
GABRIELA F NO NO NO NO NO NO NO NO NO NO NO NO
SALVADOR M SI NO NO NO NO NO SI NO NO NO SI NO
VÍCTOR MANUEL M NO SI SI SI NO NO NO NO NO NO NO NO
SILVIA F NO NO NO NO NO NO NO NO NO SI NO NO
MARÍA DE GUADALUPE F NO NO NO NO SI NO NO SI NO SI NO NO
MARÍA DE JESÚS F NO NO NO SI SI NO NO NO NO NO NO NO
GABRIEL M SI NO SI NO NO SI NO NO NO NO NO NO
ANDRÉS M NO NO NO NO NO NO NO NO NO NO NO NO
ÓSCAR M SI NO NO NO NO NO NO NO NO NO NO NO
GUILLERMO M NO NO NO NO NO NO NO NO NO NO NO NO
ANA MARÍA F NO NO NO NO NO NO NO NO NO NO SI NO
RAMÓN M NO NO NO NO NO NO NO NO NO SI NO NO
MARÍA ISABEL F NO SI NO NO NO NO NO NO NO NO NO SI
PABLO M NO NO SI NO NO NO SI SI NO NO NO NO
RUBEN M NO SI NO NO NO NO NO NO NO NO SI NO
ANTONIA F NO NO NO NO NO NO NO NO NO NO NO SI
MARÍA LUISA F SI NO NO NO NO NO NO NO NO NO NO NO
LUIS ÁNGEL M NO NO NO NO NO NO SI NO SI NO NO NO
MARÍA DEL ROSARIO F NO NO SI NO NO SI NO NO NO NO NO NO
FELIPE M NO NO NO NO NO NO NO NO NO NO NO NO
JORGE JESÚS M NO SI NO NO NO NO SI NO NO NO NO NO
JAIME M NO NO SI NO SI NO NO NO SI SI NO NO
JOSÉ GUADALUPE M NO NO NO NO NO SI NO NO NO NO NO SI
JULIO CESAR M SI NO NO NO NO NO NO SI NO NO NO NO
JOSÉ DE JESÚS M SI NO SI NO NO SI SI NO NO NO SI NO
DIEGO M NO NO NO SI NO NO NO NO NO NO NO NO
ARACELI M NO NO NO NO NO NO NO NO NO NO SI NO
ANDREA F NO NO NO NO NO NO NO NO NO NO NO SI
ISABEL F NO NO NO NO NO NO NO NO NO NO NO NO
MARÍA TERESA F NO SI NO NO SI NO NO SI NO NO NO NO
IRMA F SI SI NO NO NO NO NO NO NO NO NO NO
CARMEN F NO NO NO NO NO NO NO NO NO NO NO NO
LUCÍA F NO SI NO SI NO NO NO SI NO NO SI SI
ADRIANA F NO NO NO NO NO NO SI NO NO NO NO NO
AGUSTÍN M NO SI NO NO NO NO NO NO SI NO NO NO
MARÍA DE LA LUZ F NO NO NO NO NO NO SI NO NO NO NO NO
GUSTAVO M NO NO NO NO NO NO NO SI NO NO NO NO
  • Determinando n
n <- nrow(personas)

Fórmula de probabilidad condicional

\[P(A | B) = \frac{P(A \cap B)}{P(B)} \] o

\[P(B | A) = \frac{P(B \cap A)}{P(A)} \]

3.1. ¿Cuál es la probabilidad de que juegue ajedrez dado que es Hombre?

\[P(ajedrez | hombre) = \frac{P(ajedrez \cap hombre)}{P(hombre)} \] * Se necesita \(P(ajedrez \cap hombre)\) numerador * Se necesita \(P(hombre)\) denominador

ajedrez <- f.obten.subconjunto(personas, 'ajedrez')
hombre <- f.obten.subconjunto(personas, 'masculino')

# Numerador
casos <- nrow(intersect(ajedrez, hombre))
p.ajedrez.I.hombre <- casos / n
p.ajedrez.I.hombre
## [1] 0.08
# Denominador
casos.hombres <- nrow(hombre) 
p.hombre <- casos.hombres / n
p.hombre
## [1] 0.58
# Aplicando la Fórmula
p.ajedrez.dado.hombre <-  p.ajedrez.I.hombre / p.hombre

paste ("La probabilidad de que juegue ajedrez dado que es Hombre es:", round(p.ajedrez.dado.hombre * 100, 2), "%")
## [1] "La probabilidad de que juegue ajedrez dado que es Hombre es: 13.79 %"

3.2. ¿Cuál es la probabilidad de que haga actividad cultural dado que es mujer?

\[P(cultural | mujer) = \frac{P(cultural \cap mujer)}{P(mujer)} \] * Se necesita \(P(cultural \cap mujer)\) numerador * Se necesita \(P(mujere)\) denominador

tai <- f.obten.subconjunto(personas, 'tahitiano')
fol <- f.obten.subconjunto(personas, 'folklorico')
tea <- f.obten.subconjunto(personas, 'teatro')
ron <- f.obten.subconjunto(personas, 'rondalla')
pan <- f.obten.subconjunto(personas, 'pantomima')

cultural <- union (tai, fol) %>%
    union (tea) %>%
    union (ron) %>%
    union (pan)

mujeres <- f.obten.subconjunto(personas, 'femenino')

# Numerador
casos <- nrow(intersect(cultural, mujeres))
p.cultural.I.mujer <- casos / n
p.cultural.I.mujer
## [1] 0.24
# Denominador
casos.mujeres <- nrow(mujeres) 
p.mujer <- casos.mujeres / n
p.mujer
## [1] 0.42
# Aplicando la Fórmula
p.cultural.dado.mujer <-  p.cultural.I.mujer / p.mujer

paste ("La probabilidad de que haga actividad cultural dado que es mujer es:", round(p.cultural.dado.mujer * 100, 2), "%")
## [1] "La probabilidad de que haga actividad cultural dado que es mujer es: 57.14 %"

3.3. ¿Cuál es la probabilidad de que practique softbol o béisbol dado que es hombre?

  • Se requiere el conjunto de softbol
  • Se requiere el conjunto de beisbol
  • Se necesita la unión entre softbol y beisbol
  • Se reutiliza el conjunto de personas hombres

\[P((softbol \cup beisbol) | hombre) = \frac{(P(softbol \cup beisbol) \cap p(hombre)}{P(hombre)} \]

softbol <- f.obten.subconjunto(personas, 'softbol')
beisbol <- f.obten.subconjunto(personas, 'beisbol')

# La union de soft y beis
# Numerador
sof.U.bei <- union(softbol, beisbol)

casos <- nrow(intersect(sof.U.bei, hombre))
p.sof.U.bei.I.hombre <- casos / n
p.sof.U.bei.I.hombre
## [1] 0.14
# Denominador
casos.hombres <- nrow(hombre) 
p.hombre <- casos.hombres / n
p.hombre
## [1] 0.58
# Aplicando la Fórmula
p.sof.Bei.hombre <-  p.sof.U.bei.I.hombre / p.hombre

paste ("La probabilidad de que practique softbol o béisbol dado que es hombre es:", round(p.sof.Bei.hombre * 100, 2), "%")
## [1] "La probabilidad de que practique softbol o béisbol dado que es hombre es: 24.14 %"

3.4. ¿Cuál es la probabilidad de que practique tahitiano o folklórico dado que es mujer?

  • Parecido a la pregunta 3

3.5. ¿Cuál es la probabilidad de que sea hombre dado que es mujer?

\[P(hombre | mujer) = \frac{P(hombre \cap mujer)}{P(mujer)} \]

  • Probabilidad el conjunto de hombres
  • Probabilidad del conujto de mujeres
  • Intersección entre hombres y mujers
# Numerador
casos <- nrow(intersect(hombre, mujeres))
p.hombre.I.mujer <- casos / n
p.hombre.I.mujer
## [1] 0
# Denominador
casos.mujeres <- nrow(mujeres) 
p.mujer <- casos.mujeres / n
p.mujer
## [1] 0.42
# Aplicando la fórmula
p.hombre.dado.mujer <-  p.hombre.I.mujer / p.mujer

paste ("La probabilidad de que sea hombre dado que es mujer es:", round(p.hombre.dado.mujer * 100, 2), "%")
## [1] "La probabilidad de que sea hombre dado que es mujer es: 0 %"

4. Interpretación del caso

Entre 80 y 100 palabras describiendo ideas de cada punto el 3.1 al 3.5