Determinar la probabilidad condicional
De un conjunto de varios ejercicios extraídos de de la literatura de probabilidad de entre libros y sitios WEB se de termina la probabilidad condicional a partir de datos iniciales.
Lo datos iniciales pueden ser la frecuencias, las probabilidad de evento A y evento B así como la probabilidad de intersección entre ambos eventos o conjunto, con ello se determina la probabilidad condicional utilizando la fórmula que se cita más adelante.
Se presentan ejercicios probabilidad condicional
Se carga la librería knitr previa instalación con install.packages(“knitr”) que permite entre otras cosas, dar formato a las tablas de datos.
library(knitr)
## Warning: package 'knitr' was built under R version 4.0.4
Extraído de (matemovil, n.d.)
\[ P(A)=0.60\] \[ P(A)=0.40\]
\[ P(A ∩ B)=0.60\]
Calcular:
\[ P(A | B) = \frac{P(A \cap B)}{P(B)} = \frac{0.18}{0.40}=0.45 \]
prob.A <- 0.60
prob.B <- 0.40
prob.A.Inter.B <- 0.18
prob.B.Inter.A <- prob.A.Inter.B # La misma
Entonces: \(P(A|B)\)
Prob.A.dado.B <- prob.A.Inter.B / prob.B
paste("La pobabilidad de que se de A dado B es: ", Prob.A.dado.B * 100, "%")
## [1] "La pobabilidad de que se de A dado B es: 45 %"
\[ P(B | A) = \frac{P(B \cap A)}{P(A)} = \frac{0.18}{0.60}=0.3 \]
Entonces: \(P(B|A)\)
Prob.B.dado.A <- prob.B.Inter.A / prob.A
paste("La pobabilidad de que se de A dado B es: ", Prob.B.dado.A * 100, "%")
## [1] "La pobabilidad de que se de A dado B es: 30 %"
Ejercicio tomado del libro de (Walpole et al. 2007)
Se identifican las frecuencias de personas que trabajan y no trabajan hombre y mujeres en una ciudad pequeña X:
| Hombre | Empleado | Desempleado | Total |
|---|---|---|---|
| Hombre | 460 | 40 | 500 |
| Mujer | 140 | 260 | 400 |
| Total | 600 | 300 | 900 |
hombres.trabajan = 460
hombres.no.trabajan = 40
mujeres.trabajan = 140
mujeres.no.trabajan = 260
n.personas <- sum(hombres.trabajan, hombres.no.trabajan, mujeres.trabajan, mujeres.no.trabajan)
n.trabajan <- sum(hombres.trabajan, mujeres.trabajan)
Construir un conjunto de datos con los totales usando funcion apply() que genera los márgenes totales por renglón y por columna.
La funciones cbind() agrega una nueva columna al conjunto de datos
La función rbind() agrega un nuevo renglón al conjunto de datos
datos <- data.frame(Empleado = c(hombres.trabajan, mujeres.trabajan), Desempleado = c(hombres.no.trabajan, mujeres.no.trabajan))
kable(datos, caption = "Personas que trabajan y no trabajan")
| Empleado | Desempleado |
|---|---|
| 460 | 40 |
| 140 | 260 |
datos <- cbind(datos, Total = apply(datos, 1, sum))
datos <- rbind(datos, apply(datos, 2, sum))
rownames(datos) <- c("Hombre", "Mujer", "Total")
kable(datos, caption = "Totales de personas (hombres y mujeres) que trabajan y no trabajan")
| Empleado | Desempleado | Total | |
|---|---|---|---|
| Hombre | 460 | 40 | 500 |
| Mujer | 140 | 260 | 400 |
| Total | 600 | 300 | 900 |
Uno de estos individuos se seleccionará al azar para que realice viaje a través del país para promover las ventajas de establecer industrias nuevas en la ciudad (Durango, México). Nos interesaremos en los eventos siguientes:
Entonces se elige a un hombre que trabaja (numerador de la fórmula de probabilidad condicional):
\[ P(hombres.y.trabajan) = P(hombres \cap trabajan)=n(hombres.trabajan) / n.personas \therefore \]
\[ P(hombres \cap trabajan) = 460/900 = 0.51 \]
La probabilidad de que que trabaje es:
\[ P(trabajan) = n.trabajan / n.personas = 600/900 = 0.66 \]
y finalmente conforme la fórmula ¿cuál es la probabilidad de que se elija a una persona que sea hombre dado que trabaja?:
\[ P(A | B) = \frac{P(A \cap B)}{P(B)} \]
\[ P(hombres | trabajan) = \frac{P(hombres \cap trabajan)}{P(trabajan)} = 0.51 / 0.66 = 0.76 \]
p.hombre.inter.trabajan <- hombres.trabajan / n.personas
p.trabaja <- n.trabajan / n.personas
p.hombre.dado.trabaja <- p.hombre.inter.trabajan / p.trabaja
paste("La probabilidad que se elija a una persona que sea hombre dado que trabaja es: ", round(p.hombre.dado.trabaja * 100,2), "%")
## [1] "La probabilidad que se elija a una persona que sea hombre dado que trabaja es: 76.67 %"
La probabilidad de que un vuelo programado normalmente salga a tiempo es \(P(D)= 0.83\), la probabilidad de que llegue a tiempo es \(P(A)=0.82\) y la probabilidad de que salga y llegue a tiempo es \(P(D∩A)=0.78\)
\[ P(A | D) = \frac{P(A \cap D)}{P(D)} = \frac {0.78}{0.83} = 0.94 \]
prob.D <- 0.83
prob.A <- 0.82
prob.A.inter.D <- 0.78
prob.A.dado.D <- prob.A.inter.D / prob.D
paste("La probabilidad de que un avión llegue a tiempo, dado que salió a tiempo es: ", round(prob.A.dado.D * 100, 2), "%")
## [1] "La probabilidad de que un avión llegue a tiempo, dado que salió a tiempo es: 93.98 %"
\[ P(D | A) = \frac{P(D \cap A)}{P(A)} = \frac {0.78}{0.82} = 0.95 \]
prob.D.dado.A <- prob.A.inter.D / prob.A
paste("La probabilidad de que un avión llegue a tiempo, dado que salió a tiempo es: ", round(prob.D.dado.A * 100, 2), "%")
## [1] "La probabilidad de que un avión llegue a tiempo, dado que salió a tiempo es: 95.12 %"
Una maestra de matemáticas hizo en su clase dos exámenes.
El 30% de la clase paso ambos exámenes,
El 45% de la clase paso el primer examen.
¿Qué porcentaje de aquellos que pasaron el primer examen también pasaron el segundo? Caso extraído de : (HotMath, n.d.)
\[ P(Ex1 \cap Ex2) = 0.30 \]
\[ P(E_x1)=0.45 \]
\[ ENTONCES \]
\[ P(Ex2|Ex1) = \frac{P(Ex1 \cap Ex2)}{P(Ex1)} = \frac {0.30}{0.45} = 0.66 \]
P.Ex1 <- 0.45
P.Ex1.inter.Ex2 <- 0.30
P.Ex2.dado.Ex1 <- P.Ex1.inter.Ex2 / P.Ex1
paste("El porcentaje de aquellos que pasaron el primer examen también pasaron el segundo es:", round(P.Ex2.dado.Ex1 * 100, 2), "%")
## [1] "El porcentaje de aquellos que pasaron el primer examen también pasaron el segundo es: 66.67 %"
paste("Dos tercios o aproximadamente el 66.7% de la clase paso el segundo examen.")
## [1] "Dos tercios o aproximadamente el 66.7% de la clase paso el segundo examen."
La siguiente es una clasificación, según el género y el nivel de escolaridad, de una muestra aleatoria de 200 adultos. ejercicio extraído de (Walpole, Myers, and Myers 2012).
| Escolaridad | Hombre | Mujer |
|---|---|---|
| Primaria | 38 | 45 |
| Secundaria | 28 | 40 |
| Universidad | 27 | 22 |
Si se elige una persona al azar de este grupo, ¿cuál es la probabilidad de que…
\[ P(Hombre | Secundaria ) = \frac{P(Hombre \cap Secundaria)}{P(Secundaria)} = \frac{0.14}{0.34}=0.41 \]
\[ P(Universidad | Mujer) = \frac{P(Universidad) \cap P(Mujer) )}{P(Mujer)}= \frac{0.11}{0.535}=0.20 \]
La noción de probabilidad condicional es la probabilidad existente de que suceda un evento A, conociendo que además debe de haber ocurrido el evento B. Su aplicación está algo restringida, pues únicamente se puede aplicar cuando haya un evento que es dependiente a otro, por lo que para eventos independientes las fórmulas aplicadas en el documento no se podrían utilizar, ahora bien, la fórmula para calcular la probabilidad de que el evento A suceda dado que el evento B haya sido efectuado es: \(P(A |B) = \frac{P(A) \cap P(B) )}{P(B)}\).
El primer ejercicio es por así decirlo, un cálculo en bruto, puesto que solo nos pide hacer el calculo de la probabilidad de que A sucede a partir de que B sí se cumplió
El segundo ejercicio es una aplicación más práctica y realista, pues trabaja con una gran cantidad de trabajadores que componen a una empresa y muestra la probabilidad de seleccionar a alguno de esos individuos para realizar una tarea.
El tercer ejercicio trabaja con el porcentaje de ocasiones en los que los vuelos llegan a tiempo y también de que lleguen a tiempo, mostrando junto con el ejercicio anterior que no es necesario que nos den las probabilidades, pues nosotros mismos podemos calcularlas teniendo los valores totales de los datos obtenidos.
El cuarto y quinto ejercicio son ejemplos que podrían suceder en la vida diaria, aunque eso sí, únicamente aplican lo antes aprendido en ejercicios anteriores