Introducción a la probabilidad
Probabilidad es el lenguaje matemático para cuantificar la incertidumbre. Wasserman
- Terminología de probabilidad: espacio de resultados, eventos, funciones de probabilidad, etc.
- Interpretación frecuencista de la probabilidad.
- Probabilidad condicional y su relación con la incertidumbre.
Espacio de resultados y eventos
El espacio de resultados \(\Omega\) es el conjunto de resultados de un experimento aleatorio.
e.g. Si lanzamos una moneda dos veces: \[\Omega =\{AA, AS, SA, SS\}\]
Un evento es el subconjunto del espacio muestral, los eventos usualmente se denotan por mayúsculas. e.g. Que el primer lanzamiento resulte águila. \[\A={AA,AS\}\]
Eventos equiprobables
La probabilidad se puede ver como una extensión de la idea de la proporción, o cociente de una parte con respecto a un todo.
e.g. En la carrera de Ing. Química hay 300 hombres y 700 mujeres, la proporción de hombres es: \[\frac{300}{700+300} = 0.3 \]
Eventos equiprobables Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados: \[ P(A)=\frac{\#(A)}{\#(\Omega)}\]
Por lo que hace falta contar. e.g. Combinaciones Un comité de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿cuál es la probabilidad de que el comité este conformado por 3 hombres y 2 mujeres? Hay \(\dbinom{15}{5}\) posibles comités, cada uno tiene las mismas posibilidades de ser seleccionado. Por otra parte hay \(\dbinom{6}{3} \dbinom{9}{2}\) posibles comités que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es: \[\frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{3}}\] y la función para calcular las combinaciones es choose (n, r)
choose(6, 3) * choose(9, 2) / choose(15, 5)## [1] 0.2397602
Interpretación frecuencista de la probabilidad
Una frecuencia relativa es una proporcion que mide que tan seguido, o frecuente, ocrre una cosa u otra cosa en una sesion de observacion.
lanzamientos_10 <- sample(c("A", "S"),10, replace = TRUE )
lanzamientos_10## [1] "S" "S" "A" "S" "S" "S" "A" "S" "S" "A"
Podemos calcular las secuencias de frecuencias relativas de aguila:
cumsum(lanzamientos_10 == "A") # suma acumulada de aguila## [1] 0 0 1 1 1 1 2 2 2 3
Dividiendo
round(cumsum(lanzamientos_10 == "A") / 1:10, 2)## [1] 0.00 0.00 0.33 0.25 0.20 0.17 0.29 0.25 0.22 0.30