Introducción a la probabilidad

Probabilidad es el lenguaje matemático para cuantificar la incertidumbre. Wasserman

  1. Terminología de probabilidad: espacio de resultados, eventos, funciones de probabilidad, etc.
  2. Interpretación frecuencista de la probabilidad.
  3. Probabilidad condicional y su relación con la incertidumbre.

Espacio de resultados y eventos

El espacio de resultados \(\Omega\) es el conjunto de resultados de un experimento aleatorio.

e.g. Si lanzamos una moneda dos veces: \[\Omega =\{AA, AS, SA, SS\}\]

Un evento es el subconjunto del espacio muestral, los eventos usualmente se denotan por mayúsculas. e.g. Que el primer lanzamiento resulte águila. \[\A={AA,AS\}\]

Eventos equiprobables

La probabilidad se puede ver como una extensión de la idea de la proporción, o cociente de una parte con respecto a un todo.

e.g. En la carrera de Ing. Química hay 300 hombres y 700 mujeres, la proporción de hombres es: \[\frac{300}{700+300} = 0.3 \]

Eventos equiprobables Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados: \[ P(A)=\frac{\#(A)}{\#(\Omega)}\]

Por lo que hace falta contar. e.g. Combinaciones Un comité de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿cuál es la probabilidad de que el comité este conformado por 3 hombres y 2 mujeres? Hay \(\dbinom{15}{5}\) posibles comités, cada uno tiene las mismas posibilidades de ser seleccionado. Por otra parte hay \(\dbinom{6}{3} \dbinom{9}{2}\) posibles comités que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es: \[\frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{3}}\] y la función para calcular las combinaciones es choose (n, r)

choose(6, 3) * choose(9, 2) / choose(15, 5)
## [1] 0.2397602

Interpretación frecuencista de la probabilidad

Una frecuencia relativa es una proporcion que mide que tan seguido, o frecuente, ocrre una cosa u otra cosa en una sesion de observacion.

lanzamientos_10 <- sample(c("A", "S"),10, replace = TRUE )
lanzamientos_10
##  [1] "S" "S" "A" "S" "S" "S" "A" "S" "S" "A"

Podemos calcular las secuencias de frecuencias relativas de aguila:

cumsum(lanzamientos_10 == "A") # suma acumulada de aguila
##  [1] 0 0 1 1 1 1 2 2 2 3

Dividiendo

round(cumsum(lanzamientos_10 == "A") / 1:10, 2)
##  [1] 0.00 0.00 0.33 0.25 0.20 0.17 0.29 0.25 0.22 0.30