“Probabilidad es el lenguaje matemático para cuantificar incertidumbre.” -Wasserman
Terminología de probabilidad: espacio de resultados, eventos, funciones de probabilidad, etc.
Interpretación frecuentista de probabilidad.
Probabilidad condicional y su relación con independencia.
La regla de Bayes.
El espacio de resultados \(\Omega\) es el conjunto de posibles resultados de un experimento aleatorio.
e.g. Si lanzamos una moneda dos veces entonces:
\[ \Omega = \{AA, AS, SA, SS \} \] Un Evento es un subconjunto del espacio muestral, los eventos usualmente se denotan por letras mayúsculas.
e.g. Que el primer lanzamiento resulte águila es
\[ A = \{AA, AS\} \]
La probabilidad se puede ver como una extensión de la idea de proporción, o cociente de una parte con respecto a un todo.
e.g Si en la carrera de Ing. Química hay 300 Hombres y 700 Mujeres, la proporción de hombres es:
\[ \frac{300}{700+300}=0.3\ \]
Eventos Equiprobables Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados:
\[ P(A)=\frac{\#(A)}{\#(\Omega)} \]
Por lo que solo hace falta contar.
e.g. combinaciones
Un comité de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿cuál es la probabilidad de que el comité este conformado por 3 hombres y 2 mujeres?
Hay \(\dbinom{15}{5}\) posibles comités, cada uno tiene la misma posibilidad de ser seleccionado.
Por otra parte hay \(\dbinom{6}{3} \dbinom{9}{2}\) posibles comités que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es:
\[ \frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{5}} \]
y la función para calcular las combinaciones es choose(n, r)
choose(6, 3) * choose(9, 2) / choose(15, 5)
## [1] 0.2397602
Una frecuencia relativa es una proporción que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones.
lanzamientos_10 <- sample(c("A", "S"),10, replace=TRUE)
lanzamientos_10
## [1] "S" "A" "S" "S" "A" "S" "S" "S" "A" "S"
Podemos calcular las secuencias de frecuencia relativa de águila
cumsum(lanzamientos_10 == "A") #Suma acumulada de águilas
## [1] 0 1 1 1 2 2 2 2 3 3
Diviendo
round(cumsum(lanzamientos_10 == "A") / 1:10, 2)
## [1] 0.00 0.50 0.33 0.25 0.40 0.33 0.29 0.25 0.33 0.30