Probabilidad es el lenguaje matemático para cuantificar la incertidumbre. - Warsserman
El espacio de resultados \(\Omega\) es el conjunto de resultados de un experimento aleatorio.
e.g. Si lanzamos una moneda dos veces, entonces:
\[\Omega =\{AA, AS, SA, SS \} \] Un evento es un subconjuto del espacio muestral, los eventos usualmente se denota por mayúsculas.
e.g. Que el primer lanzamiento resulte águila.
\[ A= \{AA, AS\} \]
La probabilidad se puede ver como una extensión de la idea de proporción o cociente de una parte con respecto a un todo,
e.g. En la carrera de Ing. Química hay 300 hombres y 700 mujeres, la proporción de hombres es:
\[ \frac {300}{700}=0.3 \]
Eventos equiprobables si todos los elementos del espacio de resultados tienen la misma oportunidad de ser elegidos, entonces la probilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados:
\[ P(A)= \frac{\#(A)}{\#(\Omega)} \] Por lo que solo hace falta contar.
e.g. Combinaciones
Un comité de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿Cuál es la probabilidad de que el comité esté conformado por 3 hombres y 2 mujeres?
Hay \(\dbinom{15}{5}\) posibles comités, cada uno tiene la misma posibilidad de ser seleccionado.
Por otra parte hay \(\dbinom{6}{3} \dbinom{9}{2}\) posibles comités que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es:
\[ \frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{5}} \] y la función para calcular las combinaciones es choose (n, r)
choose(6, 3) * choose(9, 2) / choose(15, 5)
## [1] 0.2397602
Una frecuencia relatica es una proporción que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones.
lanzamientos_10 <- sample(c("A", "S"),10, replace= TRUE )
lanzamientos_10
## [1] "S" "S" "S" "A" "S" "S" "A" "S" "A" "A"
Podemos calcular las secuencias de frecuencias relativas de águila:
cumsum(lanzamientos_10 == "A") #Suma acumulada de águilas.
## [1] 0 0 0 1 1 1 2 2 3 4
Dividiendo
round(cumsum(lanzamientos_10=="A") / 1:10, 2)
## [1] 0.00 0.00 0.00 0.25 0.20 0.17 0.29 0.25 0.33 0.40
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.