Introducción a la probabilidad

Temas básicos

“Probabilidad es el lenguaje matemático para cuantificar incertidumbre.” -Wasserman

  1. Terminología de probabilidad: espacio de resultados, eventos, funciones de probabilidad, etc.

  2. Interpretación frecuentista de probabilidad.

  3. Probabilidad condicional y su relación con independencia.

  4. La regla de Bayes

Espacio de resultados y de eventos

El espacio de resultados \(\Omega\) es el conjinto de posibles resultados de un experimento aleatorio.

Ejemplo: Si lanzamos una moneda dos veces entonces:

\[ \Omega = \{AA, AS, SA, SS \} \]

Un evento es un subconjunto del espacio muestral, los eventos usualmente se denotan por letras mayúsculas.

El evento: que el primer lanzamiento resulte águila es

\[ A = \{AA, AS\} \]

Eventos equiprobables

La probabilidad se puede ver como una extensión de la idea de proporción, o cociente de una parte con respecto a un todo. Si en la carrera de química tenemos:

  • 300 estudiantes hombres
  • 700 estudiantes mujeres

La proporción de hombres es:

\[ \frac{300}{700+300}=0.3\ \]

Ahora, supongamos que elegimos un estudiante al azar, la probabilidad de elegir una mujer es 0.7.

En el ejemplo hay un supuesto implícito en elegir al azar (o aleatoria mente), en este caso estamos suponiendo que todos los estudiantes tienen la misma probabilidad de ser elegidos, que nos lleva al siguiente concepto:

Eventos equiprobables. Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados:

\[ P(A)=\frac{\#(A)}{\#(\Omega)} \]

Por lo que solo hace falta contar.

e.g. La probabilidad de obtener AA si lanzamos una moneda 2 veces es de 1/4 que también es 0.25 ó 25%, y la probabilidad del evento que el primer lanzamiento resulte águila es de 2/4 = 0.5 ó 50%

ejemplo: combinaciones y permutaciones

Principales diferencias

Formula para obtener el numero total de n combinaciones de r

Formula de comnbinaciones

Ejemplo:

para este caso

e.g. Un comité de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿cuál es la probabilidad de que el comité este conformado por 3 hombres y 2 mujeres?

hay \(\dbinom{15}{5}\) posibles comités, cada uno tiene la misma posibilidad de ser seleccionado.

Por otra parte hay $ $ posibles comités que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es:

\[ \frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{5}} \] la función para calcular las combinaciones en R (random) es choose(n, r)

¿cuál es la probabilidad de que el comité este conformado por 3 hombres y 2 mujeres?

choose(6,3) * choose(9,2) / choose(15,5)
## [1] 0.2397602
  • Si tenemos que pedir 3 pizzas y hay un total de 10 ingredientes ¿Cuál es el número total del cual puedo combinando los ingredientes en 3 pizzas?

nCr 10 C 3

choose(10,3)
## [1] 120

Interpretación frecuentista de la probabilidad

Una frecuencia relativa es una proporción que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones.

lanzamientos_10 <- sample (c("A","S"),10, replace = TRUE)
lanzamientos_10
##  [1] "S" "S" "A" "S" "A" "A" "S" "A" "A" "S"

conteo

table(lanzamientos_10)
## lanzamientos_10
## A S 
## 5 5

Podemos calcular las secuencia de frecuencias relativas de águila:

round(cumsum(lanzamientos_10 == "A" ) / 1:10,2 )
##  [1] 0.00 0.00 0.33 0.25 0.40 0.50 0.43 0.50 0.56 0.50

Distribuciones de probabilidad

Funciones de distribución en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

Distribución Alias

Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución Chi2 chisq Distribución F f

$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

$$ * e.g. con distribución exponencial:

curve(dexp(x), from=0, to=10)

Distribución normal

Fórmula de la distribución normal

Distribución normal, distribución de Gauss, distribución gaussiana o distribución de Laplace-Gauss, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en estadística y en la teoría de probabilidades.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro estadístico (regularmente la media). Esta curva se conoce como campana de Gauss y es el gráfico de una función gaussiana.

1.- Calcular la probabilidad de que X sea menor o igual a 48. es decir:

\[ P(\leq 48) \] Si tenemos que: Media igual a 50 y varianza igual a 25

pnorm(48, mean = 50, sd = sqrt(25))
## [1] 0.3445783

2.- también se puede hacer esto de forma más compacta y calculando para números mayores a 48:

pnorm(48,50,sqrt(25), lower.tail = FALSE)
## [1] 0.6554217

3.- Calcular la probabilidad de que X sea mayor o igual a 45 y menor que 55, es decir:

$ P(45X < 55) $ $ P(45X < 55)=P(X<55)-P(X) $

pnorm(55,50,5) - pnorm(45,50,5)
## [1] 0.6826895

4.- ¿Cuál es el valor de X que deja un 90% (cuantil, percentil) por debajo de el?

\[ P(X\leq x_0)=0.90 \]

qnorm(0.90, mean = 50, sd= 5)
## [1] 56.40776

5.- Genera un conjunto de datos aleatorios con distribución normal, media= 50 y varianza= 25

set.seed(123)
rnorm(100, mean=50, sd=5)
##   [1] 47.19762 48.84911 57.79354 50.35254 50.64644 58.57532 52.30458 43.67469
##   [9] 46.56574 47.77169 56.12041 51.79907 52.00386 50.55341 47.22079 58.93457
##  [17] 52.48925 40.16691 53.50678 47.63604 44.66088 48.91013 44.86998 46.35554
##  [25] 46.87480 41.56653 54.18894 50.76687 44.30932 56.26907 52.13232 48.52464
##  [33] 54.47563 54.39067 54.10791 53.44320 52.76959 49.69044 48.47019 48.09764
##  [41] 46.52647 48.96041 43.67302 60.84478 56.03981 44.38446 47.98558 47.66672
##  [49] 53.89983 49.58315 51.26659 49.85727 49.78565 56.84301 48.87115 57.58235
##  [57] 42.25624 52.92307 50.61927 51.07971 51.89820 47.48838 48.33396 44.90712
##  [65] 44.64104 51.51764 52.24105 50.26502 54.61134 60.25042 47.54484 38.45416
##  [73] 55.02869 46.45400 46.55996 55.12786 48.57613 43.89641 50.90652 49.30554
##  [81] 50.02882 51.92640 48.14670 53.22188 48.89757 51.65891 55.48420 52.17591
##  [89] 48.37034 55.74404 54.96752 52.74198 51.19366 46.86047 56.80326 46.99870
##  [97] 60.93666 57.66305 48.82150 44.86790

6.- Calcular la probabilidad de que X se encuentre entre 35 y 55

pnorm(55,50,5) - pnorm(35,50,5)
## [1] 0.8399948

7.- se puede usar dnorm para construir el gráfico de la distribución de probabilidad de X , usando el comando curve.

curve(dnorm(x, mean=50, sd= sqrt(25)), xlim = c(35,65), xlab="Valores de x", ylab= "Densidad de X")

Descarga este código

xfun::embed_file("A6U2.Rmd")

Download A6U2.Rmd