Introducción a la probabilidad

Probabilidad es el lenguaje matematico para cuantificar la incertidumbre. Wasserman

  1. Terminologia de probabilidad: espacio de resultados, eventos, funciones de probabilidad, etc.
  2. Interpretación frecuentista de la probabilidad.
  3. Probabilidad condicional y su relación con la independencia.

Espacio de resultados y eventos

El espacio de resultados \(\Omega\) es el conjunto de reslutados de un experimento aleatorio.

e.g. Si lanzamos una moneda dos veces entonces:

\[ \Omega = \{AA, AS, SA, SS \} \] Un evento es un subconjunto del espacio muestral, los eventos usualmente se denotan por mayúsculas.

e.g. Que el primer lanzamiento resulte águila.

\[ A = \{AA, AS\} \] ## Eventos Equiprobables

La probabilidad se puede ver como una extensión de la idea de proporción, o cociente de una parte con respecto a un todo.

e.g. En la carrera de Ing. quimica hay 300 hombres y 700 mujeres, la proporción de hombres es:

\[ \frac{300}{700+300}=0.3 \]

Eventos equiprobables Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados:

\[ P(A) = \frac{\#(A)}{\#(\Omega)} \]

Por lo que hace falta contar

e.g. Combinaciones

Un comite de 5 personas sera seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria. ¿Cuál es la probabilidad de que el comité este conformado por 3 hombres y 2 mujeres?

Hay \(\dbinom{15}{5}\) posibles comités, cada uno tiene la misma posibilidad de ser seleccionado.

Por otra parte hay \(\dbinom{6}{3} \dbinom{9}{2}\) posibles comités que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es:

\[ \frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{5}} \] y la función para calcular las combinaciones es choose(n, r)

{r} choose (6, 3) * choose(9, 2) / choose (15, 5)

Interpretación frecuentista de probabilidad

Una frecuencia relativa es una proporción que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones.

{r} Lanzamientos_10 <- sample(c(“A”, “S”),10, replace = TRUE) Lanzamientos_10

Podemos calcular las secuencia de frecuencias relativas de águila:

{r} cumsum(Lanzamientos_10 == “A”) # suma acumulada de águilas

Dividiendo {r} round(cumsum(Lanzamientos_10 == “A”) / 1:10, 2 )

##Distribuciones de probabilidad

**Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

Distribución Alias Distribución normal norm Distribución binomial binom Distribución exponencial exp Distribución t de student t Distribución chi cuadrada chisq *Distribución F F

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

Distribución Exponencial

curve(dexp(x), from=0, to=10)

#representa la densidad de una exponencial de media 1 entre 0 y 10 Distribución binomial x <- rbinom(20, 1, 0.5) x

#Genera 20 observaciones con distribución B(1,0.5)

Contando éxitos vs fracasos

table(x)

e.g. Distribución normal

si X es una variable aletoria, con distribución normal de media 3, y du desviación típica es de 0.5, la probabilidad de que X sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)

qnorm(0.7)

qnorm(0.7, sd=0.5)

El valor zα que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)

Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x): x <- rnorm(100, mean=10, sd=1 ) x

Gráfico de cajas y bigote boxplot(x)

Ejercicios

Si Z es una variable con distribución normal estándar, calcula P(−2.34<Z<4.78).

Calcula el rango intercuartílico de una población normal estándar.

Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.

Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?