Introducción a la probabilidad
La probabilidad es el lenguaje matemático para cuantificar la incertidumbre. -Wasserman
- Terminología de probabilidad: espacio de resultados, eventos, funciones de probabilidad, etc.
- Interpretación frecuentista de la probabilidad.
- La probabilidad condicional y su relación con la independencia.
- La regla de Bayes
Espacio de resultados y eventos
El espacio de resultados Ω es el conjunto de resultados de un experimento aleatorio.
e.g. Si lanzamos una moneda dos veces, entonces: \[ Ω={[AA,AS,SA,SS]} \]
Un Evento es un subconjunto del espacio muestral, los eventos usualmente se denotan por mayúsculas.
e.g. Que el primer lanzamiento resulte águila. \[ A=[AA,AS] \]
Eventos equiprobables
La probabilidad se puede ver como una extensión de la idea de proporción, o cociente de una parte con respecto a un todo.
e.g. En la carrera de Ing. Química hay 300 Hombres y 700 Mujeres, la proporción de hombres es:
\[ \frac{300} {700 − 300} = 0.3 \]
Eventos equiprobables. Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos, entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados.
\[ P(A)=\frac{\#(A)}{\#(\Omega)} \]
P(A)= Es el número de resultados que se divide entre el número total de posibles resultados. Es una proporción funcional de lo que se busca saber.
Por lo que solo hace falta contar.
e.g. Combinaciones: son agrupaciones en las que el contenido importa pero el orden no.
Un comité de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿cuál es la probabilidad de que el comité este conformado por 3 hombres y 2 mujeres? hay 15 personas, de las cuales necesitaremos 5. \(\dbinom{15}{5}\) posibles comités de los cuales cada uno tiene la misma probabilidad de ser seleccionado.
Por otra parte hay \(\dbinom{6}{3} \dbinom{9}{2}\) posibles comites que incluyen 3 hombres y 2 mujeres, por lo tanto la probabilidad que busamos es:
\[\frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{5}}\]
A es 3 de 6 hombres y 2 de 9 mujeres entre la cantidad de los comites posibles para concoar la probabildad de que tengamos comites de 5 formados por 3 hombres y 2 mujeres.
y la función para calcular la combicación es choose (n, r) El total de cosas y la manera en la que se van a tomar.
choose(6,3) * choose (9,2) / choose(15,5)## [1] 0.2397602
Aquí estamos hablando de proporciones porque todavía no estamos haciendo experimentos.
##Interpretación frecuentista de la probabilidad
Una frecuencia relativa es una proporción que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones.
Lanzamiento_10 <- sample(c("A","S"), 10, replace = TRUE)
Lanzamiento_10 ## [1] "S" "A" "A" "A" "A" "A" "S" "S" "A" "S"
Podemos calcular las secuencias de frecuencias rtelativas de águila:
cumsum(Lanzamiento_10 == "A") #suma acumuladas de águilas## [1] 0 1 2 3 4 5 5 5 6 6
Dividiendo
round(cumsum(Lanzamiento_10 == "A") /1:10, 2)## [1] 0.00 0.50 0.67 0.75 0.80 0.83 0.71 0.62 0.67 0.60
Distribuciones de probabilidad
**Funciones en R
En R, cada distribución de probabilidad se nombre mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
*Distribución Alias
*Distribución binomial binom
*Distribución de Poisson pois
*Distribución normal norm
*Distribución exponencial exp
*Distribución t de student t
*Distribución Chi2 chisq
*Distribución F f \[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Obervación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{--}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{--}\\ d & \text{destiny} & \text{Calcula probabilidades puntuales} & \text{sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{--}\\ \hline \end{array} \]
Distribución exponencial
curve(dexp(x), from=0, to=10 ) #probabilidad puntual exponencial#Representa la densidad de una exponencial de media 1 entre 0 y 10Distribución binomial
Es el conteo de éxitos vs fracasos, donde el 1 representa el éxito y el 0 fracaso.
x <- rbinom (20, 1, 0.5)
x## [1] 0 1 1 1 1 1 0 1 0 0 1 0 0 0 0 1 0 1 1 0
#Genera 20 observaciones con distribución B(1,0.5)Contando éxitos vs fracasos
table(x)## x
## 0 1
## 10 10
e.g Distribución normal
Si \(X\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)## [1] 0.8413447
- Para calcular el cuantil 0.7 de una variable aleatoria normal stándar Z, es decir, un valor X tal que
qnorm(0.7)## [1] 0.5244005
- Para calcular el mismo cuantil, pero para una variable aleatoria de media 0 y DT 0.5
qnorm(0.7, sd=0.5)## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)## [1] 1.959964
- Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
x <- rnorm(100, mean=10, sd=1)- Para estimar promedio de x
mean(x)## [1] 9.981956
- Histograma de frecuencias
hist(x)-Gráfico de cajas y bigote
boxplot(x)-Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de población.
hist(x, freq=FALSE) #frec=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)