La probabilidad es el lenguaje matematico para cuantificar la insertidumbre - Wasserman
Conceptos fundamentales de probabilidad
1.- Terminologia de probabilidad: espacio de resultados, eventos, funciones de probabilidad
2.- Interpretación frecuencista de la probabilidad
3.- Probabilidad condicional y su relación con la independencia
4.- La regla de Bayes
El espacio de resultados \(\Omega\) es el conjunto de posibles resultados de un experimento aleatorio.
Un ejemplo seria: Si lanzamos una moneda 2 veces, entonces
\[ \Omega=\{AA,SS,AS,SA\} \] Un Evento es un subconjunto del espacio muestral, los eventos usualmente se denotan con mayusculas.
Ejemplo: Que el primer lanzamiento resulte Aguila.
\[ A=\{AA, AS\} \]
La probabilidad se puede ver como una proporcion de una parte con respecto a un todo
Ejemplo: Si en la carrera de ingenieria quimica hay 1000 estudiantes, y de estos 300 son hombre y 700 son mujeres
Si se elije un estudiante al azar de ingenieria quimica. Cual es la probabilidad de que sea hombre?
\[ \frac{300}{700+300}=0.3 \] Como el resultado es 0.3, entonces la probabilidad es de 30%
Eventos equiprobables Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados:
\[ P(A)=\frac{\#(A)}{\#(\Omega)} \] Por lo que solo hace falta contar.
Ejemplo: Combinaciones
Un comité de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿cuál es la probabilidad de que el comité esté conformado por 3 hombres y dos mujeres?
Hay \(\dbinom{15}{5}\) posibles comités, cada uno tiene la misma posibilidad de ser seleccionado.
Por otra parte hay \(\dbinom{6} {3} \dbinom {9}{2}\) posibles comités que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es: \[ \frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{5}} \]
y la funcion para calcular las combinaciones es choose(n,r)
choose(6,3) * choose(9,2) / choose(15,5)
## [1] 0.2397602
La probabilidades se entienden como una aproximacion matematica de frecuencias relativas cuando la frecuencia total tiende a cero.
Supongamos que lanzamos una moneda 10 veces y obtenemos lo siguiente:
lanzamientos_10<- sample(c("A","S"), 10, replace=TRUE)
lanzamientos_10
## [1] "S" "A" "S" "A" "S" "A" "A" "S" "S" "S"
cumsum(lanzamientos_10=="A")
## [1] 0 1 1 2 2 3 4 4 4 4
round(cumsum(lanzamientos_10=="A")/1:10,2)
## [1] 0.00 0.50 0.33 0.50 0.40 0.50 0.57 0.50 0.44 0.40
Funciones en R
En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
\[ \begin{array}{1|1|1|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cfd)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios ségun una distribución específica} & \text{---}\\ \hline \end{array} \]
Distribución Exponencial
curve(dexp(x), from=0, to=10)
#representa la densidad de una exponencial de media 1 entre 0 y 10
Distribución binomial
x <- rbinom(20, 1, 0.5)
x
## [1] 0 0 0 1 1 1 1 0 1 1 0 0 1 0 1 1 1 1 0 0
#Genera 20 observaciones con distribución B(1,0.5)
Contando éxitos vs fracasos
table(x)
## x
## 0 1
## 9 11
e.g. Distribución normal
si \(X\) es una variable aletoria, con distribución normal de media 3, y du desviación típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1 )
x
## [1] 8.781932 9.143646 9.075209 10.681014 11.387598 9.298976 9.791683
## [8] 10.709602 9.023076 8.776739 10.176161 9.352344 11.412426 8.375811
## [15] 10.181686 9.908900 8.735359 10.196752 10.437241 10.521671 10.838189
## [22] 9.195027 9.782331 11.090447 9.409210 11.093590 9.881362 11.036950
## [29] 10.510394 8.955259 9.494953 9.164238 9.747334 10.292605 9.994417
## [36] 9.485894 8.755129 11.035043 10.097958 8.024144 10.819047 11.876281
## [43] 10.544046 10.368108 10.024510 11.331066 10.297833 9.145523 10.342809
## [50] 11.838125 9.420191 10.029039 8.949266 11.167417 9.793479 9.992643
## [57] 11.698366 7.623426 10.431611 9.546582 9.258139 9.949450 7.881376
## [64] 10.307587 10.111997 9.159342 8.260565 9.501222 8.999443 9.179222
## [71] 9.545178 10.847031 11.885623 9.186140 8.162840 10.787795 9.063298
## [78] 10.097908 9.822152 9.648012 10.978226 10.548521 9.353397 9.161939
## [85] 9.076317 8.863623 9.797078 11.585391 12.535180 9.546212 9.040854
## [92] 9.711724 10.101557 8.960652 12.471382 9.447757 9.094658 9.496517
## [99] 9.435396 8.919323
mean(x)
## [1] 9.888717
hist(x)
boxplot(x)
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)
Ejercicios
1.- Si Z es una variable con distribución normal estándar, calcula P(−2.34<Z<4.78).
pnorm(4.78, mean = 0, sd = 1) - pnorm(-2.34, mean = 0, sd = 1)
## [1] 0.9903573
2.- Calcula el rango intercuartílico de una población normal estándar.
pob <- c(1,1,2,2,5,5,7,7,8,8,9,9)
s <- summary(pob)
s
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 2.000 6.000 5.333 8.000 9.000
rango <- as.numeric(substr(s[5],1,7)) - as.numeric(substr(s[2],1,7))
rango
## [1] 6
3.- Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
4.- Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
p <- rpois(n = 1000, lambda = 1)
p
## [1] 3 1 0 1 1 0 0 0 1 1 1 1 0 0 3 0 1 2 1 2 1 0 1 1 1 1 0 1 3 0 1 4 1 2 1 0 0
## [38] 1 0 0 2 0 2 0 0 1 1 1 1 1 2 1 1 1 0 0 1 2 1 1 0 0 0 1 0 1 0 0 2 0 2 0 1 2
## [75] 2 1 0 0 1 2 1 0 1 1 1 2 0 0 2 0 0 2 1 2 0 0 0 4 0 1 0 3 2 2 3 1 1 2 2 1 0
## [112] 0 0 2 3 2 1 1 1 3 4 0 3 1 0 2 2 0 1 0 3 0 1 1 2 1 1 1 0 3 2 1 0 0 0 0 0 0
## [149] 1 2 1 0 1 1 2 0 2 2 0 2 2 1 0 0 3 1 1 2 0 2 3 2 2 2 0 0 1 2 1 2 1 1 0 0 1
## [186] 0 0 0 1 0 0 1 0 1 0 4 1 3 0 1 2 0 4 4 2 1 0 0 2 2 1 2 0 0 2 2 0 1 3 1 2 3
## [223] 2 1 0 2 2 0 1 0 3 0 1 2 2 0 1 0 0 1 0 0 0 1 0 2 0 1 1 3 0 0 1 1 0 1 1 1 0
## [260] 0 4 1 2 1 0 0 1 1 1 2 2 2 2 2 0 0 0 1 1 2 3 2 1 1 0 1 1 2 1 1 0 0 2 2 0 1
## [297] 0 0 3 1 0 1 0 0 3 0 1 0 0 0 0 2 0 1 2 0 1 3 2 1 1 0 0 0 0 0 0 0 0 0 0 1 1
## [334] 1 0 1 3 1 0 0 0 1 0 0 2 3 0 0 1 0 0 3 1 0 2 2 4 1 0 0 1 5 1 1 3 1 2 1 4 2
## [371] 0 0 0 0 1 1 1 0 0 2 3 0 1 2 1 0 0 1 2 1 2 2 0 0 2 0 3 1 2 2 0 1 1 1 0 3 0
## [408] 0 1 0 1 2 0 0 0 1 1 2 1 1 0 0 2 0 0 0 0 1 3 0 2 1 2 1 0 2 1 1 1 1 2 0 1 1
## [445] 2 0 1 0 1 0 2 1 0 1 0 2 2 2 0 1 1 1 1 1 1 0 2 1 1 0 1 1 2 0 2 0 1 0 2 1 0
## [482] 1 0 2 1 0 0 0 3 2 2 0 1 0 3 0 0 0 0 0 0 2 1 2 2 1 2 1 0 1 1 2 0 2 3 0 0 1
## [519] 0 2 0 0 0 1 2 1 1 1 0 1 0 1 1 2 0 2 1 3 0 1 1 1 1 2 0 0 2 1 0 1 1 0 0 2 4
## [556] 1 2 0 0 2 1 2 0 2 1 1 0 1 2 0 1 0 1 0 1 0 1 2 0 1 0 0 0 1 1 0 1 1 1 0 1 3
## [593] 1 0 1 1 1 1 0 0 0 0 0 0 2 1 1 0 3 0 0 0 0 4 2 0 0 0 0 0 2 0 1 1 0 0 3 1 0
## [630] 0 1 1 1 0 1 1 2 2 2 0 1 2 0 1 1 0 0 1 0 0 1 0 2 1 1 0 0 0 2 0 0 0 2 3 1 1
## [667] 1 2 1 2 0 2 1 1 0 0 1 2 1 1 0 0 0 1 3 0 0 2 2 1 0 3 0 0 1 0 1 4 2 0 1 2 0
## [704] 1 0 1 2 2 4 1 0 0 0 0 1 0 1 1 0 0 1 0 2 1 0 0 1 2 0 1 1 0 0 0 0 1 2 2 0 3
## [741] 0 1 1 1 1 0 2 1 1 3 1 0 2 1 0 1 1 1 1 2 1 1 2 4 1 1 1 1 2 3 2 1 0 0 1 2 0
## [778] 3 1 1 0 0 1 3 2 2 2 0 1 0 2 2 1 0 0 0 1 1 0 2 1 1 0 2 0 0 1 4 1 0 0 0 0 0
## [815] 2 2 4 0 1 1 1 1 1 1 2 2 1 0 0 2 0 1 0 0 2 1 1 3 2 0 2 0 1 2 1 1 1 0 2 1 3
## [852] 1 0 1 0 1 0 1 1 1 2 0 1 1 0 0 1 2 1 0 1 0 2 1 1 1 0 1 0 1 0 2 1 0 0 0 0 0
## [889] 2 1 2 4 0 1 2 1 0 1 3 1 1 1 1 0 0 0 1 0 1 2 1 3 1 2 1 0 2 1 1 1 1 1 3 0 0
## [926] 0 2 1 0 0 0 0 0 2 2 1 0 0 0 1 1 0 2 1 1 1 2 0 0 2 1 0 1 1 3 0 2 1 0 2 0 2
## [963] 0 0 0 0 1 1 1 1 0 0 0 1 1 3 1 1 0 1 1 1 5 1 1 0 1 1 3 0 0 1 1 6 1 0 1 1 5
## [1000] 1
mean(p)
## [1] 0.982
var(p)
## [1] 0.9946707
Los datos si se pareces a los valores teoricos.