La probabilidad es el lenguaje matematico para cuantificar la incertidumbre - Wasswerman
Conceptos fundamentales en probabilidad
1.- Terminologia de probabilidad: espacios de resultados, eventos, funciones de probabilidad
2.- Interpretacion frecuentista de la probabilidad
3.- Probabilidad condicional y su relacion con independecnia
4.- Las reglas de Bayes
El espacio de resultados \(\Omega\) es el conjunto de posibles resultados de un experimento aleatorio.
Ejemplo: Si lanzamos una moneda 2 veces, entonces…
\[ \Omega = \{AA, SS, AS, SA\} \] Un Evento es un subconjunto del espacio muestral, los eventos usualmente se denotan por mayusculas.
Ejemplo: Que el primer lanzamiento resulte aguila.
\[ A = \{AA, AS\} \]
La probabilidad se puede como una proporcion de una parte con respecto a un todo.
Si en ingenieria quimica tenemos 1000 estudiantes, de los cuales…
Si elejimos un estudiante al azar de ingenieria quimica Cual es la probabilidad de que sea hombre?
\[ P = \frac {300}{700+300} = 0.3 \] Eventos equiprobables: Si todos los elemetntos del espacio de resulatado tiene la misma oportunidad de ser elegidos entonces la probabilidad de evento es el numero de resultado dividido entre entre el numero total de posibles resultados:
La probabilidad entonces es de 0.3
Esto se concibe de la siguiente forma:
\[ Probabilidad = Eventos favorables / Eventos posibles \] Ejemplo: Combinaciones
Un comite de 5 personas sera seleccionado de un grupo de 6 hombres y 9 mujeres. Si ñla seleccion es aleatoria, ¿ Cual es la probabilidad de que el comite este conformado por 3 hombres y 5 mujeres?
Hay \(\dbinom{15}{5}\) posibles comites, cada uno tiene la misma posibilidad de ser seleccionado.
Por otra parte hay \(\dbinom{6}{3} \dbinom{9}{2}\) posibles que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que bsucamos es:
\[ \frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{5}} \] Y la funcion para calcular la combinaciones es choose (n, r)
choose (6, 3) * choose (9, 2) / choose (15, 5)
## [1] 0.2397602
Una frecuencia relativa es una proporcion que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesion de observaciones.
La probabilidad se etiende como una aproximacion matematica de frecuencias relativas cuando la frecuencia total tiende a cero.
Supongamos que lanzamos una mondea 10 veces y obtenemos lo siguiente:
set.seed(123)
lanzamientos_10 <- sample(c("A","S"), 10,replace = TRUE)
lanzamientos_10
## [1] "A" "A" "A" "S" "A" "S" "S" "S" "A" "A"
cumsum(lanzamientos_10 == "A") #Suma acumulada de Aguila
## [1] 1 2 3 3 4 4 4 4 5 6
round(cumsum(lanzamientos_10 == "A") / 1:10,2 )
## [1] 1.00 1.00 1.00 0.75 0.80 0.67 0.57 0.50 0.56 0.60
**Funciones en R
En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
Distribución - Alias Distribución binomial - binom Distribución de Poisson - pois Distribución normal - norm Distribución exponencial - exp Distribución t de Student - t Distribución Chi2 - chisq Distribución F - f
Distribuicion Exponencial
curve(dexp(x), from=0, to=10)
# representa la densidad de una exponencial de media 1 entre 0 y 10
Distribuicion Exponencial
x <- rbinom(20, 1, 0.5)
x
## [1] 1 0 1 1 0 1 0 0 0 1 1 1 1 1 1 1 1 1 0 0
# Genera 20 observaciones con distribucion B(1,0.5)
Contando éxitos vs fracasos
table(x)
## x
## 0 1
## 7 13
Ejemplo. Distribución normal
si \(X\) es una variable aletoria, con distribución normal de media 3, y du desviación típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd = 0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1 )
x
## [1] 11.786913 10.497850 8.033383 10.701356 9.527209 8.932176 9.782025
## [8] 8.973996 9.271109 9.374961 8.313307 10.837787 10.153373 8.861863
## [15] 11.253815 10.426464 9.704929 10.895126 10.878133 10.821581 10.688640
## [22] 10.553918 9.938088 9.694037 9.619529 9.305293 9.792083 8.734604
## [29] 12.168956 11.207962 8.876891 9.597115 9.533345 10.779965 9.916631
## [36] 10.253319 9.971453 9.957130 11.368602 9.774229 11.516471 8.451247
## [43] 10.584614 10.123854 10.215942 10.379639 9.497677 9.666793 8.981425
## [50] 8.928209 10.303529 10.448210 10.053004 10.922267 12.050085 9.508969
## [57] 7.690831 11.005739 9.290799 9.311991 11.025571 9.715227 8.779282
## [64] 10.181303 9.861109 10.005764 10.385280 9.629340 10.644377 9.779513
## [71] 10.331782 11.096839 10.435181 9.674068 11.148808 10.993504 10.548397
## [78] 10.238732 9.372094 11.360652 9.399740 12.187333 11.532611 9.764300
## [85] 8.973579 9.289593 10.256884 9.753308 9.652457 9.048381 9.954972
## [92] 9.215096 8.332058 9.619773 10.918997 9.424653 10.607964 8.382117
## [99] 9.944438 10.519407
mean(x)
## [1] 10.01675
hist(x)
boxplot(x)
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)