DISTRIBUCIONES DE PROBABILIDAD
Tipos de variables
1.- Aleatoria: resultados que se presentan al azar en cualquier evento o experimento.
2.- Variable aleatoria discreta: Aqui se toman solamente ciertos valores principalmente
3.- Variable aleatoria continua: Este tipo de variables generalmente son resultado de una medicion y puede tomar cualquier valor dentro de un intervalo. Double
Distribucion normal
Es un distribucion muy utilizada y funciona generalmente para variables continuos.
Se usa para entender fenomenos naturales, sociales artificiales.
- Ejemplo1: Calcular la probabilidad de que \(X\) sea menor a 48, es decir
\[ P <48 \] ** Funciones en R
En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
Distribución Alias Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución Chi2 chisq Distribución F f
Distribución Exponencial
curve(dexp(x), from=0, to=10) #representa la densidad de una exponencial de media 1 entre 0 y 10Distribución binomial
x <- rbinom(20, 1, 0.5) #Genera 20 observaciones con distribución B(1,0.5)
x## [1] 0 0 1 0 1 1 1 1 0 0 0 1 0 1 1 1 0 0 0 0
Contando éxitos vs fracasos
table(x)## x
## 0 1
## 11 9
e.g. Distribución normal
si X es una variable aletoria, con distribución normal de media 3, y du desviación típica es de 0.5, la probabilidad de que X sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)## [1] 0.8413447
Para calcular el cuantil 0.7 de una v.a. normal estándar Z, es decir, un valor X tal que
qnorm(0.7)## [1] 0.5244005
El valor zα que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)## [1] 1.959964
Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
x <- rnorm(100, mean=10, sd=1 )
x## [1] 8.142381 9.284181 9.465300 7.773199 11.427281 9.829313 11.419538
## [8] 9.746824 9.767873 8.847573 9.612683 9.604035 9.658111 10.186240
## [15] 9.038372 10.105338 10.134123 8.742292 9.413463 8.946350 9.315679
## [22] 10.262691 9.585280 9.735871 10.739647 10.048868 10.276377 9.787770
## [29] 10.565316 9.991490 9.954865 10.396040 9.518627 8.804860 9.634501
## [36] 10.578207 10.067163 10.358421 7.684571 10.371724 9.187054 10.001902
## [43] 8.846087 10.905409 9.004536 11.886433 9.871513 10.029485 9.544039
## [50] 10.932542 10.442255 10.579161 10.359872 10.741929 10.190496 10.168624
## [57] 10.110031 10.259186 13.121327 10.444749 8.209634 8.928130 11.553796
## [64] 11.632859 11.418686 8.421701 10.391363 10.081698 7.895757 10.332344
## [71] 10.523556 11.313793 10.789083 10.751456 10.926974 9.544279 10.717493
## [78] 10.679087 10.767403 11.661852 9.964089 9.395243 10.392151 8.960985
## [85] 10.553496 11.165515 9.703454 10.008998 8.742251 11.401351 9.621677
## [92] 9.191875 9.788275 8.703691 9.118321 9.755626 9.957274 8.057935
## [99] 9.441317 9.118699
Para estimar el promedio de x
mean(x)## [1] 9.950322
Histograma de frecuencias
hist(x)Gráfico de cajas y bigote
boxplot(x)Histograma de la muestra
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)EJERICIOS
1.- Si z es una variable con distribucion normal estandar, calcula P(−2.34<z<4.78)
P = (pnorm(4.78, mean = 0, sd = 1) - pnorm( −2.34, mean = 0, sd = 1))
P ## [1] 0.9903573
2.- Calcula el rango intercuartílico de una poblacion normal
pob <- c(1,1,3,3,4,4,5,5,6,6,7,7,8,9,9,9)
summary(pob)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 3.750 5.500 5.438 7.250 9.000
3.- Genera una muestra de tamaño 19 de población normal estandar. ¿cuál es la diferencia entre la media mostral y la poblacional? repite el ejercicio 3 veces y anota las 3 diferencias
x <- rnorm(19, mean=3, sd=1) #Intento 1
x## [1] 3.2793671 4.1340310 4.4971993 7.1253586 2.0839995 3.6261297 3.4267835
## [8] 1.4208049 3.0251009 0.8480384 4.7678246 1.8311519 2.7350803 4.4170903
## [15] 2.1508371 3.8852665 3.2798593 1.8941482 3.1751640
4.- Genera 1000 números con distribución de Poisson de parámetro λ=1). Representa el gráfico de barras de los numeros obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
Poiss <- rpois(1000, 1)
Poiss## [1] 0 0 4 1 0 0 0 1 0 0 1 1 0 1 2 2 0 0 3 0 0 0 0 0 0 0 1 0 1 1 4 3 2 0 0 3 0
## [38] 1 3 3 0 0 2 0 2 0 1 1 1 2 0 2 0 2 0 1 1 1 1 0 1 2 3 2 0 1 1 0 1 1 1 0 1 3
## [75] 1 1 0 2 1 3 2 0 5 0 0 2 0 0 1 0 3 1 1 0 0 0 2 0 2 1 2 2 2 1 1 1 0 2 2 1 1
## [112] 2 0 1 1 2 0 2 1 2 2 0 0 1 0 0 1 0 2 1 1 4 0 0 2 0 0 1 0 0 1 0 2 0 0 3 1 1
## [149] 0 1 1 0 0 0 1 2 1 0 1 4 0 3 2 1 0 2 1 0 0 1 3 2 1 0 2 0 0 1 2 0 0 2 0 1 1
## [186] 1 1 0 2 0 2 0 2 2 0 2 2 0 0 1 2 1 1 1 1 0 3 1 4 2 0 1 3 2 3 1 2 1 2 2 1 0
## [223] 1 0 0 1 1 1 1 2 0 1 0 2 1 2 1 1 0 0 0 2 0 1 1 0 1 0 1 1 0 0 1 0 0 1 2 0 3
## [260] 1 0 1 1 0 1 1 0 1 0 3 0 0 2 1 1 0 1 0 2 1 1 2 1 2 0 2 1 0 2 0 0 1 0 2 0 0
## [297] 0 1 2 0 1 1 0 4 2 0 0 1 0 2 1 2 1 1 2 1 0 2 0 0 1 1 1 1 1 1 1 0 1 1 0 0 0
## [334] 1 1 1 1 0 0 3 2 4 0 0 1 1 0 1 1 0 1 1 1 1 1 0 1 1 0 0 0 0 0 3 1 2 1 0 1 1
## [371] 1 2 2 0 1 1 1 1 1 0 1 3 1 1 0 2 0 0 1 0 2 0 0 1 0 1 0 0 0 1 0 1 2 1 4 3 1
## [408] 1 1 1 5 0 0 1 0 2 1 1 2 1 0 0 0 1 1 2 0 0 0 1 1 1 2 4 1 2 0 1 0 0 1 0 2 1
## [445] 0 0 0 1 0 0 2 0 1 1 1 0 0 0 1 2 1 1 0 1 1 0 2 2 2 0 2 1 0 1 1 1 0 2 0 2 0
## [482] 0 2 3 0 0 0 0 1 0 2 0 0 2 1 2 0 3 1 2 0 0 2 1 1 2 3 0 3 1 2 0 2 0 0 0 2 1
## [519] 1 1 0 2 0 1 3 1 0 2 0 0 1 2 2 1 0 2 2 1 1 2 1 2 1 0 1 1 0 1 2 0 3 3 1 2 0
## [556] 1 0 0 4 0 2 0 1 0 2 0 0 3 1 0 1 0 0 2 2 0 0 1 1 3 1 0 1 0 0 0 1 1 1 0 2 1
## [593] 0 1 1 0 1 1 0 1 0 1 0 2 1 1 1 3 4 0 0 0 0 2 0 0 2 2 0 3 0 0 2 0 1 1 1 1 0
## [630] 1 3 2 1 1 0 2 0 1 3 1 1 2 0 2 0 1 1 0 3 3 1 2 0 1 0 0 2 2 1 0 0 0 1 1 0 2
## [667] 0 1 1 0 1 2 1 0 1 0 0 0 2 1 1 1 1 1 1 0 1 1 1 0 1 0 2 0 0 1 2 2 0 0 4 0 2
## [704] 2 1 1 2 0 0 2 0 2 1 0 0 0 1 1 2 0 1 1 2 1 2 1 1 0 1 0 1 0 0 0 0 2 0 1 0 0
## [741] 1 0 2 5 2 1 1 1 1 1 0 0 2 1 0 1 0 0 1 0 1 0 1 1 0 0 1 0 1 0 2 2 3 0 2 2 1
## [778] 2 0 0 2 1 2 1 3 0 1 0 0 1 1 0 1 2 1 1 1 2 1 2 2 1 2 0 1 2 0 1 4 3 1 0 1 0
## [815] 0 0 0 2 1 1 1 1 1 0 1 1 1 0 1 1 0 1 0 1 2 2 2 0 3 0 1 1 2 0 2 1 0 2 0 1 0
## [852] 1 1 2 1 2 2 0 1 2 0 2 2 2 2 1 1 0 0 1 1 0 0 2 1 1 3 3 3 2 2 0 1 0 2 1 1 0
## [889] 1 1 1 3 2 1 2 0 4 3 0 3 0 0 1 1 1 1 0 1 0 0 2 2 0 1 0 2 1 1 2 1 2 0 0 1 1
## [926] 3 2 0 1 1 0 0 1 4 3 0 0 1 0 2 3 3 0 0 2 1 0 3 1 0 2 2 2 0 0 0 0 1 0 1 1 0
## [963] 0 1 0 0 0 1 1 0 2 3 1 2 2 1 1 2 1 1 2 1 0 0 0 2 0 0 3 1 0 1 1 1 0 0 1 2 1
## [1000] 0
mean(Poiss) # media## [1] 0.987
var(Poiss) #varianza## [1] 0.9577888
Conclusion
Estos ejercicios ayudan a comprender los temas repasados en clases anteriores, de una forma mas sencilla y clara, englobando asi desde los graficos de un histograma hasta el calculo de varianza y media.