## Distribuciones de probabilidad
**Funciones en R
En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:
$$
\[\begin{array}{1|1|1|c} \text{Función} & \text{Significado}&\text{Uso}&\text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles(percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo uso grafico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios segun una distribucion especifica} & \text{---}\\ \hline \end{array}\]$$
Distribucion exponencial
curve(dexp(x),from = 0,to=10)
# Representa la densidad de una exponencial de media 1 entre 0 y 10
Distribucion binomail
x <- rbinom(20, 1, 0.5)
x
## [1] 0 1 0 0 0 1 1 0 1 1 1 0 0 0 0 1 0 0 1 1
# Genera 20 observaciones con distribucion B(1,0.5)
Contando exitos vs fracasos
table(x)
## x
## 0 1
## 11 9
e.g.. Distribucion normal
si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación tipica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se caclula en R de esta forma:
pnorm(3.5, mean=3,sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7,sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x<-rnorm(100, mean=10, sd=1)
x
## [1] 11.980440 9.949443 9.893419 9.733053 10.463124 8.088142 9.065287
## [8] 8.016311 12.707798 10.393857 9.573385 10.059452 10.045323 9.251283
## [15] 11.280994 8.262555 12.030061 12.063321 10.351177 9.426012 10.965050
## [22] 9.933578 9.757948 12.865995 9.521949 7.666056 8.861795 10.417578
## [29] 9.628890 8.120225 12.481472 10.606453 9.856112 10.438112 10.084840
## [36] 7.947241 8.970013 7.914994 10.598259 10.163656 9.410061 8.999936
## [43] 9.566625 10.845416 9.995941 9.775166 10.359928 10.622440 7.652465
## [50] 10.518433 8.827203 10.109982 9.365144 9.864252 11.226859 11.278175
## [57] 11.280800 10.712436 11.468498 9.516894 8.279857 9.993425 8.572275
## [64] 11.361428 8.627443 10.345041 11.523704 10.767264 9.316991 9.074038
## [71] 11.911811 8.156346 9.585364 9.463785 10.941335 10.712216 9.440607
## [78] 8.450237 10.426220 11.083127 10.263593 10.691983 11.191185 8.567249
## [85] 8.942027 9.380406 10.429978 11.730693 9.118528 9.397942 10.529326
## [92] 10.096377 9.437176 9.543832 10.003823 9.946526 9.757334 11.097277
## [99] 11.377414 8.281264
mean(x)
## [1] 9.986478
hist(x)
boxplot(x)
hist(x,freq=FALSE)
#fre=FALSE para que el area del histograma sea 1
curve(dnorm(x,mean=10,sd=1),from=7,to=13, add=TRUE)
Si \(z\) es una variable con distribucion normal estandar, calcula \(\mathbb{P}(-2.34)< z<4.78\)
p=(pnorm(4.78)-pnorm(-2.34))
p
## [1] 0.9903573
Calcula el rango intercuartílico de una población normal estándar.
poblacion<-c(3,4,5,5,5,6,7,4,3,3)
sum<-summary(poblacion)
sum
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.00 3.25 4.50 4.50 5.00 7.00
pQuantil<-sum[2]
tQuantil<-sum[5]
rango<- tQuantil-pQuantil
rango
## 3rd Qu.
## 1.75
Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
muestra<-rnorm(10,mean=2,sd=1)
muestra
## [1] 2.3110323 1.2035715 2.5931180 0.8292310 2.4271408 2.6416945 3.0574245
## [8] 0.7838050 1.2915332 0.8106054
Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
n<-rpois(1000,1)
n
## [1] 0 0 0 1 0 0 1 0 2 0 0 3 0 1 0 1 1 0 0 1 1 2 1 2 0 1 0 4 3 1 2 1 0 1 2 0 0
## [38] 1 1 1 3 2 0 2 1 0 0 0 1 1 1 2 2 0 0 1 1 0 0 0 1 0 0 0 0 0 2 1 0 1 2 2 0 2
## [75] 1 2 2 0 0 1 0 0 0 1 0 3 1 0 0 0 1 1 0 1 0 2 0 1 2 1 1 1 1 0 0 1 1 1 3 0 1
## [112] 0 1 2 0 1 0 0 1 0 1 2 0 4 0 0 0 1 1 1 1 0 3 1 0 1 0 1 0 3 0 0 4 0 4 2 2 0
## [149] 1 1 1 1 1 0 1 1 0 1 1 0 1 1 1 2 0 0 1 0 2 2 1 2 0 0 2 2 2 0 2 0 1 3 2 1 2
## [186] 1 0 2 1 0 2 0 2 3 1 1 2 2 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 4 3 0 0 3 0 0 0 1
## [223] 1 0 1 2 1 2 1 1 0 2 1 0 1 4 0 0 1 2 0 2 1 2 0 1 1 3 0 0 0 0 1 2 2 0 0 0 0
## [260] 0 2 0 2 0 0 1 1 3 0 4 1 1 1 1 0 0 2 1 1 0 0 0 0 4 1 2 0 1 0 0 1 1 2 0 1 2
## [297] 0 0 4 1 0 0 1 2 2 1 1 1 1 2 0 1 1 0 1 2 3 1 0 1 2 2 0 0 4 0 0 1 1 1 1 3 2
## [334] 2 0 1 0 1 2 1 0 1 0 3 2 0 0 1 1 1 0 1 1 2 3 1 0 1 0 0 0 1 0 0 2 2 1 0 1 1
## [371] 2 0 2 1 0 0 0 0 2 1 1 1 1 1 1 3 0 1 2 2 0 0 2 1 1 1 0 0 0 1 0 1 0 0 2 1 1
## [408] 0 1 0 0 1 2 1 1 1 1 1 1 2 0 1 0 0 1 1 2 1 2 3 1 2 3 1 0 1 0 0 1 1 0 0 1 0
## [445] 0 2 0 1 3 1 1 0 0 0 1 0 2 0 1 2 0 1 0 0 2 0 1 0 0 1 1 0 0 2 1 0 0 2 2 0 0
## [482] 1 3 1 3 1 2 1 2 2 1 3 2 2 1 2 0 0 1 0 1 1 1 2 0 1 1 3 0 2 2 0 1 1 2 0 2 3
## [519] 0 2 2 4 0 0 1 0 2 1 1 2 2 2 2 1 4 0 1 1 1 0 1 0 3 1 1 0 0 1 0 4 1 0 2 1 0
## [556] 1 0 2 1 0 0 1 1 1 1 1 2 2 0 0 1 0 2 3 1 1 1 0 1 0 0 2 0 0 0 1 1 1 3 2 1 2
## [593] 0 0 3 0 0 0 1 6 1 3 1 0 2 0 0 3 0 0 3 0 0 3 1 1 3 1 1 3 1 1 2 0 0 1 2 0 0
## [630] 0 0 1 1 0 1 0 0 1 0 0 1 2 1 2 2 3 0 0 1 2 2 0 3 1 3 1 1 0 2 0 1 1 3 1 2 1
## [667] 1 1 1 1 0 0 5 0 1 2 2 1 1 0 1 0 0 1 1 0 1 0 0 0 0 1 1 1 1 2 3 1 0 1 3 1 2
## [704] 1 0 1 1 1 0 3 2 0 2 0 1 2 0 2 2 1 0 1 2 0 1 1 0 1 1 0 0 1 1 0 2 2 0 3 1 0
## [741] 0 0 0 0 0 1 1 1 1 1 2 2 1 0 2 0 1 1 1 0 2 3 0 0 0 0 1 1 1 1 0 1 2 1 1 1 0
## [778] 2 3 0 0 1 0 1 0 0 0 0 0 0 0 2 1 3 0 0 0 1 1 1 1 0 0 0 3 1 0 0 0 2 1 3 0 2
## [815] 2 1 1 1 0 0 2 0 1 0 1 1 1 1 1 0 2 1 0 1 1 0 2 1 1 2 2 1 0 0 2 0 1 0 1 1 1
## [852] 1 1 4 2 1 0 1 0 0 1 0 1 1 1 2 0 0 1 1 0 2 1 1 2 3 1 1 0 0 2 2 2 0 3 0 0 0
## [889] 1 0 3 1 1 0 0 3 0 0 1 3 1 1 2 1 2 0 1 0 0 0 1 1 0 1 0 1 0 0 0 1 1 2 0 2 2
## [926] 0 1 0 1 4 1 1 2 0 2 1 1 2 3 1 1 0 0 0 2 1 0 1 2 2 1 2 2 1 1 0 1 1 0 1 0 0
## [963] 2 1 2 1 1 1 0 1 0 2 1 0 1 0 3 1 2 2 1 2 1 0 1 2 1 0 2 0 0 0 0 1 1 4 2 0 1
## [1000] 0
hist(n)
mean(n)
## [1] 0.968
varianza<-var(n)
varianza
## [1] 0.9599359