##Distribuciones de probabilidad En R, Cada distribucion de probabilidad se nombra mediante una clave o alias. Las palabras clave para las distribuciones mas importantes son:
Distribución Alias
Distribución binomial binom
Distribución de Poisson pois
Distribución normal norm
Distribución exponencial exp
Distribución t de Student t
Distribución Chi2 chisq
Distribución F f \[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]
Distribucion Exponencial
curve(dexp(x), from=0, to= 10)
#Representa la densidad de una exponencial de media 1 entre 10
Distribucion binomial
x <- rbinom(20, 1, 0.5)
x
## [1] 0 0 0 1 0 0 0 1 1 1 0 1 0 0 1 0 0 1 1 0
#Genera 20 observaciones con distribucion B(1,0.5)
Contando exitos vs fracasos
table(x)
## x
## 0 1
## 12 8
e. g. Distribucion normal
si \(x\) es una variable aleatoria, con distribucion normal de media 3, y su desviacion tipica es de 0.5 la probabilidad de que \(x\) sea menor a 3.5 se calcula en R de esta forma:
pnorm(3.5, mean= 3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1 )
x
## [1] 10.339988 10.207280 8.556455 10.046684 9.690791 8.969676 10.049371
## [8] 10.855982 10.338969 12.398420 9.358421 12.152673 10.010482 9.550899
## [15] 10.299630 9.190170 9.957967 9.268471 10.040120 9.043542 10.479135
## [22] 9.660775 10.288053 10.188030 10.970603 9.417821 8.917805 8.829475
## [29] 11.779369 10.730324 9.837088 10.008432 9.987296 9.824414 7.920319
## [36] 9.286015 10.445195 9.711884 10.035322 9.372595 9.641706 9.831288
## [43] 9.144810 8.122030 8.558244 11.313972 9.258669 10.159259 9.064761
## [50] 8.833310 11.273868 10.506224 9.038677 10.031667 9.989958 12.179987
## [57] 9.820574 9.723173 8.944901 8.955921 9.021111 10.820507 10.113037
## [64] 11.519252 11.404902 11.601464 10.262380 9.837054 9.041650 10.362382
## [71] 8.511881 10.303770 10.063602 8.955441 10.064932 11.338266 7.416422
## [78] 9.438459 9.332788 8.999596 9.847431 11.292260 9.302239 9.138710
## [85] 11.005923 9.600109 8.984588 10.433656 11.726213 9.190756 8.203506
## [92] 9.458969 9.035282 11.005642 8.637850 10.309848 9.828059 12.200231
## [99] 9.314363 11.345704
mean(x)
## [1] 9.906792
hist(x)
* Grafico de cajas y bigote
boxplot(x)
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)
Ejercicios
1- Si Z es una variable con distribución normal estándar, calcula P(−2.34<Z<4.78).
2- Calcula el rango intercuartílico de una población normal estándar.
3- Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
4- Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?