Distribuciones de probabilidad
Funcione en R
En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
- Distribución Alias
- Distribución binomial binom
- Distribución de Poisson pois
- Distribución normal norm
- Distribución exponencial exp
- Distribución t de Student t
- Distribución chi2 chisq
- Distribución F f
\[ \begin{array}{l|l|l|c} \text{Funcion} & \text{Sifnificado} \text/{Uso} \text{Observacion}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios segun una distribucion especifica} & \text{---}\\ \hline \end{array} \]
Distribución Exponencial
Distribución binomial
## [1] 0 1 1 0 1 1 0 0 0 0 1 1 0 1 0 0 1 1 0 1
e.g. Distribución normal
si \(X\) es una variable aletoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:
## [1] 0.8413447
- Para calcular el cuantil 0.7 de una v.a. normal estándar Z, es decir, un valor X tal que
## [1] 0.5244005
- Para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT 0.5
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
## [1] 1.959964
- Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
## [1] 9.301677 9.465890 12.199664 10.021568 9.082681 8.358171 11.142374
## [8] 10.191342 9.634733 10.552411 10.427978 11.660110 9.982916 10.834430
## [15] 9.778259 10.287720 11.364168 11.204036 8.915333 9.537177 11.123489
## [22] 9.627420 9.636263 11.433964 9.482156 11.143520 11.053536 9.546699
## [29] 9.381738 8.376229 10.575851 9.314840 10.575744 9.523544 8.320482
## [36] 11.660608 10.642949 10.106446 11.030194 8.393533 8.968951 11.303510
## [43] 10.070717 10.590935 9.283766 10.797192 9.861537 8.830964 9.917048
## [50] 9.030291 7.812698 9.719318 8.999915 8.995679 8.057968 12.744087
## [57] 9.503438 9.406959 8.948747 9.162251 9.926527 8.649372 8.987136
## [64] 8.948845 9.420191 10.450434 9.394720 9.134605 9.655753 9.245172
## [71] 11.021580 10.407611 9.860631 10.485663 9.221311 10.419565 9.467450
## [78] 9.587952 11.308433 11.050725 9.153234 11.589113 9.616885 10.458568
## [85] 11.418822 10.438865 9.876354 8.383197 10.901852 11.108166 9.704529
## [92] 9.914716 9.273646 8.614826 10.018059 8.706617 10.147247 10.738499
## [99] 11.761986 10.136180
- Para estimar el promedio de x
## [1] 9.955029
- Histograma de frecuencias
- Gráfico de cajas y bigote
- Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población:
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)Ejercicios
Si \(Z\) es una variable con distribución normal estándar, calcula \(\mathbb{P}(−2.34<Z<4.78)\).
Calcula el rango intercuartílico de una población normal estándar.
Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
Calcula con R los siguentes calores: \(t_{,3,\alpha}\), \(chi^2_{3,\alpha}\), para α=0.05, y α=0.01. Compara los valores obtenidos con los que aparecen en las correspondientes tablas.