Distribución

Silvia Flores

11/Jul/2020


Distribuciones de probabilidad

Distribución normal

Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

  • Distribución Alías
  • Distribución binomial binom
  • Distribución de Poisson pois
  • Distribución normal norm
  • Distribución exponencial exp
  • Distribución t de Student t
  • Distribución Chi2 chisq
  • Distribución F f

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

Distribución exponencial

curve (dexp(x), from = 0, to=10)

#representa la densidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 1 1 0 0 1 0 1 0 0 1 1 1 0 0 1 1 1 0
#esto genera 20 observaciones con distribución B(1,0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
##  9 11

Distribución normal

si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean = 3, sd=0.5)
## [1] 0.8413447
  • Para calcular el cuantil 0.7 de una v.a. normal estándar z, es decir, un valor x tal que
qnorm(0.7)
## [1] 0.5244005
  • Para calcular el cuantil, pero de de una v.a. normal de media 0 y DT 0.5,
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
  • Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
x <- rnorm(100, mean = 10, sd=1)
x
##   [1]  9.285037 10.370253 10.197190 10.027985  9.839673 10.329842 11.445792
##   [8]  9.864342  8.986780  9.877978  9.823593  9.097184  9.522410 11.027899
##  [15] 11.117005 10.266812 11.176067 11.455180  8.591828  9.526920  8.946910
##  [22]  9.787441 10.858815 10.414987 11.847975 10.485283 10.185931  8.422795
##  [29]  9.833002 10.377633 11.737080 11.379895 10.558667 11.201947  9.914026
##  [36] 10.041019  9.766246 10.267420  8.990253 10.488151 10.827986 11.623721
##  [43]  8.252659  8.039332 10.169164 10.492851  9.868129  9.176088  9.319290
##  [50] 11.882229 10.437029 11.850526  8.108992 11.285044  9.556905  9.625583
##  [57]  7.924428 10.020788 10.493322  9.283460 10.604666 10.019108 10.507467
##  [64]  9.158531  9.426614 10.174807 10.220729 10.271242 10.082742 10.014609
##  [71]  7.572534 10.517167 12.278706  8.365918 11.138725 11.415740  9.746994
##  [78] 10.537738 10.514153 10.898233 10.490652 11.329247  9.711559  8.997449
##  [85]  8.762114  8.648855  9.254113 11.358503 12.067873  9.618225  9.500655
##  [92]  9.293390  9.415777  9.960943 11.216487  8.618556  8.380071  9.615143
##  [99] 10.327538  9.185690
  • Para estimar promedio de x
mean(x)
## [1] 10.04792
  • Historama de frecuencias
hist(x)

  • Gráfico de cajas y bigote
boxplot(x)

  • Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población:
hist(x, freq = FALSE) #freq=FALSE, para que el área del histograma se 1
curve(dnorm(x,mean = 10, sd=1), from = 7, to=13, add = TRUE)

Ejercicios

  1. Si \(z\) es una variable con distribución normal estándar, calcula \(\mathbb{P}(-2.34 < z < 4.78)\).
  2. Calcula el rango intercuartílico de una población normal estándar.
  3. Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
  4. Genera 1000 números con distribución de Poisson de parámetro \(\lambda =1\). Representa el gráfico de barras de los números obtenidoS. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
  5. Calcula con R los siguientes valores: \(t_{3,\alpha}\), \(\chi^2_{3,\alpha}\), para \(\alpha = 0.05\) y \(\alpha = 0.01\). Compara los valores obtenidos con los que aparecen en las correspondientes tablas.

Conclusión personal

En este ejercicio aprendí muchos conceptos nuevos, ya que a pesar de llevar la materia de probabilidad y estadística en preparatoria no conocia o recordaba muchos de los conceptos vistos, además vi nuevos comandos y como funcionaban, así mismo al estar haciendo el ejercicio fui repasando ejercicios que ya hicimos en clase