Distribuciones

Distribuciones de probabilidad

Funciones en R En R, cada distribución de probabilidad se nombre mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

$$

Distribución exponencial

curve(dexp(x), from = 0, to = 10)

#Representa la densidad de probabilidades puntuales de media 1 entre 0 y 10

Distribución binomial

x <- rbinom(20,1,0.5)  # r: random
x
##  [1] 0 0 1 0 0 1 1 0 0 1 1 0 1 0 1 1 1 1 1 0
#Genera 20 observaciones con distribución B(1,0.5)
  • Conteo de éxitos (1) vs fracasos (0)
table(x)
## x
##  0  1 
##  9 11

Distribución normal

Distribución normal

  • e.g. Si \(X\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica (o estándar) es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5) #standar deviation
## [1] 0.8413447
  • Para calcular el cuantil 0.7 de una variable aleatoria (v.a.) normal estándar Z, es decir, un valor x tal que
qnorm(0.7)
## [1] 0.5244005
  • Para calcular el mismo cuantil pero para variable aleatoria (v.a.) normal de media 0 y una desviación típica (DT) 0.5
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y constrastes se obtiene con el qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
  • Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
x <- rnorm(100, mean=10, sd=1)
x
##   [1]  7.774523 10.345653 10.285088 10.676919  9.753718 10.430645 11.447587
##   [8]  9.190375 11.655465  9.365949  9.836875 11.359517  7.353736  9.518673
##  [15] 10.463969  9.012213 10.099668  9.771760  9.936135  9.054542  9.004470
##  [22]  8.445006 10.121102 12.165137 10.235706 11.032976  8.940563 10.001571
##  [29] 11.022096  9.385261 11.041859  8.806155 10.822912 11.006722 10.738632
##  [36]  9.098401  8.909075  9.304924 11.477128  9.814038 10.315663  9.622975
##  [43] 10.105108 10.175020 11.919958 12.136527 10.220120 10.399943 11.500948
##  [50] 10.906375 11.132049  9.433431  8.723179 11.705170  8.604773  9.693811
##  [57]  9.838484 11.102793 10.058288  8.913106 11.019035 11.779911  8.980391
##  [64] 10.895038  9.428044 10.071446 10.350675  8.301708 10.130893 10.527377
##  [71]  8.959037  9.074844  9.696815 10.524269 10.462949  9.478495  9.589069
##  [78]  9.864418  8.224626 11.049004 11.134847 10.236525 10.752250  9.549703
##  [85]  9.091586  9.135917 10.422445  9.464857  9.929902  9.886584 10.234719
##  [92]  8.441356  9.997792 11.217246  9.670491 10.521321 11.197088 10.822257
##  [99]  9.017885  8.902283
  • Para estimar el promedio de x
mean(x)
## [1] 10.0325
  • Histograma de frecuencias
hist(x)

* Gráfico de cajas y bigote

boxplot(x)

* Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población

hist(x, freq=FALSE) #freq=FALSE, para que el área del histograma sea 1, es decir, lo estamos normalizando
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

Ejercicios

  1. Si \(Z\) es una variable con distribución normal estándar, calcula \(\mathbb{P}(−2.34 < Z < 4.78)\).

  2. Calcula el rango intercuartílico de una población normal estándar.

  3. Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.

  4. Genera 1000 números con distribución de Poisson de parámetro \(\lambda =1\). Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?

  5. Calcula con R los siguientes valores: \(t_{3,\alpha}\), \(\chi^2_{3,\alpha}\), para \(\alpha = 0.05\) y \(\alpha = 0.01\). Compara los valores obtenidos con los que aparecen en las correspondientes tablas.

Conclusión personal del ejercicio

Asocié conceptos vistos en las clases de Probabilidad, y Estadística en preparatoria, con algunos de los pasos de este ejercicio, recordé el concepto de un gráfico de cajas y bigote, y aprendí nuevas cosas, como los tipos de distribuciones de probabilidad y sus alias, además de como trabajar con ellos en el lenguaje de programación R.