Distribuciones de Probabilidad

Jorge Valenzuela Parra

11/9/2020

Distribución Normal # Distribuciones de probabilidad

##Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

  • Distribución Alias
  • Distribución binomial binom
  • Distribución de Poisson pois
  • Distribución normal norm
  • Distribución exponencial exp
  • Distribución t de Student t
  • Distribución chi2 chisq
  • Distribución F f

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} &\text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

Distribución Exponencial

curve(dexp(x), from = 0, to = 10)

#Esto representa la densidad de una exponencial de media 1 entre 0 y 10.

Distribución binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 1 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 0 1 0 1
##Genera 30 observaciones con distribución B(1, 0.5)

Contador de éxitos vs fracasos

table(x)
## x
##  0  1 
## 11  9

e.g. Distribución normal Si \(x\) es una variable aleatoria con distribución normal de media 3, y su desviación típica es de 0.5, la probabilida de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
  • Para calcular el cuantil 0.7 de una variable aleatoria normal estándar Z, es decir, un valor X tal que
qnorm(0.7)
## [1] 0.5244005
  • calcular el mismo cuantil, pero con una variable aleatoria normal de media 0 y una DE 0.5
qnorm(0.5, sd=0.5)
## [1] 0

El valor \(\(z_alpha\)\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(l-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
  • Para generar una muestra de tamaño 100 de una población normal de media 10 y DE 1 (y guardarla en un vector x):
x <- rnorm(100, mean= 10, sd=1)
x
##   [1] 10.585191 11.006316 10.756027 10.296342  9.131890 10.493244  7.992986
##   [8]  9.722948 10.727307 10.316154  9.855596 10.357751  9.124306  8.435463
##  [15] 11.294532 10.579608 10.455125  9.140307  9.311963 11.049467 11.299456
##  [22]  9.415285  9.780149  7.101012  9.875592  8.719095 11.536118 10.558604
##  [29] 10.821437  9.993847 10.211764 11.264617 11.871257 10.518200 10.230123
##  [36]  8.131591  9.042565 10.882412 10.877707 10.450798  9.680038  9.648096
##  [43] 10.950701  9.498974 10.272889 10.460741 10.941993  9.993775 10.216580
##  [50]  9.233252 10.096767 10.433760 10.071027  9.276677 11.288006  9.165504
##  [57] 11.107980  9.700164 11.008664  9.719178 10.953123 10.640660  9.553257
##  [64]  9.760939  9.212169  9.434596 10.511019  9.576475  9.877419  8.540448
##  [71] 11.616685  9.612677 11.729826 11.314067 10.183722 10.258993 11.294566
##  [78] 11.092514 10.553917  8.494976  9.283050 11.109434 10.553383 10.842243
##  [85] 11.732932 11.282017 10.256638 12.456206  8.830841  9.728986  9.109378
##  [92] 10.265102 10.456941 10.818095 10.366020 11.182615 10.555074 11.293375
##  [99]  9.550808 10.340734
  • Para estimar el promedio de x
mean(x)
## [1] 10.20205
  • Histograma de frecuencias
hist(x)

* Gráfico de cajas y bigote

boxplot(x)

* Histograma de la muestra(normalizado para que la suma de las áreas de los rectángulos sean 1) junto con la densidad de la población.

hist(x, freq=FALSE) #Freq = FALSE, para que el área del histograma sea 1.
curve(dnorm(x, mean = 10, sd=1), from = 7, to = 13, add=TRUE)

Ejercicios

  1. Si Z es una variable con distribución normal estándar, calcula P(−2.34<Z<4.78).

  2. Calcula el rango intercuartílico de una población normal estándar.

  3. Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.

  4. Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?

Redacción Personal

Uno pudo relacionar conceptos antes vistos en clases de Probabilidad y Estadística en preparatoria, y es interesante el ver que en tiempo real podemos ver como funcionan y comunican los resultados generados graficamente, y de este modo no batallar tanto para entender o no distorcionar el verdadero significado de estos conceptos, todo esto es de gran ayuda que seguramente lo aplicaré a algún proyecto futuro en programación R.

Queda como aprendizaje las distribuciones de probabilidad, los alias en R así también el cómo fusionarlas para hacer gráficos o encontrar datos más específicos por ejemplo dentro de una muestra.