Distribuciones

Distribuciones de probabilidad

Funciones en R En R, cada distribución de probabilidad se nombre mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

Distribución Alias
Distribución binomal: binom
Distribución de Poisson: pois
Distribución normal: norm
Distribución exponencial: exp
Distribución t de Student: t
Distribución Chi^2 ($\chi^2$): chisq
Distribución F: f

$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

Distribución exponencial

curve(dexp(x), from = 0, to = 10)

#Representa la densidad de probabilidades puntuales de media 1 entre 0 y 10

Distribución binomial

x <- rbinom(20,1,0.5)  # r: random
x

##  [1] 0 0 1 0 0 1 1 0 0 1 1 0 1 0 1 1 1 1 1 0

#Genera 20 observaciones con distribución B(1,0.5)

Conteo de éxitos (1) vs fracasos (0)

table(x)

## x
##  0  1 
##  9 11

Distribución normal

e.g. Si $X$ es una variable aleatoria, con distribución normal de media 3, y su desviación típica (o estándar) es de 0.5, la probabilidad de que $X$ sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5) #standar deviation

## [1] 0.8413447

Para calcular el cuantil 0.7 de una variable aleatoria (v.a.) normal estándar Z, es decir, un valor x tal que

qnorm(0.7)

## [1] 0.5244005

Para calcular el mismo cuantil pero para variable aleatoria (v.a.) normal de media 0 y una desviación típica (DT) 0.5

qnorm(0.7, sd=0.5)

## [1] 0.2622003

El valor $z_\alpha$ que aparece en muchas de las fórmulas para intervalos y constrastes se obtiene con el qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)

## [1] 1.959964

Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):

x <- rnorm(100, mean=10, sd=1)
x

##   [1]  7.774523 10.345653 10.285088 10.676919  9.753718 10.430645 11.447587
##   [8]  9.190375 11.655465  9.365949  9.836875 11.359517  7.353736  9.518673
##  [15] 10.463969  9.012213 10.099668  9.771760  9.936135  9.054542  9.004470
##  [22]  8.445006 10.121102 12.165137 10.235706 11.032976  8.940563 10.001571
##  [29] 11.022096  9.385261 11.041859  8.806155 10.822912 11.006722 10.738632
##  [36]  9.098401  8.909075  9.304924 11.477128  9.814038 10.315663  9.622975
##  [43] 10.105108 10.175020 11.919958 12.136527 10.220120 10.399943 11.500948
##  [50] 10.906375 11.132049  9.433431  8.723179 11.705170  8.604773  9.693811
##  [57]  9.838484 11.102793 10.058288  8.913106 11.019035 11.779911  8.980391
##  [64] 10.895038  9.428044 10.071446 10.350675  8.301708 10.130893 10.527377
##  [71]  8.959037  9.074844  9.696815 10.524269 10.462949  9.478495  9.589069
##  [78]  9.864418  8.224626 11.049004 11.134847 10.236525 10.752250  9.549703
##  [85]  9.091586  9.135917 10.422445  9.464857  9.929902  9.886584 10.234719
##  [92]  8.441356  9.997792 11.217246  9.670491 10.521321 11.197088 10.822257
##  [99]  9.017885  8.902283

Para estimar el promedio de x

mean(x)

## [1] 10.0325

Histograma de frecuencias

hist(x)

* Gráfico de cajas y bigote

boxplot(x)

* Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población

hist(x, freq=FALSE) #freq=FALSE, para que el área del histograma sea 1, es decir, lo estamos normalizando
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

Ejercicios

Si $Z$ es una variable con distribución normal estándar, calcula $\mathbb{P}(−2.34 < Z < 4.78)$.
Calcula el rango intercuartílico de una población normal estándar.
Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
Genera 1000 números con distribución de Poisson de parámetro $\lambda =1$. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
Calcula con R los siguientes valores: $t_{3,\alpha}$, $\chi^2_{3,\alpha}$, para $\alpha = 0.05$ y $\alpha = 0.01$. Compara los valores obtenidos con los que aparecen en las correspondientes tablas.

Conclusión personal del ejercicio

Asocié conceptos vistos en las clases de Probabilidad, y Estadística en preparatoria, con algunos de los pasos de este ejercicio, recordé el concepto de un gráfico de cajas y bigote, y aprendí nuevas cosas, como los tipos de distribuciones de probabilidad y sus alias, además de como trabajar con ellos en el lenguaje de programación R.

U1A5

VictorCarvajalRomán

11/9/2020

Distribuciones de probabilidad

Distribución exponencial

Distribución binomial

Distribución normal

Conclusión personal del ejercicio