Distribuciones
Distribuciones de probabilidad
Funciones en R En R, cada distribución de probabilidad se nombre mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
- Distribución Alias
- Distribución binomal: binom
- Distribución de Poisson: pois
- Distribución normal: norm
- Distribución exponencial: exp
- Distribución t de Student: t
- Distribución Chi^2 (\(\chi^2\)): chisq
- Distribución F: f
$$
Distribución exponencial
Distribución binomial
## [1] 0 0 1 0 0 1 1 0 0 1 1 0 1 0 1 1 1 1 1 0
- Conteo de éxitos (1) vs fracasos (0)
## x
## 0 1
## 9 11
Distribución normal
Distribución normal
- e.g. Si \(X\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica (o estándar) es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:
## [1] 0.8413447
- Para calcular el cuantil 0.7 de una variable aleatoria (v.a.) normal estándar Z, es decir, un valor x tal que
## [1] 0.5244005
- Para calcular el mismo cuantil pero para variable aleatoria (v.a.) normal de media 0 y una desviación típica (DT) 0.5
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y constrastes se obtiene con el qnorm(1-alfa). Algunos ejemplos:
## [1] 1.959964
- Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
## [1] 7.774523 10.345653 10.285088 10.676919 9.753718 10.430645 11.447587
## [8] 9.190375 11.655465 9.365949 9.836875 11.359517 7.353736 9.518673
## [15] 10.463969 9.012213 10.099668 9.771760 9.936135 9.054542 9.004470
## [22] 8.445006 10.121102 12.165137 10.235706 11.032976 8.940563 10.001571
## [29] 11.022096 9.385261 11.041859 8.806155 10.822912 11.006722 10.738632
## [36] 9.098401 8.909075 9.304924 11.477128 9.814038 10.315663 9.622975
## [43] 10.105108 10.175020 11.919958 12.136527 10.220120 10.399943 11.500948
## [50] 10.906375 11.132049 9.433431 8.723179 11.705170 8.604773 9.693811
## [57] 9.838484 11.102793 10.058288 8.913106 11.019035 11.779911 8.980391
## [64] 10.895038 9.428044 10.071446 10.350675 8.301708 10.130893 10.527377
## [71] 8.959037 9.074844 9.696815 10.524269 10.462949 9.478495 9.589069
## [78] 9.864418 8.224626 11.049004 11.134847 10.236525 10.752250 9.549703
## [85] 9.091586 9.135917 10.422445 9.464857 9.929902 9.886584 10.234719
## [92] 8.441356 9.997792 11.217246 9.670491 10.521321 11.197088 10.822257
## [99] 9.017885 8.902283
- Para estimar el promedio de x
## [1] 10.0325
- Histograma de frecuencias
* Gráfico de cajas y bigote
* Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población
hist(x, freq=FALSE) #freq=FALSE, para que el área del histograma sea 1, es decir, lo estamos normalizando
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)Ejercicios
Si \(Z\) es una variable con distribución normal estándar, calcula \(\mathbb{P}(−2.34 < Z < 4.78)\).
Calcula el rango intercuartílico de una población normal estándar.
Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
Genera 1000 números con distribución de Poisson de parámetro \(\lambda =1\). Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
Calcula con R los siguientes valores: \(t_{3,\alpha}\), \(\chi^2_{3,\alpha}\), para \(\alpha = 0.05\) y \(\alpha = 0.01\). Compara los valores obtenidos con los que aparecen en las correspondientes tablas.
Conclusión personal del ejercicio
Asocié conceptos vistos en las clases de Probabilidad, y Estadística en preparatoria, con algunos de los pasos de este ejercicio, recordé el concepto de un gráfico de cajas y bigote, y aprendí nuevas cosas, como los tipos de distribuciones de probabilidad y sus alias, además de como trabajar con ellos en el lenguaje de programación R.