# Distribuciones de probabilidad
##Funciones en R
En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
- Distribución Alias
- Distribución binomial binom
- Distribución de Poisson pois
- Distribución normal norm
- Distribución exponencial exp
- Distribución t de Student t
- Distribución chi2 chisq
- Distribución F f
\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} &\text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]
Distribución Exponencial
Distribución binomial
## [1] 1 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 0 1 0 1
Contador de éxitos vs fracasos
## x
## 0 1
## 11 9
e.g. Distribución normal Si \(x\) es una variable aleatoria con distribución normal de media 3, y su desviación típica es de 0.5, la probabilida de que \(x\) sea menor que 3.5 se calcula en R de esta forma:
## [1] 0.8413447
- Para calcular el cuantil 0.7 de una variable aleatoria normal estándar Z, es decir, un valor X tal que
## [1] 0.5244005
- calcular el mismo cuantil, pero con una variable aleatoria normal de media 0 y una DE 0.5
## [1] 0
El valor \(\(z_alpha\)\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(l-alfa). Algunos ejemplos:
## [1] 1.959964
- Para generar una muestra de tamaño 100 de una población normal de media 10 y DE 1 (y guardarla en un vector x):
## [1] 10.585191 11.006316 10.756027 10.296342 9.131890 10.493244 7.992986
## [8] 9.722948 10.727307 10.316154 9.855596 10.357751 9.124306 8.435463
## [15] 11.294532 10.579608 10.455125 9.140307 9.311963 11.049467 11.299456
## [22] 9.415285 9.780149 7.101012 9.875592 8.719095 11.536118 10.558604
## [29] 10.821437 9.993847 10.211764 11.264617 11.871257 10.518200 10.230123
## [36] 8.131591 9.042565 10.882412 10.877707 10.450798 9.680038 9.648096
## [43] 10.950701 9.498974 10.272889 10.460741 10.941993 9.993775 10.216580
## [50] 9.233252 10.096767 10.433760 10.071027 9.276677 11.288006 9.165504
## [57] 11.107980 9.700164 11.008664 9.719178 10.953123 10.640660 9.553257
## [64] 9.760939 9.212169 9.434596 10.511019 9.576475 9.877419 8.540448
## [71] 11.616685 9.612677 11.729826 11.314067 10.183722 10.258993 11.294566
## [78] 11.092514 10.553917 8.494976 9.283050 11.109434 10.553383 10.842243
## [85] 11.732932 11.282017 10.256638 12.456206 8.830841 9.728986 9.109378
## [92] 10.265102 10.456941 10.818095 10.366020 11.182615 10.555074 11.293375
## [99] 9.550808 10.340734
- Para estimar el promedio de x
## [1] 10.20205
- Histograma de frecuencias
* Gráfico de cajas y bigote
* Histograma de la muestra(normalizado para que la suma de las áreas de los rectángulos sean 1) junto con la densidad de la población.
hist(x, freq=FALSE) #Freq = FALSE, para que el área del histograma sea 1.
curve(dnorm(x, mean = 10, sd=1), from = 7, to = 13, add=TRUE) Ejercicios
Si Z es una variable con distribución normal estándar, calcula P(−2.34<Z<4.78).
Calcula el rango intercuartílico de una población normal estándar.
Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
Redacción Personal
Uno pudo relacionar conceptos antes vistos en clases de Probabilidad y Estadística en preparatoria, y es interesante el ver que en tiempo real podemos ver como funcionan y comunican los resultados generados graficamente, y de este modo no batallar tanto para entender o no distorcionar el verdadero significado de estos conceptos, todo esto es de gran ayuda que seguramente lo aplicaré a algún proyecto futuro en programación R.
Queda como aprendizaje las distribuciones de probabilidad, los alias en R así también el cómo fusionarlas para hacer gráficos o encontrar datos más específicos por ejemplo dentro de una muestra.