Distribuciones de probabilidad
Funciones en R
En R, cada distribución de probabilidad se nombre mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
- Distribución Alias
- Distribución binomal: binom
- Distribución de Poisson: pois
- Distribución normal: norm
- Distribución exponencial: exp
- Distribución t de Student: t
- Distribución Chi^2 (χ2): chisq
- Distribución F: f
\[ \begin{array}{l|l|l|C} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Gemera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]
Distribución Exponencial
Distribución binomial
## [1] 0 1 1 1 1 0 0 0 1 1 0 1 0 0 0 1 0 0 0 1
Contando éxitos vs fracasos
## x
## 0 1
## 11 9
e.g. Distribución normal
Si \(x\) es una variable aleatoria con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:
## [1] 0.8413447
- Para calcular el cuantil 0.7 de una v.a. normal estándar de Z, es decir, un valor X tal que:
## [1] 0.5244005
- Para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT de 0.5
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y constrastes se obtiene con el qnorm(1-alfa). Algunos ejemplos:
## [1] 1.959964
- Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
## [1] 9.749505 11.372266 11.672843 10.397884 10.120794 9.424208 11.091582
## [8] 10.460918 10.267210 9.135811 8.725033 10.559966 9.169789 9.017236
## [15] 11.380846 11.169260 10.323349 10.252963 9.188083 9.832392 10.475428
## [22] 10.656549 10.213868 8.861643 11.571154 9.326015 9.429231 9.549210
## [29] 9.747669 9.341973 10.651713 7.281802 11.177569 8.453755 8.800753
## [36] 8.880695 10.660488 10.900884 8.043877 9.186722 11.031144 11.212104
## [43] 11.188616 10.511626 9.107425 11.495141 10.286697 10.830136 10.317133
## [50] 7.851201 8.705665 8.430167 8.398307 8.787119 9.064858 9.414018
## [57] 10.351820 11.205650 10.498769 8.994449 9.984514 10.495290 8.107191
## [64] 9.074606 9.202329 9.471676 9.523265 10.119748 8.895099 11.044226
## [71] 10.959324 10.316509 8.420581 10.897309 10.179982 9.376875 11.187919
## [78] 9.117593 8.746206 9.736502 8.118936 8.900400 10.486360 9.949821
## [85] 10.310326 11.192523 9.692576 7.670472 9.160097 9.191809 9.760548
## [92] 9.695414 10.160508 10.126598 10.928003 10.529913 9.791174 12.351097
## [99] 9.911177 9.776876
- Para estimar el promedio de x
## [1] 9.867664
- Histograma de frecuencias
- Gráfica de cajas y bigote
- Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población.
hist(x, freq=FALSE) # Freq=FALSE es para que el área del histograma sea igual a 1.
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)Ejercicios
Si \(Z\) es una variable con distribución normal estándar, calcula \(\mathbb{P}(-2.34 <Z<4.78)\).
Calcula el rango intercuartílico de una población normal estándar.
Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
Genera 1000 números con distribución de Poisson de parámetro \(\lambda=1\)λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
Calcula con R los siguientes valores: \(t_{3,\alpha}\), \(\chi^2_{3,\alpha}\), para \(\alpha=0.5\) y \(\alpha=0.01\). Compara los valores obtenidos con los que aparecen en las correspondientes tablas.
Redacción Personal
A pesar de que lo primero que puede uno pensar a cerca de la probabilidad es que esta es sencilla pues generalmente solo se está familiarizado con los conceptos de media, mediana y moda, lo cierto es que no solo es compleja por el análisis de los resultados, sino por también por el medio en que se llega a esos resultados, el cual implica fórmulas no tan sencillas como se vieron anteriormente. Pero a pesar de eso, se espera que una vez que se haya estudiado mejor el como funcionan con ejemplos más claros y más extensos, se mejore la comprensión de las mismas, así como su practicidad.