Distribuciones de probabilidad

Funciones en R

En R, cada distribución de probabilidad se nombre mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

\[ \begin{array}{l|l|l|C} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Gemera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

Distribución Exponencial

curve( dexp(x), from=0, to=10)

#representa la densidad de una exponencial de media 1 entre 0 y 10.

Distribución binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 1 1 1 0 0 0 1 1 0 1 0 0 0 1 0 0 0 1
#Genera 20 observaciones con distribución B(1, 0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
## 11  9

e.g. Distribución normal

Si \(x\) es una variable aleatoria con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y constrastes se obtiene con el qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1)
x
##   [1]  9.749505 11.372266 11.672843 10.397884 10.120794  9.424208 11.091582
##   [8] 10.460918 10.267210  9.135811  8.725033 10.559966  9.169789  9.017236
##  [15] 11.380846 11.169260 10.323349 10.252963  9.188083  9.832392 10.475428
##  [22] 10.656549 10.213868  8.861643 11.571154  9.326015  9.429231  9.549210
##  [29]  9.747669  9.341973 10.651713  7.281802 11.177569  8.453755  8.800753
##  [36]  8.880695 10.660488 10.900884  8.043877  9.186722 11.031144 11.212104
##  [43] 11.188616 10.511626  9.107425 11.495141 10.286697 10.830136 10.317133
##  [50]  7.851201  8.705665  8.430167  8.398307  8.787119  9.064858  9.414018
##  [57] 10.351820 11.205650 10.498769  8.994449  9.984514 10.495290  8.107191
##  [64]  9.074606  9.202329  9.471676  9.523265 10.119748  8.895099 11.044226
##  [71] 10.959324 10.316509  8.420581 10.897309 10.179982  9.376875 11.187919
##  [78]  9.117593  8.746206  9.736502  8.118936  8.900400 10.486360  9.949821
##  [85] 10.310326 11.192523  9.692576  7.670472  9.160097  9.191809  9.760548
##  [92]  9.695414 10.160508 10.126598 10.928003 10.529913  9.791174 12.351097
##  [99]  9.911177  9.776876
mean(x)
## [1] 9.867664
hist(x)

boxplot(x )

hist(x, freq=FALSE) # Freq=FALSE es para que el área del histograma sea igual a 1.
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

Ejercicios

  1. Si \(Z\) es una variable con distribución normal estándar, calcula \(\mathbb{P}(-2.34 <Z<4.78)\).

  2. Calcula el rango intercuartílico de una población normal estándar.

  3. Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.

  4. Genera 1000 números con distribución de Poisson de parámetro \(\lambda=1\)λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?

  5. Calcula con R los siguientes valores: \(t_{3,\alpha}\), \(\chi^2_{3,\alpha}\), para \(\alpha=0.5\) y \(\alpha=0.01\). Compara los valores obtenidos con los que aparecen en las correspondientes tablas.

Redacción Personal

A pesar de que lo primero que puede uno pensar a cerca de la probabilidad es que esta es sencilla pues generalmente solo se está familiarizado con los conceptos de media, mediana y moda, lo cierto es que no solo es compleja por el análisis de los resultados, sino por también por el medio en que se llega a esos resultados, el cual implica fórmulas no tan sencillas como se vieron anteriormente. Pero a pesar de eso, se espera que una vez que se haya estudiado mejor el como funcionan con ejemplos más claros y más extensos, se mejore la comprensión de las mismas, así como su practicidad.