Distribuciones de probabilidad

**Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribución exponencial

curve(dexp(x), from=0, to=10) #Representa la densidad de un exponencial media 1 entre 0 y 10

Distribución Binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 0 1 0 0 0 0 0 0 0 0 1 0 1 1 0 1 1 0
#Genera 20 observaciones con distribución B(1, 0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
## 13  7

e.g. Distribución normal Si \(x\) es una variable aleatoria con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se cálcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alpha). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean= 10, sd=1 )
x
##   [1] 11.252199  8.870472 10.359766  9.775887  9.432849 10.759246 11.217769
##   [8]  8.930841  8.836107  9.897174 11.334969  9.328124 10.286104  7.901800
##  [15]  9.718708 10.641168  9.186427 10.095223  9.439795  9.745500 10.974443
##  [22]  9.139169  9.686935  9.617691  9.895148 10.635658  9.721095 11.010410
##  [29]  8.472167 10.997247  7.802987  9.832202  8.150450 10.794561 10.027553
##  [36] 10.284475 10.438634 10.042538  9.878032 11.429967 10.990310 10.362607
##  [43]  8.803520  9.882985 10.956063  8.004174  8.564832  9.464503 10.485593
##  [50] 10.883691  9.476577  9.344855  9.401417  9.628270 11.747776 10.623664
##  [57]  9.835613  9.772784  9.660262 11.933712 12.726181  8.385303  9.302537
##  [64]  9.721590 11.101748 10.954281 11.158733  9.916531  9.231927 10.276291
##  [71]  9.888153  9.050534 10.089998  9.931101  9.826486 10.292676  9.488588
##  [78] 11.104136  9.877480  7.568767 10.166491  9.222953 12.087225  9.305230
##  [85]  9.931049  9.299909 10.322504 10.220371  8.771970 11.028930  9.992428
##  [92]  8.364197  8.126033 10.204413 10.913603  9.978891 10.201883 10.646357
##  [99] 12.775330  8.897462
mean(x)
## [1] 9.96015
hist(x)

boxplot(x)

hist(x, freq = FALSE) #freq= FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from= 7, to= 13, add=TRUE)

Conclusión

Este ejercicio trató acerca de la distribución de la probabilidad, que son todos los posibles valores que pueden representarse como resultado de un experimento si este llega a ocurrir. Aprendimos los distintos tipos de distribución que hay, junto con su definición. Complementamos el aprendizaje con la forma de representar una variable graficamente con un tipo de distribución. Y para presentarlas, aprendimos a hacer tablas.