**Funciones en R
En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:
\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribución exponencial
curve(dexp(x), from=0, to=10) #Representa la densidad de un exponencial media 1 entre 0 y 10
Distribución Binomial
x <- rbinom(20, 1, 0.5)
x
## [1] 0 1 0 1 0 0 0 0 0 0 0 0 1 0 1 1 0 1 1 0
#Genera 20 observaciones con distribución B(1, 0.5)
Contando éxitos vs fracasos
table(x)
## x
## 0 1
## 13 7
e.g. Distribución normal Si \(x\) es una variable aleatoria con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se cálcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alpha). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean= 10, sd=1 )
x
## [1] 11.252199 8.870472 10.359766 9.775887 9.432849 10.759246 11.217769
## [8] 8.930841 8.836107 9.897174 11.334969 9.328124 10.286104 7.901800
## [15] 9.718708 10.641168 9.186427 10.095223 9.439795 9.745500 10.974443
## [22] 9.139169 9.686935 9.617691 9.895148 10.635658 9.721095 11.010410
## [29] 8.472167 10.997247 7.802987 9.832202 8.150450 10.794561 10.027553
## [36] 10.284475 10.438634 10.042538 9.878032 11.429967 10.990310 10.362607
## [43] 8.803520 9.882985 10.956063 8.004174 8.564832 9.464503 10.485593
## [50] 10.883691 9.476577 9.344855 9.401417 9.628270 11.747776 10.623664
## [57] 9.835613 9.772784 9.660262 11.933712 12.726181 8.385303 9.302537
## [64] 9.721590 11.101748 10.954281 11.158733 9.916531 9.231927 10.276291
## [71] 9.888153 9.050534 10.089998 9.931101 9.826486 10.292676 9.488588
## [78] 11.104136 9.877480 7.568767 10.166491 9.222953 12.087225 9.305230
## [85] 9.931049 9.299909 10.322504 10.220371 8.771970 11.028930 9.992428
## [92] 8.364197 8.126033 10.204413 10.913603 9.978891 10.201883 10.646357
## [99] 12.775330 8.897462
mean(x)
## [1] 9.96015
hist(x)
boxplot(x)
hist(x, freq = FALSE) #freq= FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from= 7, to= 13, add=TRUE)
Este ejercicio trató acerca de la distribución de la probabilidad, que son todos los posibles valores que pueden representarse como resultado de un experimento si este llega a ocurrir. Aprendimos los distintos tipos de distribución que hay, junto con su definición. Complementamos el aprendizaje con la forma de representar una variable graficamente con un tipo de distribución. Y para presentarlas, aprendimos a hacer tablas.