** Funciones en R
En R, cada distribucion de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:
\[ \begin{array}{˥|˥|˥|c} \text{Funcion}& \text{Significado} & \text{Uso}& \text{Observacion}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo uso grafico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios segun una distribucion especifica} & \text{---}\\ \hline \end{array} \]
Distribucion Exponencial
curve(dexp(x), from=0, to=10)
#representa la densidad de una exponencial de media 1 entre 0 y 10
Distribucion binomial
x <- rbinom(20, 1, 0.5)
x
## [1] 0 1 1 0 1 0 0 1 1 0 0 1 0 0 1 1 0 0 0 1
#Genera 20 observaciones con distribucion 8(1,0.5)
table(x)
## x
## 0 1
## 11 9
Ejemplo de Distribucion normal
Si \(X\) es una variable aleatoria, con distribucion normal de media 3, y du desviacion tipica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las formulas para intervalos y contrastes se obtine con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1)
x
## [1] 9.372726 7.162137 8.989740 9.639556 9.464234 11.036654 10.319142
## [8] 10.489193 12.370191 11.099739 10.507027 10.645089 9.173431 9.112674
## [15] 7.255864 10.381927 9.741414 10.304620 8.248049 10.069221 10.498813
## [22] 10.560709 11.487280 10.786108 8.727037 8.543911 10.371929 10.841791
## [29] 9.186801 10.359660 9.435381 10.989662 11.595682 10.574440 10.632277
## [36] 11.631696 10.526864 10.274407 10.274080 9.986652 9.444024 10.026522
## [43] 8.688606 11.021398 9.742244 9.879935 10.414099 9.748849 8.563468
## [50] 8.830504 10.492427 9.698444 10.003275 10.331109 11.085673 10.753333
## [57] 10.577264 9.739105 10.894416 9.830096 9.633189 9.467152 11.152042
## [64] 10.048061 10.238626 9.317331 9.419291 9.983253 9.635746 10.551869
## [71] 9.961945 9.186564 10.150348 9.887825 10.924944 11.216677 8.244026
## [78] 9.837289 9.704426 8.842146 11.169355 9.217595 10.779510 9.854982
## [85] 8.654151 9.922878 10.514663 8.720917 12.349301 9.830169 8.268931
## [92] 11.743843 10.368047 9.140641 11.590865 9.486615 9.641232 10.223576
## [99] 10.637473 9.215846
mean(x)
## [1] 10.01166
hist(x)
boxplot(x)
hist(x, freq=FALSE) # Freq=False, para que el area del histograma sea 1
curve(dnorm(x, mean = 10, sd=1), from = 7, to=13, add = TRUE)