Distribuciones de probabilidad

** Funciones en R

En R, cada distribucion de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:

\[ \begin{array}{˥|˥|˥|c} \text{Funcion}& \text{Significado} & \text{Uso}& \text{Observacion}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo uso grafico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios segun una distribucion especifica} & \text{---}\\ \hline \end{array} \]

Distribucion Exponencial

curve(dexp(x), from=0, to=10)

#representa la densidad de una exponencial de media 1 entre 0 y 10

Distribucion binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 1 0 1 0 0 1 1 0 0 1 0 0 1 1 0 0 0 1
#Genera 20 observaciones con distribucion 8(1,0.5)
table(x)
## x
##  0  1 
## 11  9

Ejemplo de Distribucion normal

Si \(X\) es una variable aleatoria, con distribucion normal de media 3, y du desviacion tipica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las formulas para intervalos y contrastes se obtine con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1)
x
##   [1]  9.372726  7.162137  8.989740  9.639556  9.464234 11.036654 10.319142
##   [8] 10.489193 12.370191 11.099739 10.507027 10.645089  9.173431  9.112674
##  [15]  7.255864 10.381927  9.741414 10.304620  8.248049 10.069221 10.498813
##  [22] 10.560709 11.487280 10.786108  8.727037  8.543911 10.371929 10.841791
##  [29]  9.186801 10.359660  9.435381 10.989662 11.595682 10.574440 10.632277
##  [36] 11.631696 10.526864 10.274407 10.274080  9.986652  9.444024 10.026522
##  [43]  8.688606 11.021398  9.742244  9.879935 10.414099  9.748849  8.563468
##  [50]  8.830504 10.492427  9.698444 10.003275 10.331109 11.085673 10.753333
##  [57] 10.577264  9.739105 10.894416  9.830096  9.633189  9.467152 11.152042
##  [64] 10.048061 10.238626  9.317331  9.419291  9.983253  9.635746 10.551869
##  [71]  9.961945  9.186564 10.150348  9.887825 10.924944 11.216677  8.244026
##  [78]  9.837289  9.704426  8.842146 11.169355  9.217595 10.779510  9.854982
##  [85]  8.654151  9.922878 10.514663  8.720917 12.349301  9.830169  8.268931
##  [92] 11.743843 10.368047  9.140641 11.590865  9.486615  9.641232 10.223576
##  [99] 10.637473  9.215846
mean(x)
## [1] 10.01166
hist(x)

boxplot(x)

hist(x, freq=FALSE) # Freq=False, para que el area del histograma sea 1
curve(dnorm(x, mean = 10, sd=1), from = 7, to=13, add = TRUE)