Distribuciones de probabilidad

Funciones en R

En R, cada distribucion de probabilidad se nombre mediante una palabra clase o alias. Las palabras clave para las distribuciones más importantes son:

\[ \begin{array}{l|l|l|c} \text {Función} & {Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución especifica} & \text{---}\\ \hline \end{array} \] Distribución exponencial

curve(dexp(x), from=0, to=10)

#Representa la densidad de una exponencial de media 1 entre 0 y 10.

Distribución binomial

x<- rbinom(20,1,0.5)
x
##  [1] 0 0 0 1 1 0 1 1 1 0 1 0 1 0 0 0 0 0 1 0
#Genera 20 observaciones con distribución B(1,0.5)

Contando exitos vs fracasos

table(x)
## x
##  0  1 
## 12  8

e.g. Distribución normal

Si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3,sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7,sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x<- rnorm(100, mean=10,sd=1)
x
##   [1]  8.970513 11.624919  9.972624 10.344961 10.364386 11.282656  9.371850
##   [8]  9.914370 10.122583  9.880453 10.568325  9.658108  8.628502 10.995848
##  [15] 11.296888  9.292971 10.025849  8.743335  8.772076  8.936885  7.770098
##  [22] 11.622145 10.502759 10.097424 10.954467  9.751164 10.770772 10.451484
##  [29] 10.956424 11.177398  9.356684 10.568108  8.725674  8.780244  8.924527
##  [36] 10.111891  7.914060 10.123277 11.033675  9.802725  9.849042  9.296100
##  [43] 10.425677  9.324754 10.505279  9.434176 10.713102  9.655644  8.301030
##  [50] 10.701155  8.751883 10.312328  9.879897  9.755147 10.269321 11.760524
##  [57] 10.389270  9.518729  8.635077 10.450046  8.554722 10.698375 10.056219
##  [64]  9.666428  9.893387 11.173859  9.469083 11.127667  8.900357 10.144784
##  [71] 10.313852 10.088743 10.203780 12.357530  9.212499  8.938251 11.787277
##  [78] 10.613627  9.590984 11.311519  9.839660  8.894361  9.633203  9.139958
##  [85] 10.007011  9.823923  8.801052 11.832075 10.243066 10.825338 10.171138
##  [92] 11.551657  9.127442 10.731415 11.248822 10.587877  9.830556 10.926680
##  [99] 12.496279 10.886375
mean(x)
## [1] 10.06792
hist(x)

boxplot(x)

hist(x,freq=FALSE)# Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x,mean=10,sd=1),from=7, to=13,add = TRUE)