Funciones en R
En R, cada distribucion de probabilidad se nombre mediante una palabra clase o alias. Las palabras clave para las distribuciones más importantes son:
\[ \begin{array}{l|l|l|c} \text {Función} & {Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución especifica} & \text{---}\\ \hline \end{array} \] Distribución exponencial
curve(dexp(x), from=0, to=10)
#Representa la densidad de una exponencial de media 1 entre 0 y 10.
Distribución binomial
x<- rbinom(20,1,0.5)
x
## [1] 0 0 0 1 1 0 1 1 1 0 1 0 1 0 0 0 0 0 1 0
#Genera 20 observaciones con distribución B(1,0.5)
Contando exitos vs fracasos
table(x)
## x
## 0 1
## 12 8
e.g. Distribución normal
Si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3,sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7,sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x<- rnorm(100, mean=10,sd=1)
x
## [1] 8.970513 11.624919 9.972624 10.344961 10.364386 11.282656 9.371850
## [8] 9.914370 10.122583 9.880453 10.568325 9.658108 8.628502 10.995848
## [15] 11.296888 9.292971 10.025849 8.743335 8.772076 8.936885 7.770098
## [22] 11.622145 10.502759 10.097424 10.954467 9.751164 10.770772 10.451484
## [29] 10.956424 11.177398 9.356684 10.568108 8.725674 8.780244 8.924527
## [36] 10.111891 7.914060 10.123277 11.033675 9.802725 9.849042 9.296100
## [43] 10.425677 9.324754 10.505279 9.434176 10.713102 9.655644 8.301030
## [50] 10.701155 8.751883 10.312328 9.879897 9.755147 10.269321 11.760524
## [57] 10.389270 9.518729 8.635077 10.450046 8.554722 10.698375 10.056219
## [64] 9.666428 9.893387 11.173859 9.469083 11.127667 8.900357 10.144784
## [71] 10.313852 10.088743 10.203780 12.357530 9.212499 8.938251 11.787277
## [78] 10.613627 9.590984 11.311519 9.839660 8.894361 9.633203 9.139958
## [85] 10.007011 9.823923 8.801052 11.832075 10.243066 10.825338 10.171138
## [92] 11.551657 9.127442 10.731415 11.248822 10.587877 9.830556 10.926680
## [99] 12.496279 10.886375
mean(x)
## [1] 10.06792
hist(x)
boxplot(x)
hist(x,freq=FALSE)# Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x,mean=10,sd=1),from=7, to=13,add = TRUE)