library(prettydoc)

Probabilidad

Distribuciones de probabilidad

En R, cada distribucion de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

\[ \begin{array}{1|1|1|c|} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ p & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

Distribución Exponencial

curve(dexp(x),  from=0, to=10)

#Representa la densidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 0 0 1 0 1 1 0 0 0 1 1 0 0 0 1 0 0 0
#Genera 20 observaciones con distribucion B(1,0.5)

Conteo de éxitos vs fracasos

table(x)
## x
##  0  1 
## 13  7

e.g. Distribución normal si \(X\) es una variable aleatoría con distribución normal de media 3, y su desviacion típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(( z_\alpha )\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1)
x
##   [1] 10.920679  9.885778  9.333377 11.026331 11.375398  7.451371  9.768637
##   [8]  9.159742  9.665828 11.230862  8.619670  8.266582 10.270760 10.493877
##  [15]  9.846969 10.643501 10.666912  9.286689  9.611217 10.600732  7.975668
##  [22]  9.567140 10.837973 10.737527  8.986842  9.594459 11.211396  8.833686
##  [29]  9.315507 11.114384 11.428509  9.456688 10.680937 10.358643  8.140901
##  [36]  8.634584 10.385569  9.841278 10.007440 10.578128  9.747346  9.663764
##  [43]  9.075253 10.856060  9.464554  8.364075 11.265980  9.169251 11.998880
##  [50]  9.091944  8.547106 11.585567  8.800849 10.619038 10.003478 10.131955
##  [57] 12.437104 11.014392  9.927238 10.450946 10.570462  8.806478  9.490719
##  [64]  8.977704 10.534955  9.415954 11.070003  9.338656  8.974230  8.758960
##  [71]  9.736498  8.834583  9.308823 11.082233  8.943509  9.114513  9.405841
##  [78] 11.363788 10.642439 11.078005  9.283898 11.875177  8.312684  9.670938
##  [85] 10.084993  9.139486 10.663942 10.951586  9.032899  9.724708  9.836330
##  [92]  9.032112  9.914982 10.368588 12.283265  9.815464 11.496028  7.909381
##  [99]  9.362042 12.677420
mean(x)
## [1] 9.949112
hist(x)

boxplot(x)

*Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la poblacion

hist(x, fre=FALSE) 
#Freq=FALSE, para que el area del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add =TRUE)