Distribuciones de probabilidad.

Funciones en R

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado}& \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probablidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probablidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

Distribución Exponencial

curve(dexp(x), from = 0, to = 10)

#Representa la densidad de una exponencial de media 1 entre o y 10.

Distribución binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 1 1 0 1 1 1 0 1 0 0 1 0 1 0 0 1 0 1 0 1
#Genera 20 observaciones con distribución B(1, 0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
##  9 11

Ejemplo: Distribución normal

Si \(x\) es una variable aleatoria, con distribución normal de media 3, y tu desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm (3.5, mean = 3, sd = 0.5 ) 
## [1] 0.8413447
qnorm (0.7)
## [1] 0.5244005
qnorm (0.7, sd = 0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de ls fórmulas para interalos y contrastes se obtiene con el comento qnorm (1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean = 10, sd = 1)
x
##   [1] 10.388768  8.564993 11.339573 10.065571  9.895997  8.824212 10.078763
##   [8] 10.534740  9.755311 11.073176  9.498642 11.870133  9.646588  9.000725
##  [15]  9.860813  9.819218  9.991394  9.650458  7.173212 11.400252 10.209546
##  [22]  9.674602 11.468668  9.569614  9.381645 11.006467  7.190542 10.507990
##  [29]  9.703597 12.835122  9.976924 10.738496  9.377014 10.787571  9.987976
##  [36] 12.527694  9.803071 10.885424 10.755389 10.101590 11.261050  9.283964
##  [43] 11.521426  9.325260  9.645711 10.642471 10.376958 10.478998  9.973978
##  [50]  9.832519 10.269015  8.450940 10.669984 10.468370 10.712850  9.558330
##  [57]  9.586413 10.680418  8.509150  9.433016 10.657868 10.019214  9.687526
##  [64]  8.771872 10.214415 10.884596 11.349908  7.648676 10.270575 10.856157
##  [71]  9.826982  9.702009 10.443192 10.802006  9.228647  9.618348 10.435430
##  [78]  9.725036  9.867618 10.459363 10.202443  9.139444 10.738342 10.132625
##  [85] 11.594797  8.313414 11.524736  9.852414  9.178046  8.815345  9.217352
##  [92] 10.346839 12.178870 11.007192 11.594729  9.859967 10.660071 10.939796
##  [99] 10.994434  9.742442
mean (x)
## [1] 10.12105
hist((x))

boxplot(x)

hist(x, freq =  FALSE) #Freq = FALSE para que el área del histograma sea 1. 
     
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)