Distribuciones de probabilidad

**Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} &v text(---)\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribución exponencial

curve(dexp(x), from=0, to=10) #Representa la densidad de un exponencial media 1 entre 0 y 10

Distribución Binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 1 0 1 0 1 1 0 0 0 1 0 1 1 0 0 0 1 0 0 1
#Genera 20 observaciones con distribución B(1, 0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
## 11  9

e.g. Distribución normal Si \(x\) es una variable aleatoria con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se cálcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alpha). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean= 10, sd=1 )
x
##   [1]  8.614601 10.590290  9.572542  9.631804 10.092124 11.147162  9.999312
##   [8] 10.515374 10.186147 10.325033 10.000018 10.440399  9.051004 11.352498
##  [15]  9.398446 11.632300 11.846307  9.645021 11.287797 10.030357  9.274890
##  [22] 10.146175  9.109741  8.005250 11.121131  9.859475  9.423029  9.587044
##  [29]  6.695797  8.872290 10.939310  9.507638  8.911179  8.252958  9.469509
##  [36]  8.069003  9.170042  9.396379 10.780124 12.104525 10.004055  8.764855
##  [43] 10.732969 10.050062 10.032972 10.717899 10.392724 10.487071 10.133378
##  [50] 10.985171  9.780558 10.193969  9.827151 11.100488  9.438628 10.940068
##  [57] 10.646834  9.142565 10.188909  9.809964 10.239137 10.505777  9.194562
##  [64]  9.244450 11.728724 10.002903  9.550897 10.101887  8.805686 11.105089
##  [71]  8.825255 10.784120 10.819836  7.823529  9.573143  9.404697 10.310594
##  [78]  7.877876  9.271226 11.735299 10.148403  9.186768  9.602664  8.766155
##  [85]  9.570458  8.804777  9.217542 10.872596 10.934139  9.601419 10.053752
##  [92] 12.339994  7.903332  9.386476 12.023696  9.986614 11.766227 11.653465
##  [99]  9.304538 11.755472
mean(x)
## [1] 9.972075
hist(x)

boxplot(x)

hist(x, freq = FALSE) #freq= FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from= 7, to= 13, add=TRUE)

Conclusión

El ejercicio visto, trata acerca de la distribución de la probabilidad, donde se miran los valores posibles que se pueden presentar en un ejemplo.Aquí aprendimos a hacer los tipos de distribuciones que hay, como la distribución exponinencial, binomial y normal, así como sus descripciones. También se vio cómo representarlas gráficamente mediante tablas, a lo que también se aprendió a crear diferentes tablas.