En R, cada distribucion de probabilidad se nombra mendainte una palabra clave o alias.
Distribución Alias Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución Chi2 chisq Distribución F f
\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]
Distribución Exponencial
curve(dexp(x), from=0, to=10)
## Densidad de una exponencial.
Distribución Binomial
x<- rbinom(20, 1, 0.5)
x
## [1] 0 1 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 0 1 1
# Se generan 20 observaciones con distribución B(1,0.5)
# Se pueden generar diferentes repuestas gracias al factor random
Contando éxitos vs fracasos
table(x)
## x
## 0 1
## 10 10
## Se contabilizan las veces en las que hubo exito (1)
## Y despues los fracasos (0)
Distribucion normal Si “X” es una variable aleatoria, con distribucóin normal de media 3, y su desviación típíca es de 0.5, la probabilidad de que “X” sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd =0.5)
## [1] 0.8413447
*Para calcular el cuantil 0.7 de una variable aleatoria normal estándar Z, es decir un valor X
qnorm(0.7)
## [1] 0.5244005
*Procedemos a calcular el mismo cuantil, pero con una variable normal de media 0 y DT de 0.5
qnorm(0.7, sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1)
x
## [1] 10.327252 9.449521 9.056549 10.768008 9.499585 9.814159 7.720619
## [8] 10.547244 11.835714 9.427827 8.918973 8.738047 11.092557 10.003781
## [15] 8.744684 9.940185 10.885994 9.640013 10.659922 8.837103 10.899752
## [22] 9.080738 10.748882 8.802042 9.133927 9.413420 9.265243 9.307937
## [29] 10.551609 9.737447 9.514416 11.441204 11.852000 8.691304 11.079419
## [36] 11.170032 9.588738 9.682727 9.933561 10.338133 11.093646 10.053736
## [43] 11.008755 8.550796 10.148617 9.398512 8.573080 11.735586 8.261891
## [50] 9.995215 9.098487 7.806194 7.848388 11.231820 9.295651 11.346185
## [57] 11.168565 10.413434 8.246653 9.563981 11.031191 9.602515 10.580901
## [64] 10.234154 11.873952 10.174317 8.549135 12.594355 11.643168 9.548037
## [71] 8.713962 9.951975 9.699042 9.582862 9.140767 7.809392 9.483560
## [78] 10.220114 8.884206 8.907009 9.957717 10.014422 10.706720 10.391203
## [85] 7.375074 12.106668 9.938710 11.764214 10.797145 11.822348 12.078980
## [92] 7.874473 8.546851 9.225379 11.031030 11.062769 9.975071 10.027682
## [99] 8.749985 9.303948
Calculamos el promedio de x
mean(x)
## [1] 9.919545
hist(x)
Grafico de cajas y bigote
boxplot(x)
hist(x, freq=FALSE) # Freq = false, para que el area del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE) # Establecemos un valor minimo y un valor maximo hasta donde queremos la curvatura