U1A5

Distribucinoes de probabilidad

En R, cada distribucion de probabilidad se nombra mendainte una palabra clave o alias.

Distribución Alias Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución Chi2 chisq Distribución F f

Creación de tabla

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

Distribución Exponencial

 curve(dexp(x), from=0, to=10)

## Densidad de una exponencial.

Distribución Binomial

x<- rbinom(20, 1, 0.5)
x

##  [1] 0 1 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 0 1 1

# Se generan 20 observaciones con distribución B(1,0.5)
# Se pueden generar diferentes repuestas gracias al factor random

Contando éxitos vs fracasos

table(x)

## x
##  0  1 
## 10 10

## Se contabilizan las veces en las que hubo exito (1)
## Y despues los fracasos (0)

Distribucion normal Si “X” es una variable aleatoria, con distribucóin normal de media 3, y su desviación típíca es de 0.5, la probabilidad de que “X” sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd =0.5)

## [1] 0.8413447

*Para calcular el cuantil 0.7 de una variable aleatoria normal estándar Z, es decir un valor X

qnorm(0.7)

## [1] 0.5244005

*Procedemos a calcular el mismo cuantil, pero con una variable normal de media 0 y DT de 0.5

qnorm(0.7, sd=0.5)

## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)

## [1] 1.959964

x <- rnorm(100, mean=10, sd=1)
x

##   [1] 10.327252  9.449521  9.056549 10.768008  9.499585  9.814159  7.720619
##   [8] 10.547244 11.835714  9.427827  8.918973  8.738047 11.092557 10.003781
##  [15]  8.744684  9.940185 10.885994  9.640013 10.659922  8.837103 10.899752
##  [22]  9.080738 10.748882  8.802042  9.133927  9.413420  9.265243  9.307937
##  [29] 10.551609  9.737447  9.514416 11.441204 11.852000  8.691304 11.079419
##  [36] 11.170032  9.588738  9.682727  9.933561 10.338133 11.093646 10.053736
##  [43] 11.008755  8.550796 10.148617  9.398512  8.573080 11.735586  8.261891
##  [50]  9.995215  9.098487  7.806194  7.848388 11.231820  9.295651 11.346185
##  [57] 11.168565 10.413434  8.246653  9.563981 11.031191  9.602515 10.580901
##  [64] 10.234154 11.873952 10.174317  8.549135 12.594355 11.643168  9.548037
##  [71]  8.713962  9.951975  9.699042  9.582862  9.140767  7.809392  9.483560
##  [78] 10.220114  8.884206  8.907009  9.957717 10.014422 10.706720 10.391203
##  [85]  7.375074 12.106668  9.938710 11.764214 10.797145 11.822348 12.078980
##  [92]  7.874473  8.546851  9.225379 11.031030 11.062769  9.975071 10.027682
##  [99]  8.749985  9.303948

Calculamos el promedio de x

mean(x)

## [1] 9.919545

Regresamos a la creación de histogramas vistos anteriormente

hist(x)

Grafico de cajas y bigote

boxplot(x)

Histograma de la muestra normalizado para que la suma de los rectangulos sea 1) Junto con la densidad de la población

hist(x, freq=FALSE) # Freq = false, para que el area del histograma sea 1

curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE) # Establecemos un valor minimo y un valor maximo hasta donde queremos la curvatura

Al momento de utilizar el add le damos permiso a que se agregue como capa el histograma

Le damos un vistazo a las distribuciones, exponenciales, binomiales y normales, junto a esto vemos como llevar estos datos a una grafica para que sea mas digerible para nuestra mente