U1A5

Distribuciones de probabilidad

**Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave alias. Las palabras clave para las distribuciones más importantes son:

Distribución Alias
Distribución binomial binom
Distribución de posición pois
Distribución normal norm
Distribución exponencial exp
Distribución t de Student t
Distribución Chi2 chisq
Distribución F F

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribución Exponencial

curve(dexp(x), from=0, to=0)

#representa la densidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

x <- rbinom(20, 1, 0.5)
x

##  [1] 0 0 1 1 0 0 1 0 0 1 0 1 1 0 1 1 0 0 1 0

# Genera 20 observaciones con distribución B(1, 0.5)

Contando exitos vs fracasos

table(x)

## x
##  0  1 
## 11  9

e.g. Distribución normal

Si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación tipica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)

## [1] 0.8413447

Para calcular el cuantil 0.7 de una v.a. normal estándar z, es decir un valor x tal que

qnorm(0.7)

## [1] 0.5244005

Para calcular le mismo cuantil, pero para una v.a normal media 0 y DT 0.5

qnorm(0.7, sd=0.5)

## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alpha). Algunos ejemplos:

qnorm(0.975)

## [1] 1.959964

Para generar una muestra de tamaño 100 de una población normal media 10 y desviación típica 1 (y guardarla en un vector x):

x <- rnorm(100, mean= 10, sd=1 )
x

##   [1]  9.079343  9.101713  9.961885 10.709311  9.988586  8.957302 10.400980
##   [8] 10.821748  9.735688 11.050271  9.475116  8.409261  7.645360 11.995560
##  [15] 10.126467 11.042532  9.406291 10.561588 11.004258 10.569011  9.954767
##  [22]  9.623624 10.944310 11.451421  9.131708  9.255893 10.908097  7.914284
##  [29] 11.137673 10.694127  8.856216  9.746519  9.653479 11.204691 11.467752
##  [36] 10.095584 10.583985 10.242526  9.795578  8.286923 11.304007 12.310281
##  [43]  9.258893  9.689244  8.575409 11.155407 12.385558 11.436906  9.016269
##  [50] 13.091198  9.127484  9.778307  9.601004  9.650291 10.186413 10.724946
##  [57]  9.869326 11.015974  9.426294  9.211073 10.078912 10.396502  9.378993
##  [64]  9.860976  9.335015  9.832724  8.941360  8.482053  9.581359 11.487379
##  [71]  9.107656 10.192350 12.091643  9.272641  8.743594 10.401759  9.619733
##  [78]  9.388370  8.542551  8.460190  9.757277  8.942123  9.264490 11.138279
##  [85]  9.520657  9.833971  8.246554 11.625482 11.261160  9.217776  9.042935
##  [92]  8.723526  9.857537 11.823732  9.484744 10.984515  9.350451 10.567280
##  [99]  9.987759  9.715094

Para estimar el promedio de x

mean(x)

## [1] 9.993468

Histograma de frecuencias

hist(x)

Gráfico de caja y bigote

boxplot(x)

Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población:

hist(x, freq = FALSE) #freq= FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from= 7, to= 13, add=TRUE)

Si \(Z\) es una variable con distribución normal estandar, calcula \(P(-2.34 < Z < 4.78)\)

pnorm(4.78)

## [1] 0.9999991

U1A5

Andres

9/14/2020

Distribuciones de probabilidad

Conclusion