AI6UC_7

## Distribuciones de probabilidad

**Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:

Distribución Alias
Distribución binomial binom
Distribución de Poisson pois
Distribución normal norm
Distribución exponencial exp
Distribución t de Student t
Distribución Chi2 chisq
Distribucion F f

\[\begin{array}{1|1|1|c} \text{Función} & \text{Significado}&\text{Uso}&\text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles(percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo uso grafico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios segun una distribucion especifica} & \text{---}\\ \hline \end{array}\]

Distribucion exponencial

curve(dexp(x),from = 0,to=10)

# Representa la densidad de una exponencial de media 1 entre 0 y 10

Distribucion binomail

 x <- rbinom(20, 1, 0.5)
 x

##  [1] 0 1 0 0 0 1 1 0 1 1 1 0 0 0 0 1 0 0 1 1

  # Genera 20 observaciones con distribucion B(1,0.5)

Contando exitos vs fracasos

table(x)

## x
##  0  1 
## 11  9

e.g.. Distribucion normal

si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación tipica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se caclula en R de esta forma:

pnorm(3.5, mean=3,sd=0.5)

## [1] 0.8413447

Para calcular el cuantil 0.7 de una variable aleatoria normal estandar Z, es decir, un valor x tal que

qnorm(0.7)

## [1] 0.5244005

Para calcular el mismo cuantil pero para una variable aleatoria normal de media 0 y una DT(Standar Deviation) 0.5

qnorm(0.7,sd=0.5)

## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)

## [1] 1.959964

Para generar una muestra de tamaño de 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):

x<-rnorm(100, mean=10, sd=1)
x

##   [1] 11.980440  9.949443  9.893419  9.733053 10.463124  8.088142  9.065287
##   [8]  8.016311 12.707798 10.393857  9.573385 10.059452 10.045323  9.251283
##  [15] 11.280994  8.262555 12.030061 12.063321 10.351177  9.426012 10.965050
##  [22]  9.933578  9.757948 12.865995  9.521949  7.666056  8.861795 10.417578
##  [29]  9.628890  8.120225 12.481472 10.606453  9.856112 10.438112 10.084840
##  [36]  7.947241  8.970013  7.914994 10.598259 10.163656  9.410061  8.999936
##  [43]  9.566625 10.845416  9.995941  9.775166 10.359928 10.622440  7.652465
##  [50] 10.518433  8.827203 10.109982  9.365144  9.864252 11.226859 11.278175
##  [57] 11.280800 10.712436 11.468498  9.516894  8.279857  9.993425  8.572275
##  [64] 11.361428  8.627443 10.345041 11.523704 10.767264  9.316991  9.074038
##  [71] 11.911811  8.156346  9.585364  9.463785 10.941335 10.712216  9.440607
##  [78]  8.450237 10.426220 11.083127 10.263593 10.691983 11.191185  8.567249
##  [85]  8.942027  9.380406 10.429978 11.730693  9.118528  9.397942 10.529326
##  [92] 10.096377  9.437176  9.543832 10.003823  9.946526  9.757334 11.097277
##  [99] 11.377414  8.281264

Para estimar el promedio de x

mean(x)

## [1] 9.986478

Histogramas de frecuencias

hist(x)

Gráfico de cajas y bigote

boxplot(x)

Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de población:

hist(x,freq=FALSE)
#fre=FALSE para que el area del histograma sea 1
curve(dnorm(x,mean=10,sd=1),from=7,to=13, add=TRUE)

Si \(z\) es una variable con distribucion normal estandar, calcula \(\mathbb{P}(-2.34)< z<4.78\)

p=(pnorm(4.78)-pnorm(-2.34))
p

## [1] 0.9903573

Calcula el rango intercuartílico de una población normal estándar.

poblacion<-c(3,4,5,5,5,6,7,4,3,3)

sum<-summary(poblacion)
sum

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    3.00    3.25    4.50    4.50    5.00    7.00

pQuantil<-sum[2]
tQuantil<-sum[5]

rango<- tQuantil-pQuantil
rango

## 3rd Qu. 
##    1.75

Rango de 1.75

Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.

muestra<-rnorm(10,mean=2,sd=1)
muestra

##  [1] 2.3110323 1.2035715 2.5931180 0.8292310 2.4271408 2.6416945 3.0574245
##  [8] 0.7838050 1.2915332 0.8106054

Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?

n<-rpois(1000,1)
n

##    [1] 0 0 0 1 0 0 1 0 2 0 0 3 0 1 0 1 1 0 0 1 1 2 1 2 0 1 0 4 3 1 2 1 0 1 2 0 0
##   [38] 1 1 1 3 2 0 2 1 0 0 0 1 1 1 2 2 0 0 1 1 0 0 0 1 0 0 0 0 0 2 1 0 1 2 2 0 2
##   [75] 1 2 2 0 0 1 0 0 0 1 0 3 1 0 0 0 1 1 0 1 0 2 0 1 2 1 1 1 1 0 0 1 1 1 3 0 1
##  [112] 0 1 2 0 1 0 0 1 0 1 2 0 4 0 0 0 1 1 1 1 0 3 1 0 1 0 1 0 3 0 0 4 0 4 2 2 0
##  [149] 1 1 1 1 1 0 1 1 0 1 1 0 1 1 1 2 0 0 1 0 2 2 1 2 0 0 2 2 2 0 2 0 1 3 2 1 2
##  [186] 1 0 2 1 0 2 0 2 3 1 1 2 2 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 4 3 0 0 3 0 0 0 1
##  [223] 1 0 1 2 1 2 1 1 0 2 1 0 1 4 0 0 1 2 0 2 1 2 0 1 1 3 0 0 0 0 1 2 2 0 0 0 0
##  [260] 0 2 0 2 0 0 1 1 3 0 4 1 1 1 1 0 0 2 1 1 0 0 0 0 4 1 2 0 1 0 0 1 1 2 0 1 2
##  [297] 0 0 4 1 0 0 1 2 2 1 1 1 1 2 0 1 1 0 1 2 3 1 0 1 2 2 0 0 4 0 0 1 1 1 1 3 2
##  [334] 2 0 1 0 1 2 1 0 1 0 3 2 0 0 1 1 1 0 1 1 2 3 1 0 1 0 0 0 1 0 0 2 2 1 0 1 1
##  [371] 2 0 2 1 0 0 0 0 2 1 1 1 1 1 1 3 0 1 2 2 0 0 2 1 1 1 0 0 0 1 0 1 0 0 2 1 1
##  [408] 0 1 0 0 1 2 1 1 1 1 1 1 2 0 1 0 0 1 1 2 1 2 3 1 2 3 1 0 1 0 0 1 1 0 0 1 0
##  [445] 0 2 0 1 3 1 1 0 0 0 1 0 2 0 1 2 0 1 0 0 2 0 1 0 0 1 1 0 0 2 1 0 0 2 2 0 0
##  [482] 1 3 1 3 1 2 1 2 2 1 3 2 2 1 2 0 0 1 0 1 1 1 2 0 1 1 3 0 2 2 0 1 1 2 0 2 3
##  [519] 0 2 2 4 0 0 1 0 2 1 1 2 2 2 2 1 4 0 1 1 1 0 1 0 3 1 1 0 0 1 0 4 1 0 2 1 0
##  [556] 1 0 2 1 0 0 1 1 1 1 1 2 2 0 0 1 0 2 3 1 1 1 0 1 0 0 2 0 0 0 1 1 1 3 2 1 2
##  [593] 0 0 3 0 0 0 1 6 1 3 1 0 2 0 0 3 0 0 3 0 0 3 1 1 3 1 1 3 1 1 2 0 0 1 2 0 0
##  [630] 0 0 1 1 0 1 0 0 1 0 0 1 2 1 2 2 3 0 0 1 2 2 0 3 1 3 1 1 0 2 0 1 1 3 1 2 1
##  [667] 1 1 1 1 0 0 5 0 1 2 2 1 1 0 1 0 0 1 1 0 1 0 0 0 0 1 1 1 1 2 3 1 0 1 3 1 2
##  [704] 1 0 1 1 1 0 3 2 0 2 0 1 2 0 2 2 1 0 1 2 0 1 1 0 1 1 0 0 1 1 0 2 2 0 3 1 0
##  [741] 0 0 0 0 0 1 1 1 1 1 2 2 1 0 2 0 1 1 1 0 2 3 0 0 0 0 1 1 1 1 0 1 2 1 1 1 0
##  [778] 2 3 0 0 1 0 1 0 0 0 0 0 0 0 2 1 3 0 0 0 1 1 1 1 0 0 0 3 1 0 0 0 2 1 3 0 2
##  [815] 2 1 1 1 0 0 2 0 1 0 1 1 1 1 1 0 2 1 0 1 1 0 2 1 1 2 2 1 0 0 2 0 1 0 1 1 1
##  [852] 1 1 4 2 1 0 1 0 0 1 0 1 1 1 2 0 0 1 1 0 2 1 1 2 3 1 1 0 0 2 2 2 0 3 0 0 0
##  [889] 1 0 3 1 1 0 0 3 0 0 1 3 1 1 2 1 2 0 1 0 0 0 1 1 0 1 0 1 0 0 0 1 1 2 0 2 2
##  [926] 0 1 0 1 4 1 1 2 0 2 1 1 2 3 1 1 0 0 0 2 1 0 1 2 2 1 2 2 1 1 0 1 1 0 1 0 0
##  [963] 2 1 2 1 1 1 0 1 0 2 1 0 1 0 3 1 2 2 1 2 1 0 1 2 1 0 2 0 0 0 0 1 1 4 2 0 1
## [1000] 0

hist(n)

mean(n)

## [1] 0.968

varianza<-var(n)
varianza

## [1] 0.9599359

AI6UC_7

Jarol Tellez

10/1/2021