Distribuciones de probabilidad

En R, cada districbucón de probabilidad se nombrea mediante la palabra clave o alias. las palabras clave para las distribuciones mas importantes son:

Distribución Alias
Distribución binomial binom
Distribución de poisson pos
Distribución normal norm
Distribución exponencial exp
Distribución t de studen t
Distribución chi2 chisq
Distribución F f

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado}& \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probablidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probablidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribucion exponencial

curve(dexp(x), from = 0, to = 10)

# Representa la densidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

x <- rbinom(20, 1, 0.5)
x

##  [1] 1 0 1 0 1 0 0 1 1 1 0 0 0 1 0 0 1 0 1 0

  # Genera 20 observaciones con distribucion B(1,0.5)

Contanto exitos vs fracasos

table(x)

## x
##  0  1 
## 11  9

e.g.. Distribucion normal

Sí \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que x sea menor que 3.5 se caclula en R de esta forma:

pnorm(3.5, mean=3,sd=0.5)

## [1] 0.8413447

Para calcular el cuantil 0.7 de una variable aleatoria normal estandar Z, es decir, un valor x tal que:

qnorm(0.7)

## [1] 0.5244005

Para calcular el mismo cuantil pero para una variable aleatoria normal de media 0 y una DT(Standar Deviation) 0.5

qnorm(0.7,sd=0.5)

## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)

## [1] 1.959964

Para generar una muestra de tamaño de 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):

x<-rnorm(100, mean=10, sd=1)
x

##   [1]  9.004644  9.169440 10.950453  9.338444  9.512810 12.378785 10.670741
##   [8]  9.682375  8.725685  9.760797 10.205833 10.429115  9.401057  9.800681
##  [15]  9.571898  9.601717 10.878911 11.023409 10.569820 10.028183  9.017949
##  [22]  8.849892  9.212943  9.279011 10.713337 11.163617  9.948616  9.612414
##  [29]  9.813209 10.750480 10.232519 10.467971  9.633242  8.301137 10.139367
##  [36] 11.599784  9.876501  9.723944 10.955423  9.367010  8.960245  8.864221
##  [43] 11.072346  9.204014 10.410704  7.683666  8.553229 10.377055 10.670825
##  [50] 10.221925 11.124104  8.353861  9.071340 10.134982  9.632077  9.877525
##  [57]  6.008628  9.579801  9.315691 10.059880  9.442904 11.349426 10.699170
##  [64]  9.478226 12.395568 10.542455  9.137530  9.253641  8.637139  9.380452
##  [71] 10.345598  9.710604 10.378544 10.123386  9.024892  9.591497 10.119474
##  [78]  9.636552  9.863376 10.404091 11.523775  9.036227 11.060415  8.875771
##  [85] 10.753167 11.543768 10.703760 10.917658  9.540275 10.662710  9.059867
##  [92]  8.999961  9.946417 10.472041  8.020493 10.498303 10.036707 10.453562
##  [99] 10.159828 11.508950

Para estimar el promedio de x:

mean(x)

## [1] 9.918275

Histograma de frecuencias

hist(x)

Gráfico de caja y bigote:

boxplot(x)

Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población:

hist(x,freq = FALSE)
#Freq = FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)

#densidad normal

Ejercicios

1.- Si Z es una variable con distribución normal estándar, calcula P(−2.34<Z<4.78).

pnorm(4.78, mean = 0, sd = 1) - pnorm(-2.34, mean = 0, sd = 1)

## [1] 0.9903573

2.- Calcula el rango intercuartílico de una población normal estándar.

pob <- c(1,1,2,2,5,5,7,7,8,8,9,9)
s <- summary(pob)
s

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   2.000   6.000   5.333   8.000   9.000

rango <- as.numeric(substr(s[5],1,7)) - as.numeric(substr(s[2],1,7))
rango

## [1] 6

3.- Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.

Primera muestra

set.seed(1)
x <- rnorm(10, mean = 5, sd = 1)
x

##  [1] 4.373546 5.183643 4.164371 6.595281 5.329508 4.179532 5.487429 5.738325
##  [9] 5.575781 4.694612

mean(x)

## [1] 5.132203

Segunda muestra

set.seed(2)
x <- rnorm(10, mean = 5, sd = 1)
x

##  [1] 4.103085 5.184849 6.587845 3.869624 4.919748 5.132420 5.707955 4.760302
##  [9] 6.984474 4.861213

mean(x)

## [1] 5.211152

Tercera muestra

set.seed(3)
x <- rnorm(10, mean = 5, sd = 1)
x

##  [1] 4.038067 4.707474 5.258788 3.847868 5.195783 5.030124 5.085418 6.116610
##  [9] 3.781143 6.267369

mean(x)

## [1] 4.932864

Diferencias: En las 3 muestras hay pequeñas diferencias en su media muestral pero es una diferencia insignificante en relación a la media poblacional que era de 5.
Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?

p <- rpois(n = 1000, lambda = 1)
p

##    [1] 0 0 0 0 0 2 1 2 1 2 1 1 0 1 0 0 2 0 1 0 0 2 0 1 1 0 0 0 0 2 0 0 2 4 2 2 1
##   [38] 0 0 0 2 0 2 0 2 0 2 1 0 0 2 2 2 3 1 1 0 0 2 2 2 1 1 0 3 2 0 1 1 3 0 0 1 2
##   [75] 2 0 0 0 0 1 2 1 0 1 1 0 0 1 0 0 0 0 0 0 2 1 2 1 0 1 1 2 2 0 1 1 1 1 2 0 0
##  [112] 1 0 0 2 1 0 0 1 1 1 0 1 2 2 0 1 2 1 0 2 0 2 0 1 0 0 0 1 0 3 1 0 2 2 2 2 0
##  [149] 2 1 1 0 1 2 0 1 1 2 0 1 0 0 0 0 0 0 2 0 0 0 1 2 0 1 1 1 2 2 1 0 1 2 0 1 2
##  [186] 1 1 1 2 0 1 1 1 0 0 3 0 0 1 1 0 2 1 1 0 1 3 0 0 0 0 1 1 1 1 2 1 0 1 1 0 1
##  [223] 1 0 1 0 0 4 2 1 0 0 1 1 0 1 0 1 2 3 2 3 1 1 3 1 0 0 1 0 0 1 3 3 0 0 0 0 0
##  [260] 0 0 0 0 1 0 1 1 5 2 1 1 1 0 1 0 1 3 2 1 1 0 0 4 1 1 1 2 1 2 4 1 0 1 1 0 3
##  [297] 0 2 4 1 0 0 2 0 2 1 3 2 3 3 2 1 2 0 0 3 2 0 2 0 1 0 0 1 1 1 0 0 0 2 2 0 4
##  [334] 2 0 1 0 2 0 3 1 0 0 2 1 0 1 1 0 0 0 0 0 0 2 2 4 0 0 0 0 0 0 0 2 1 2 1 4 0
##  [371] 0 2 1 5 1 0 0 2 0 1 0 2 1 1 2 0 0 0 0 1 3 2 0 3 3 1 0 1 0 1 0 0 0 2 2 1 0
##  [408] 0 2 1 0 0 1 1 3 1 3 2 1 2 1 1 3 1 0 1 2 1 0 0 4 1 1 1 1 2 2 0 1 2 0 1 1 0
##  [445] 1 1 0 1 0 2 1 0 0 0 0 1 1 1 1 1 1 2 2 4 1 0 2 0 2 0 2 1 1 1 1 2 1 2 4 1 0
##  [482] 0 2 0 1 1 0 0 3 2 1 0 0 1 0 2 1 1 0 1 3 2 2 1 0 0 0 1 1 0 0 0 0 2 1 1 1 0
##  [519] 2 2 1 0 1 3 0 0 2 2 0 0 1 3 1 0 1 2 2 1 0 1 1 1 1 2 0 1 1 1 3 1 0 2 3 3 1
##  [556] 0 2 2 0 3 2 4 0 2 0 0 1 2 2 0 1 4 0 0 2 2 1 2 2 2 0 1 2 2 0 0 0 0 0 1 6 2
##  [593] 0 2 1 0 1 2 0 1 1 0 2 1 2 0 0 0 0 0 1 0 1 1 0 0 1 0 1 1 0 0 2 2 1 0 1 0 4
##  [630] 1 1 0 0 0 1 1 1 0 0 2 0 2 0 2 1 3 0 2 2 1 3 1 1 0 3 1 1 1 0 2 1 2 4 2 2 1
##  [667] 1 0 1 1 1 1 1 1 3 3 1 4 1 1 0 4 1 1 1 1 1 1 1 2 1 1 0 0 3 1 1 0 1 0 2 1 1
##  [704] 0 0 3 0 0 2 2 4 3 0 2 1 0 3 2 1 0 2 1 0 2 0 0 1 0 0 1 2 0 0 0 0 0 1 1 4 1
##  [741] 0 1 0 0 0 0 0 0 1 1 1 2 0 1 0 0 0 1 0 1 1 1 0 0 1 1 1 0 2 0 0 2 0 0 0 2 1
##  [778] 3 1 0 4 1 2 0 1 2 1 0 1 1 2 2 4 1 1 1 3 2 3 1 0 0 0 0 0 3 1 1 1 2 0 1 3 1
##  [815] 0 0 1 0 0 1 2 3 1 4 1 0 1 0 1 0 0 0 0 2 1 2 3 3 0 2 1 1 0 0 2 1 3 0 0 0 1
##  [852] 1 1 0 1 0 1 1 0 0 1 0 1 1 2 2 0 1 2 1 0 2 0 0 0 0 2 1 4 0 1 1 0 1 1 0 0 1
##  [889] 2 4 0 2 1 1 1 0 5 1 1 1 1 2 1 3 0 1 0 0 4 0 1 1 0 1 2 1 3 1 2 2 2 1 1 0 0
##  [926] 1 1 1 3 2 0 0 2 0 0 1 0 5 0 2 1 0 3 1 2 1 2 0 2 1 0 2 3 1 0 1 0 1 1 2 3 2
##  [963] 0 1 1 0 3 0 0 1 2 0 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 0 1 2 1 0 0 0 1 1 0 1 0
## [1000] 2

Media:

mean(p)

## [1] 1.02

Varianza:

var(p)

## [1] 1.106707

Los datos efectivamente, son parecidos a los valores técnicos.

AI6UC1_7

ElisaVelasquez

29/9/2021

Distribuciones de probabilidad

Ejercicios