En R, cada districbucón de probabilidad se nombrea mediante la palabra clave o alias. las palabras clave para las distribuciones mas importantes son:
\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado}& \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probablidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probablidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribucion exponencial
curve(dexp(x), from = 0, to = 10)
# Representa la densidad de una exponencial de media 1 entre 0 y 10
Distribución binomial
x <- rbinom(20, 1, 0.5)
x
## [1] 1 0 1 0 1 0 0 1 1 1 0 0 0 1 0 0 1 0 1 0
# Genera 20 observaciones con distribucion B(1,0.5)
Contanto exitos vs fracasos
table(x)
## x
## 0 1
## 11 9
e.g.. Distribucion normal
Sí \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que x sea menor que 3.5 se caclula en R de esta forma:
pnorm(3.5, mean=3,sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7,sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x<-rnorm(100, mean=10, sd=1)
x
## [1] 9.004644 9.169440 10.950453 9.338444 9.512810 12.378785 10.670741
## [8] 9.682375 8.725685 9.760797 10.205833 10.429115 9.401057 9.800681
## [15] 9.571898 9.601717 10.878911 11.023409 10.569820 10.028183 9.017949
## [22] 8.849892 9.212943 9.279011 10.713337 11.163617 9.948616 9.612414
## [29] 9.813209 10.750480 10.232519 10.467971 9.633242 8.301137 10.139367
## [36] 11.599784 9.876501 9.723944 10.955423 9.367010 8.960245 8.864221
## [43] 11.072346 9.204014 10.410704 7.683666 8.553229 10.377055 10.670825
## [50] 10.221925 11.124104 8.353861 9.071340 10.134982 9.632077 9.877525
## [57] 6.008628 9.579801 9.315691 10.059880 9.442904 11.349426 10.699170
## [64] 9.478226 12.395568 10.542455 9.137530 9.253641 8.637139 9.380452
## [71] 10.345598 9.710604 10.378544 10.123386 9.024892 9.591497 10.119474
## [78] 9.636552 9.863376 10.404091 11.523775 9.036227 11.060415 8.875771
## [85] 10.753167 11.543768 10.703760 10.917658 9.540275 10.662710 9.059867
## [92] 8.999961 9.946417 10.472041 8.020493 10.498303 10.036707 10.453562
## [99] 10.159828 11.508950
mean(x)
## [1] 9.918275
hist(x)
boxplot(x)
hist(x,freq = FALSE)
#Freq = FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)
#densidad normal
1.- Si Z es una variable con distribución normal estándar, calcula P(−2.34<Z<4.78).
pnorm(4.78, mean = 0, sd = 1) - pnorm(-2.34, mean = 0, sd = 1)
## [1] 0.9903573
2.- Calcula el rango intercuartílico de una población normal estándar.
pob <- c(1,1,2,2,5,5,7,7,8,8,9,9)
s <- summary(pob)
s
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 2.000 6.000 5.333 8.000 9.000
rango <- as.numeric(substr(s[5],1,7)) - as.numeric(substr(s[2],1,7))
rango
## [1] 6
3.- Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
set.seed(1)
x <- rnorm(10, mean = 5, sd = 1)
x
## [1] 4.373546 5.183643 4.164371 6.595281 5.329508 4.179532 5.487429 5.738325
## [9] 5.575781 4.694612
mean(x)
## [1] 5.132203
set.seed(2)
x <- rnorm(10, mean = 5, sd = 1)
x
## [1] 4.103085 5.184849 6.587845 3.869624 4.919748 5.132420 5.707955 4.760302
## [9] 6.984474 4.861213
mean(x)
## [1] 5.211152
set.seed(3)
x <- rnorm(10, mean = 5, sd = 1)
x
## [1] 4.038067 4.707474 5.258788 3.847868 5.195783 5.030124 5.085418 6.116610
## [9] 3.781143 6.267369
mean(x)
## [1] 4.932864
Diferencias: En las 3 muestras hay pequeñas diferencias en su media muestral pero es una diferencia insignificante en relación a la media poblacional que era de 5.
Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
p <- rpois(n = 1000, lambda = 1)
p
## [1] 0 0 0 0 0 2 1 2 1 2 1 1 0 1 0 0 2 0 1 0 0 2 0 1 1 0 0 0 0 2 0 0 2 4 2 2 1
## [38] 0 0 0 2 0 2 0 2 0 2 1 0 0 2 2 2 3 1 1 0 0 2 2 2 1 1 0 3 2 0 1 1 3 0 0 1 2
## [75] 2 0 0 0 0 1 2 1 0 1 1 0 0 1 0 0 0 0 0 0 2 1 2 1 0 1 1 2 2 0 1 1 1 1 2 0 0
## [112] 1 0 0 2 1 0 0 1 1 1 0 1 2 2 0 1 2 1 0 2 0 2 0 1 0 0 0 1 0 3 1 0 2 2 2 2 0
## [149] 2 1 1 0 1 2 0 1 1 2 0 1 0 0 0 0 0 0 2 0 0 0 1 2 0 1 1 1 2 2 1 0 1 2 0 1 2
## [186] 1 1 1 2 0 1 1 1 0 0 3 0 0 1 1 0 2 1 1 0 1 3 0 0 0 0 1 1 1 1 2 1 0 1 1 0 1
## [223] 1 0 1 0 0 4 2 1 0 0 1 1 0 1 0 1 2 3 2 3 1 1 3 1 0 0 1 0 0 1 3 3 0 0 0 0 0
## [260] 0 0 0 0 1 0 1 1 5 2 1 1 1 0 1 0 1 3 2 1 1 0 0 4 1 1 1 2 1 2 4 1 0 1 1 0 3
## [297] 0 2 4 1 0 0 2 0 2 1 3 2 3 3 2 1 2 0 0 3 2 0 2 0 1 0 0 1 1 1 0 0 0 2 2 0 4
## [334] 2 0 1 0 2 0 3 1 0 0 2 1 0 1 1 0 0 0 0 0 0 2 2 4 0 0 0 0 0 0 0 2 1 2 1 4 0
## [371] 0 2 1 5 1 0 0 2 0 1 0 2 1 1 2 0 0 0 0 1 3 2 0 3 3 1 0 1 0 1 0 0 0 2 2 1 0
## [408] 0 2 1 0 0 1 1 3 1 3 2 1 2 1 1 3 1 0 1 2 1 0 0 4 1 1 1 1 2 2 0 1 2 0 1 1 0
## [445] 1 1 0 1 0 2 1 0 0 0 0 1 1 1 1 1 1 2 2 4 1 0 2 0 2 0 2 1 1 1 1 2 1 2 4 1 0
## [482] 0 2 0 1 1 0 0 3 2 1 0 0 1 0 2 1 1 0 1 3 2 2 1 0 0 0 1 1 0 0 0 0 2 1 1 1 0
## [519] 2 2 1 0 1 3 0 0 2 2 0 0 1 3 1 0 1 2 2 1 0 1 1 1 1 2 0 1 1 1 3 1 0 2 3 3 1
## [556] 0 2 2 0 3 2 4 0 2 0 0 1 2 2 0 1 4 0 0 2 2 1 2 2 2 0 1 2 2 0 0 0 0 0 1 6 2
## [593] 0 2 1 0 1 2 0 1 1 0 2 1 2 0 0 0 0 0 1 0 1 1 0 0 1 0 1 1 0 0 2 2 1 0 1 0 4
## [630] 1 1 0 0 0 1 1 1 0 0 2 0 2 0 2 1 3 0 2 2 1 3 1 1 0 3 1 1 1 0 2 1 2 4 2 2 1
## [667] 1 0 1 1 1 1 1 1 3 3 1 4 1 1 0 4 1 1 1 1 1 1 1 2 1 1 0 0 3 1 1 0 1 0 2 1 1
## [704] 0 0 3 0 0 2 2 4 3 0 2 1 0 3 2 1 0 2 1 0 2 0 0 1 0 0 1 2 0 0 0 0 0 1 1 4 1
## [741] 0 1 0 0 0 0 0 0 1 1 1 2 0 1 0 0 0 1 0 1 1 1 0 0 1 1 1 0 2 0 0 2 0 0 0 2 1
## [778] 3 1 0 4 1 2 0 1 2 1 0 1 1 2 2 4 1 1 1 3 2 3 1 0 0 0 0 0 3 1 1 1 2 0 1 3 1
## [815] 0 0 1 0 0 1 2 3 1 4 1 0 1 0 1 0 0 0 0 2 1 2 3 3 0 2 1 1 0 0 2 1 3 0 0 0 1
## [852] 1 1 0 1 0 1 1 0 0 1 0 1 1 2 2 0 1 2 1 0 2 0 0 0 0 2 1 4 0 1 1 0 1 1 0 0 1
## [889] 2 4 0 2 1 1 1 0 5 1 1 1 1 2 1 3 0 1 0 0 4 0 1 1 0 1 2 1 3 1 2 2 2 1 1 0 0
## [926] 1 1 1 3 2 0 0 2 0 0 1 0 5 0 2 1 0 3 1 2 1 2 0 2 1 0 2 3 1 0 1 0 1 1 2 3 2
## [963] 0 1 1 0 3 0 0 1 2 0 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 0 1 2 1 0 0 0 1 1 0 1 0
## [1000] 2
mean(p)
## [1] 1.02
var(p)
## [1] 1.106707
Los datos efectivamente, son parecidos a los valores técnicos.