1.- Aleatoria: Resultados que se presentan al azar en cualquier evento o experimento.
2.- Variable aleatoria discreta: Aqui se toman solamente ciertos valores en y son principalmente del conteo realizado. integer
Es una distribución muy utilizada y funciona generalmente para variables continuas.
\[ P<48 \]
Tomando en cuanta que la media y la varianza es 50 y 25 respectivamente.
Para esto usaremos la funcion de distribucion de probabilidad.
pnorm(48, mean = 50, sd = sqrt(25), lower.tail = TRUE) # lower.tail = TRUE es usado para calcular P desde 48 para abajo
## [1] 0.3445783
Entonces es 34% probable que tengamos un valor menor a 48.
Ahora, cual es la probabilidad de que obtengamos un valor MAYOR a 48
pnorm(48, mean = 50, sd = sqrt(25), lower.tail = FALSE) # lower.tail = FALSE es usado para calcular P desde 48 para arriba
## [1] 0.6554217
La prbabilidad de que obtengamos un valor MAYOR a 48 es de 65.5%
Nos dice de que manera se comportan las frecuencias
En R, cada districbucón de probabilidad se nombrea mediante la palabra clave o alias. las palabras clave para las distribuciones mas importantes son:
\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text {calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text {calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text {calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text {Genera datos aleatorios según una distribucion especifica} & \text{---}\\ \hline \end{array} \]
Distribucion exponencial
curve(dexp(x), from = 0, to = 10) #representa la densidad de una exponencial de media 1 entre 0 y 10
Distribución binomial
#Generador de numeros aleatorios dentro de una distribución espefica y con numeros especificos a los que se va a ajustar
x <- rbinom(20, 1, 0.5)
x
## [1] 1 0 0 1 0 1 1 1 0 0 1 0 0 1 1 1 0 1 0 1
#Genera 20 observaciones con distribución B(1, 0.5)
Contando exitos vs Fracasos
table(x)
## x
## 0 1
## 9 11
Ejemplo: Distribución Normal
si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación tipica es 0.5, la prbabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean = 3, sd = 0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las formulas para intervalos y contrastes se obtiene del comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean = 10, sd = 1)
x
## [1] 10.225234 11.429440 8.042812 10.761611 9.389472 10.869378 8.374946
## [8] 7.375305 11.936467 10.031472 11.180058 10.770682 11.383807 9.794828
## [15] 9.493407 10.300844 8.868594 10.983062 9.904772 10.761126 8.944195
## [22] 9.372657 8.632095 9.009886 9.124793 10.116817 11.275345 9.825686
## [29] 9.729796 9.932211 8.681548 9.037251 9.706542 11.067142 9.239758
## [36] 10.114853 9.750616 10.238091 10.911837 9.682877 11.334539 11.455785
## [43] 10.186292 10.664500 9.425774 9.179693 11.160491 12.584428 11.976873
## [50] 9.587667 11.094396 10.217323 11.163959 10.225755 9.632683 8.619597
## [57] 9.739853 10.249338 10.487464 10.532929 9.706781 11.362865 9.156975
## [64] 9.028532 11.085097 10.617391 8.856395 9.345653 11.274723 11.681235
## [71] 10.226641 9.988548 10.893094 10.246682 11.539054 11.288099 9.592725
## [78] 9.859841 10.036633 9.824194 8.796759 10.974680 8.299689 12.315949
## [85] 10.615535 10.066643 9.376458 9.032370 9.920461 9.868654 11.068098
## [92] 9.949601 8.765323 9.630908 9.908933 9.543509 11.378024 10.905234
## [99] 9.463962 10.705556
mean(x)
## [1] 10.11988
hist(x)
boxplot(x)
# Si salen puntos son valores atipicos
hist(x, freq = FALSE) #freq = false, para que el area del histograma sea 1, es decir, normalizarla
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE) #add = TRUE, esto empalmara 2 graficas
P = (pnorm(4.78, mean = 0, sd = 1) - pnorm( −2.34, mean = 0, sd = 1))
P
## [1] 0.9903573
\[P = \{0.9903573\}\]
pob <- c(1,1,4,4,5,5,6,6,6,6,7,8,8,9)
summary(pob)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 4.250 6.000 5.429 6.750 9.000
\[ IQR = {3erQ−1erQ}\]
Por lo tanto :
\[ IQR = \{6.75 − 4.25\} = 2.5\]
x <- rnorm(19, mean=5, sd=1)
x
## [1] 3.523011 3.667334 3.988118 5.115116 5.108470 5.250974 5.382697 3.488845
## [9] 3.522733 3.776621 2.507250 4.043480 6.012519 4.197631 4.394019 4.019880
## [17] 6.474068 4.736559 4.409990
y <- rnorm(19, mean=5, sd=1)
y
## [1] 3.954841 6.789272 5.283216 5.424829 4.031643 5.944237 5.149128 4.570490
## [9] 5.095308 4.556795 3.983747 4.336350 2.536782 4.140211 6.583554 6.237206
## [17] 6.150069 6.092763 5.039582
z <- rnorm(19, mean=5, sd=1)
z
## [1] 4.870631 7.344857 4.687309 5.604565 4.365520 4.699320 4.120246 5.482250
## [9] 4.567355 5.166026 3.589368 6.010327 4.675618 5.120013 5.912455 4.601111
## [17] 4.178444 4.794807 6.296796
Poiss <- rpois(1000, 1)
Poiss
## [1] 0 0 0 0 0 0 0 1 1 0 0 1 3 3 1 0 0 1 0 1 0 2 1 1 0 0 1 0 0 1 0 0 2 1 3 0 0
## [38] 1 2 1 0 3 0 1 1 1 0 5 0 2 0 2 0 0 0 1 0 0 1 1 3 1 0 0 1 2 0 0 0 0 0 1 1 0
## [75] 3 1 0 1 0 3 1 1 1 1 1 0 1 1 2 0 1 1 1 2 2 2 0 1 0 0 2 1 0 2 0 0 1 1 1 1 1
## [112] 0 1 1 2 1 0 0 0 0 0 1 0 3 1 1 1 1 1 0 1 1 0 2 2 1 0 0 1 2 0 2 1 0 1 2 1 1
## [149] 2 0 2 2 1 1 1 0 2 1 0 1 4 3 0 1 0 0 0 0 0 1 2 0 1 1 2 1 1 0 0 1 2 3 1 1 0
## [186] 3 0 1 1 3 2 0 0 1 0 1 0 2 2 0 1 1 1 0 0 2 0 0 3 0 2 2 1 1 0 1 1 1 1 2 2 3
## [223] 1 2 3 0 3 0 2 1 0 1 1 0 1 0 0 0 1 1 1 1 0 5 2 1 0 3 4 3 3 1 3 1 2 0 0 1 0
## [260] 1 0 3 1 2 1 0 2 4 1 1 1 0 0 0 3 0 1 0 0 3 1 2 1 0 2 1 0 1 0 0 1 1 0 2 1 1
## [297] 1 1 1 0 0 0 0 0 1 0 4 0 1 1 1 1 1 1 2 2 1 5 1 1 0 1 1 2 1 2 0 0 1 1 1 2 2
## [334] 3 0 0 0 0 0 1 0 0 1 1 0 3 2 3 0 0 1 0 1 1 0 1 1 0 1 0 2 0 2 1 1 1 0 1 0 2
## [371] 2 0 2 0 2 1 3 0 2 1 1 0 2 0 2 4 1 1 1 1 0 2 2 1 1 0 0 1 0 0 1 1 0 1 0 2 3
## [408] 1 1 4 0 0 2 1 2 2 1 1 1 5 1 3 2 0 1 2 2 4 0 0 1 0 1 3 2 1 0 2 0 0 0 1 2 3
## [445] 1 1 1 0 2 1 0 0 1 0 0 0 1 2 0 0 1 0 1 0 0 1 1 0 3 1 0 1 1 0 1 0 1 2 3 1 2
## [482] 0 1 2 1 0 1 1 3 0 1 0 0 2 1 2 2 1 1 0 0 0 1 1 1 1 0 0 2 1 0 1 2 0 3 2 1 2
## [519] 0 0 0 2 0 2 0 1 0 0 1 0 0 1 0 1 0 2 0 0 0 0 1 1 0 1 2 0 3 0 3 1 1 0 0 0 1
## [556] 2 0 1 3 4 3 1 2 1 0 0 1 3 0 1 1 1 2 0 2 1 0 0 2 2 2 0 0 2 1 1 0 1 1 1 0 3
## [593] 0 0 2 1 1 0 2 2 0 1 2 1 0 3 1 2 2 0 2 1 0 0 1 0 1 1 1 0 0 0 2 1 0 0 0 0 6
## [630] 1 0 0 0 1 1 0 1 1 1 1 2 1 2 2 0 2 0 2 0 1 1 0 0 0 0 3 0 0 0 4 1 0 0 1 3 1
## [667] 2 2 0 2 2 1 0 0 3 1 2 0 1 0 2 1 1 0 1 0 3 2 0 1 0 0 1 1 2 1 1 0 1 0 1 1 1
## [704] 0 0 2 3 1 2 1 0 4 2 0 1 2 1 1 0 1 1 3 0 3 1 1 1 0 2 2 0 2 1 0 0 2 0 4 1 0
## [741] 1 0 1 0 0 1 1 0 1 1 0 1 2 1 0 1 1 2 2 0 1 2 1 1 1 0 1 2 2 2 1 0 2 1 0 1 2
## [778] 2 1 1 0 1 1 3 0 0 1 0 1 0 1 2 1 4 1 0 4 0 0 0 1 0 4 1 3 0 1 1 3 0 0 0 0 0
## [815] 0 0 2 0 0 1 1 1 0 0 2 1 1 1 1 0 0 0 2 0 0 1 0 2 1 0 0 0 1 1 1 1 0 2 1 1 1
## [852] 3 0 0 0 1 1 3 2 2 1 1 2 1 0 0 1 0 0 1 0 1 0 2 1 0 1 0 0 1 1 3 4 0 0 1 0 2
## [889] 0 0 1 0 0 1 0 0 0 0 1 0 3 0 2 0 0 1 2 1 0 1 4 2 2 1 1 0 0 2 1 0 1 0 0 1 1
## [926] 0 2 1 0 2 0 0 0 0 1 2 1 0 1 0 1 1 2 1 4 3 1 0 3 1 1 1 0 2 0 1 1 1 0 1 1 2
## [963] 2 1 2 2 3 1 0 1 0 1 0 0 1 1 2 5 2 1 0 3 1 0 0 1 0 0 1 1 2 2 1 1 1 0 0 0 1
## [1000] 0
mean(Poiss)
## [1] 0.982
var(Poiss)
## [1] 1.036713
hist(Poiss, xlab = "Distribucion de Poisson", main = paste("Histograma de Poisson"))
Conclusión Para concluir con este tema en la distribución de probabilidad es una función que asigna a cada suceso sobre la variable la probabilidad de que dicho suceso ocurra, esto se puede ver a traves de las graficas, empalmando las graficas dando información mas o menos clara sobre como se pueden comportar las variables en su frecuencia aleatoria, esto nos sirve para saber como esperar vagamente como se comporten los resultados y saber cuando es mas frecuente la variable.