Distribuciones Continuas
Variable uniforme continua
Una variable aleatoria continua se dice que sigue una distribución uniforme entre dos valores \(a\) y \(b\) \(x\in U(a,b)\)
si su función de densidad tiene la siguiente expresión:
\[f(x)= \frac{1}{b-a}, \ x\in [a,b]\]
y vale 0 en cualquier otro caso.
\(E(X)=\dfrac{a+b}{2}\)
\(Var(X)=\dfrac{(b-a)^2}{12}\).
La siguiente línea de código, por ejemplo, genera 10 números aleatorios con distribución uniforme entre 0 y 1.
- generemos 10 números aleatorios con la distribución uniforme
=runif(10,0,1)
X X
## [1] 0.9406774 0.2397960 0.2021187 0.4001121 0.9920737 0.1337881 0.8668588
## [8] 0.7928646 0.8432072 0.7641509
library(lattice)
=runif(2000,0,1)
X=data.frame(X)
datoshistogram(~X, data=datos,
col="snow3", dcol="mediumblue",
h=1, type='density',
width=0.05, lwd=2 )
Variable exponencial
Una variable continua \(X\) se dice que sigue una distribución exponencial de parámetro \(\lambda\)(cualquier número real mayor que cero) si su función de densidad es:
\[f(x)= \lambda \cdot e^{-\lambda \cdot x},\ x>0\]
curve(dexp(x, rate = 0.5), xlim = c(0, 4), ylim = c(0, 2),
xlab = "x", ylab = "Función de densidad")
curve(dexp(x, rate = 1), col = "red", lty = 3, add = T)
curve(dexp(x, rate = 2), col = "blue", lty = 4, add = T)
abline(h = 0, col = "gray")
legend("topright", c("Exp(0.5)", "Exp(1)", "Exp(2)"), col = c("black",
"red", "blue"), lty = c(1, 3, 4), bty = "n")
La duración de componentes electrónicos, baterías, células en enfermedades, tienen este tipo de comportamiento: los valores más altos son mucho menos probales que los valores más bajos.
El tiempo de espera, en muchas ocasiones, también sigue una distribución exponencial: tiempo en ser atendidos en una cola en una ventanilla, tiempo entre la llegada de dos taxis a una parada…
La magnitud de los terremotos que se producen en una determinada región sigue, por regla general, una distribución de este tipo.
\(E(X)=\dfrac{1}{\lambda}\)
\(Var(X)=\dfrac{1}{\lambda ^2}.\)
Ejemplo:
El tiempo de revisión del motor de un avión sigue una distribución con media 22 minutos.
- Encontrar la probabilidad de que el tiempo de revisión sea menor a 10 minutos.
pexp(10, 1/22, lower.tail = T)
## [1] 0.3652636
- ¿Cuál es el tiempo de revisión de un motor superado por el 10% de los tiempos de revisión?
qexp(0.1, 1/22,lower.tail = F)
## [1] 50.65687
- El costo de revisión es de 200 unidades monetarias fijas al que se le suma 10 unidades monetarias por el tiempo que dure la revisión. Encontrar la media y la varianza del costo.
Distribución normal
De manera general, una variable aleatoria continua \(X\) se dice que sigue una distribución normal o gaussiana de parámetros
\(\mu\) y \(\sigma\) si su función de densidad es de la forma
\[f(x)=\dfrac{1}{\sigma \sqrt{2\pi }}e^{-\dfrac{(x-\mu )^2}{2\sigma ^{2}}},\ \ -\infty <x<\infty\]
se verifica que
\[E(X)=\int_{-\infty }^{\infty } xf(x)dx = \mu, \ \ \ Var(X)=\int_{-\infty }^{\infty } (x-\mu )^2f(x)dx = \sigma^2\]- Esta variable, cuando se consideran los valores \(\mu=0\)y \(\sigma=\) , se llama Normal estándar o Normal tipificada
Si tenemos una variable \(X\) con media \(\mu\) y desviación típica \(\sigma\) , a partir de ella se puede construir lo que se conoce como variable tipificada o estandarizada
\[Z= \frac{x-\mu}{\sigma}
\] verificándose que esta variable \(Z\) tiene media cero y desviación típica uno.
Ejercicio
\(X\) es una variable normalmente distribuida con una media de \(\mu=30\) y una desviación estándar de \(\sigma=4\) Encontrar
- \(P(x<40)\)
para solucionar este código en R, lo puede realizar de la siguiente manera
library(tigerstats)
pnormGC(40, region="below", mean=30, sd=4 , graph = T)
## [1] 0.9937903
de manera análoga se puede calcular como sigue.
pnorm(q=40, mean=30, sd=4, lower.tail=TRUE)
## [1] 0.9937903
- \(P(x>21)\)
pnormGC(21, region="above", mean=30, sd=4, graph = T)
## [1] 0.9877755
pnorm(q=21, 30, 4, lower.tail = F)
## [1] 0.9877755
- \(P(30<x<35)\)
pnormGC(c(30,35), region = "between", mean=30, sd=4, graph = T )
## [1] 0.3943502
de otra manera sería
\[\begin{align*} P(30<x<35)=P(x<35)-P(x<30) \end{align*}\]
pnorm(35, 30,4, lower.tail = T)- pnorm(30, 30,4, lower.tail = T)
## [1] 0.3943502
- Hallar el valor de \(a\) tal que \(P(x>a)=0.17\)
qnorm(0.17, 30,4, lower.tail = F)
## [1] 33.81666
qnormGC(0.17, region = "above", mean=30, sd=4, graph = T )
## [1] 33.81666
Se ha comprobado que el tiempo que tardan los contribuyentes en diligenciar el formulario para la declaración de renta sigue una distribución normal con media 100 minutos y desviación estándar 30 minutos.
- ¿Cuál es la probabilidad de un contribuyente elegido al azar tarde entre 70 y 130 minutos en diligenciar este formulario?
# Escriba su código
- Halle el valor de \(k\) tal que el 5% de los contribuyentes tarda más de k minutos en diligenciar el formulario.
# Escriba su código
- Se eligen 50000 contribuyentes al azar. ¿Aproximadamente cuántos tardan más de 1 hora en diligenciar el formulario?
# Escriba su código
Teorema del Limite Central
El TLC es uno de los resultados matemáticos de uso más frecuente en la ciencia. Nos dice que cuando el tamaño de la muestra es grande, la media de ${Y} $ de una muestra aleatoria sigue una distribución normal centrada en la media de la población \(μ_Y\) y la desviación estandar es igual a la desviación estandar de la población \(\sigma_Y\) dividido por la raíz cuadrada del tamaño de la muestra N:
Si\(X_1\), \(X_2\), …. \(X_n\) es una secuencia de variables aleatorias independientes con \(E(X)=\mu\) y \(var(X_i)=\sigma^2 < \infty\) , entonces:
\[Z_{n}=\frac{\overline{X}_{n}-\mu }{\frac{\sigma }{\sqrt{n}}} \overset{d}{ \rightarrow } N(0,1)\]
http://163.10.22.82/OAS/teoremacentrallimite/Motivacion.mp4
<-runif(10000,0,1) #variable aleatoria con distribución uniforme
runi
<-NULL
meansfor(i in 1:1000){
<-c(means,mean(sample(runi,size = 100)))
means#calculamos la media para 1000 muestras aleatorias de n=100
}
<-rexp(10000,10) #variable aleatoria con distribución exponencial
rexpon
<-NULL
means2for(i in 1:1000){
<-c(means2,mean(sample(rexpon,size = 100)))
means2#calculamos la media para 1000 muestras aleatorias de n=100
}
par(mfrow=c(1,2))
par(mfrow=c(2,2))
hist(runi)
hist(means)
hist(rexpon)
hist(means2)
Ejemplo
Las bolsas de sal envasadas por una máquina tienen \(\mu =500\) y \(\sigma=35\). Las bolsas se empaquetaron en cajas de 100 unidades.
- Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor que 495.
Distribucion Chi cuadrado
Se escribe variable \(\chi^2\) El hecho de que su función de densidad dependa de un número entero positivo llamado grados de libertad hace que se hable de la distribución \(\chi^2_n\) con \(n\) grados de libertad. Así, existe una variable para cada valor de \(n\) mayor o igual a 1. Esta variable aparece cuando se suman
\(n\) variables aleatorias independientes con distribución
\(N(0,1)\), elevadas al cuadrado.
\[\chi _{k}^{2}=X_{1}^{2}+X_{2}^{2}+...+X_{k}^{2}, \ \text{con} \ X_{i} \in N \left( 0,1 \right).\]
Esta distribución es necesaria para la construcción de intervalos de confianza y la realización de muchos contrastes de hipótesis.
curve(dchisq(x, df = 1), xlim = c(0, 20), ylim = c(0, 0.2),
xlab = "x", ylab = "Función de densidad")
curve(dchisq(x, df = 2), col = "red", lty = 2, add = T)
curve(dchisq(x, df = 4), col = "blue", lty = 3, add = T)
curve(dchisq(x, df = 10), col = "green", lty = 4, add = T)
curve(dchisq(x, df = 20), col = "magenta", lty = 5, add = T)
abline(h = 0, col = "gray")
legend("topright", c("1", "2", "4", "10", "20"), col = c("black",
"red", "blue", "green", "magenta"), lty = c(1, 2, 3,
4, 5), bty = "n")
Considere una variable aleatoria X con distribución \(\chi^2\) de 16 grados de libertad ¿Cual es la probabilidad de que
- X sea mayor que 32?
pchisqGC(32 , region = "above", df=16, graph = T)
## [1] 0.009999781
pchisq(32,df=16, lower.tail = F)
## [1] 0.009999781
- X este entre 20.47 y 36.46 ? `
pchisqGC(20.47 , region = "above", df=16, graph = T)
## [1] 0.1997938
Identifique el cuantil y calcule las probalilidades a derecha.
\(\chi^2_{(8), 0.3}\)
\(\chi^2_{(13), 0.15}\)
sean \(X_1,\dots,X_n\) una muestra aleatoria proveniente de una población con distribución $ N(,^{2})$ donde \(\mu\) y \(\sigma^2\) son desconocidos.
Se tiene que
\[\frac{(n-1)S^{2}}{\sigma^{2}} \sim \chi_{n-1}^{2}\]