El recorrido de \(X\) es \(\{0,1,2,3,4,5,6\}\). Además, teniendo en cuenta que \(f_X(x) = F_X(x) - F_X(x^-)\), donde \(x^-\) es el valor de la variable inmediatamente anterior a \(x\), se tiene que \[\begin{align} f_X(0) &= F_X(0) = 0.06 \\ f_X(1) &= F_X(1) - F_X(0) = 0.19-0.06 = 0.13\\ f_X(2) &= F_X(2) - F_X(1) = 0.39-0.19 = 0.20\\ f_X(3) &= F_X(3) - F_X(2) = 0.67-0.39 = 0.28\\ f_X(4) &= F_X(4) - F_X(3) = 0.92-0.67 = 0.25\\ f_X(5) &= F_X(5) - F_X(4) = 0.97-0.92 = 0.05\\ f_X(6) &= F_X(6) - F_X(5) = 1.00-0.97 = 0.03\\ \end{align}\] Observe que, \[ \sum_k f_X(x_k) = f_X(0)+f_X(1)+\ldots+f_X(6) = 0.06+0.13+\ldots+0.03 = 1 \]
# f.m.p
fx <- c(0.06,0.13,0.20,0.28,0.25,0.05,0.03)
sum(fx)
## [1] 1
A contiuación se presentan los gráficos correspondientes:
# recorrido de X
x <- 0:6
# f.m.p.
fx <- c(0.06,0.13,0.20,0.28,0.25,0.05,0.03)
# f.d.a.
Fx <- cumsum(fx)
# gráficos
par(mfrow = c(1,2))
# f.m.p
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 16, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")
# f.d.a.
plot(x = c(0, x), y = c(0, Fx), type = "s", xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)
points(x, Fx, col = "blue", pch = 16)
\[ Pr(X=2) = f_X(2) = F_X(2) - F_X(1) = 0.39-0.19 = 0.20 \] \[ Pr(X>3) = 1 - Pr(X\leq 3) = 1 - F_X(3) = 1 - 0.67 = 0.33 \] \[ P(2\leq X\leq 5) = F_X(5)-F_X(1) = 0.97 - 0.19 = 0.78 \]
Dado que \(X\) es una v.a.d., se tiene que \[ \mu_X = \sum_k x_k f_X(x_k) = 0*f_X(0) + 1*f_X(1)+\ldots+6*f_X(6) = 0*0.06+1*0.13+\ldots+6*0.03=2.8 \]
# recorrido de X
x <- 0:6
# f.m.p.
fx <- c(0.06,0.13,0.20,0.28,0.25,0.05,0.03)
# valor esperado
sum(x*fx)
## [1] 2.8
Por lo tanto, el número esperado (media) del número de defectos importantes en un artículo seleccionado al azar es 2.8.
Primero, se calcula la varianza de \(X\), \[ \sigma^2_X = E(X^2) - (E(X))^2 = E(X^2) - 2.8^2 \] donde \[ E(X^2)=\sum_k x_k^2 f_X(x_k) = 0^2*f_X(0) + 1^2*f_X(1)+\ldots+6^2*f_X(6) = 0^2*0.06+1^2*0.13+\ldots+6^2*0.03=9.78 \] Por lo tanto, la varianza de \(X\) es \[ \sigma^2_X = E(X^2) - (E(X))^2 = 9.78 - 2.8^2 = 1.94. \] Así, el coeficiente de variación de \(X\) está dado por \[ CV(X)=100*\frac{\sqrt{\sigma^2_X}}{\mu_X}=49.74\% \] Como el coeficiente de variación de \(X\) es 49.74%, entonces la variabilidad del número de defectos importantes es alta respecto al valor esperado.
# recorrido de X
x <- 0:6
# f.m.p.
fx <- c(0.06,0.13,0.20,0.28,0.25,0.05,0.03)
# valor esperado
EX <- sum(x*fx)
EX
## [1] 2.8
# valor esperado de X^2
EX2 <- sum(x^2*fx)
EX2
## [1] 9.78
# varianza
VAR <- EX2 - EX^2
VAR
## [1] 1.94
# coeficiente de variacion
sqrt(VAR)/EX*100
## [1] 49.74424
Se tiene que la constante \(k\) es tal que \(k > 0\) dado que \((7-x)^2 > 0\) para todo \(x\in (5,7)\). Además, para que \(f_X(x)\) sea una f.d.p. auténtica se tiene que satisfacer que \(\int_{-\infty}^\infty f_X(x)\,\text{d}x = 1\). Por lo tanto, \[\begin{align*} \int_{-\infty}^\infty f_X(x)\,\text{d}x &= 1\\ \int_{5}^7 k\,(7-x)^2\,\text{d}x &= 1\\ k\,\int_{5}^7 (7-x)^2\,\text{d}x &= 1\\ k* \left(-\frac{(7-x)^3}{3}\Big|_5^7\right) &= 1\\ k*\left(\left[-\frac{(7-7)^3}{3}\right]-\left[-\frac{(7-5)^3}{3}\right]\right)&= 1\\ k*\left(0+\frac{8}{3}\right)&= 1\\ k&= \frac{3}{8} \end{align*}\] Así, la f.d.p. de \(X\) es \[ f_X(x) = \begin{cases} \frac{3}{8}\,(7-x)^2 \,,\,\,\, 5 < x < 7; \\ 0 \,,\,\,\, \text{en otro caso}; \\ \end{cases} \] b. Obtener una fórmula general para la función de distribución acumulada \(F_X(x)\).
Como \(X\) es una v.a.c., en este caso se tiene que para \(x\in(5,7)\), \[ F_X(x)=Pr(X\leq x) = \int_{-\infty}^x f_X(t)\,\text{d}t = \int_{5}^x \frac{3}{8}\,(7-t)^2\,\text{d}t \] y así \[\begin{align*} F_X(x) &= \int_{5}^x \frac{3}{8}\,(7-t)^2\,\text{d}t \\ &=\frac{3}{8} \int_{5}^x \,(7-t)^2\,\text{d}t \\ &=\frac{3}{8} * -\frac{(7-t)^3}{3} \Big|_5^x \\ &=\frac{3}{8}*\left(\left[-\frac{(7-x)^3}{3}\right]-\left[-\frac{(7-5)^3}{3}\right]\right)\\ &=\frac{3}{8}*\left(-\frac{(7-x)^3}{3}+\frac{8}{3}\right)\\ &=-\frac{(7-x)^3}{8}+1\\ \end{align*}\] y por lo tanto, la f.d.a. es: \[ F_X(x) = \begin{cases} 0 \,,\,\,\, x \leq 5; \\ 1-\frac{1}{8}(7-x)^3 \,,\,\,\, 5 < x < 7; \\ 1 \,,\,\,\, x \geq 7; \\ \end{cases} \] c. Graficar \(f_X(x)\) y \(F_X(x)\).
A continuación se presentan los gráficos correspondientes en el recorrido \((5,7)\):
# f.d.p.
ff <- function(x) (3/8)*(7-x)^2
# f.d.a.
FF <- function(x) 1 - (1/8)*(7-x)^3
# grafico
par(mfrow = c(1,2))
# f.m.p
curve(expr = ff, from = 5, to = 7, col = "red", lwd = 2, main = "f.d.p.", ylab = "f(x)")
# f.d.a.
curve(expr = FF, from = 5, to = 7, col = "blue", lwd = 2, main = "f.d.a.", ylab = "F(x)")
\[ Pr(X=6) = \int_6^6 \frac{3}{8}\,(7-x)^2 \,\text{d}x = 0 \] \[ Pr(X>6) = 1-Pr(X\leq6)=1-F_X(6) = 1-\left[ 1-\frac{1}{8}(7-6)^3 \right] = \frac{1}{8} = 0.125 \] \[ P(5.5\leq X\leq 6.5) = F_X(6.5)-F_X(5.5) = \left[ 1-\frac{1}{8}(7-6.5)^3 \right] - \left[ 1-\frac{1}{8}(7-5.5)^3 \right] = \frac{1}{8}\left( 1.5^3-0.5^3 \right)=0.40625. \]
Se necesita encontrar \(x\) tal que \(F_X(x) = 0.5\). Así, \[\begin{align*} F_X(x) &= 0.5\\ 1-\frac{1}{8}(7-x)^3 &= 0.5\\ \frac{1}{8}(7-x)^3 &= 0.5\\ (7-x) &= (8*0.5)^{\frac13}\\ x &= 7-(8*0.5)^{\frac13} \end{align*}\] Por lo tanto, \(x=5.41\), y así, el valor del pH del agua es de lo más 5.41 el 50% de las mediciones.
7-(8*0.5)^(1/3)
## [1] 5.412599
Como \(X\) es una v.a.c., entonces \[ \mu_X=\int_{-\infty}^\infty x f_X(x)\,\text{d}x=\int_{5}^7 x * \frac{3}{8}\,(7-x)^2 \,\text{d}x = 5.5 \]
Por lo tanto, el valor esperado (media) del pH del agua es 5.5.
f <- function(x) x*(3/8)*(7-x)^2
integrate(f, lower = 5, upper = 7)
## 5.5 with absolute error < 6.1e-14
Primero, se calcula la varianza de \(X\), \[ \sigma^2_X = E(X^2) - (E(X))^2 = E(X^2) - 5.5^2 \] donde \[ E(X^2)=\int_{-\infty}^\infty x^2 f_X(x_k)\,\text{d}x = \int_{5}^7 x^2 * \frac{3}{8}\,(7-x)^2\,\text{d}x = 30.4 \] Por lo tanto, la varianza de \(X\) es \[ \sigma^2_X = E(X^2) - (E(X))^2 = 30.4 - 5.5^2 = 0.15. \] Así, el coeficiente de variación de \(X\) está dado por \[ CV(X)=100*\frac{\sqrt{\sigma^2_X}}{\mu_X}=7.04\% \] Como el coeficiente de variación de \(X\) es 7.04%, entonces la variabilidad del pH del agua es moderada respecto al valor esperado.
# recorrido de X
# f.m.p.
f <- function(x) x^2*(3/8)*(7-x)^2
integrate(f, lower = 5, upper = 7)
## 30.4 with absolute error < 3.4e-13
# valor esperado
EX <- 5.5
EX
## [1] 5.5
# valor esperado de X^2
EX2 <- 30.4
EX2
## [1] 30.4
# varianza
VAR <- EX2 - EX^2
VAR
## [1] 0.15
# coeficiente de variacion
sqrt(VAR)/EX*100
## [1] 7.041788
Sea \(Y\) la v.a. que represeta la variable \(X\) disminuida 10%, es decir, \(Y=X-0.1X=0.9X\). Así, se tiene que: \[ E(Y) = E(0.9*X)=0.9*E(X)=0.9*5.5=4.95 \] y \[ CV(Y)=\frac{\sqrt{Var(Y)}}{E(Y)}=\frac{\sqrt{Var(0.9*X)}}{E(0.9*X)} = \frac{\sqrt{0.9^2*Var(X)}}{0.9*E(X)} = \frac{0.9*\sqrt{Var(X)}}{0.9*E(X)} = CV(X)=7.04\% \]
La variable aleatoria de estudio \(X\) es “el porcentaje de individuos de una ciudad a favor de una medida económica”. Además, el rango de \(X\) es \((0,1)\).
Dado que \(\theta>0\) entonces \(\theta x^{\theta-1}\) para todo \(x\) en \((0,1)\). Además, se tiene que \(\int_{-\infty}^\infty f(x) dx = 1\) dado que: \[ \int_{-\infty}^\infty f(x) dx = \int_{0}^1 \theta x^{\theta-1} dx = x^\theta \Big|_{0}^= 1^\theta - 0^\theta = 1 - 0 = 1. \] c. Graficar la f.d.p. de \(X\) para \(\theta\in\{1/3, 1/2, 1, 2, 3\}\).
f <- function(x, theta) theta*x^(theta-1)
curve(expr = f(x, theta = 1/3), from = 0, to = 1, xlab = "x", ylab = "f(x)", main = "", col = 1)
curve(expr = f(x, theta = 1/2), col = 2, add = T)
curve(expr = f(x, theta = 1), col = 3, add = T)
curve(expr = f(x, theta = 2), col = 4, add = T)
curve(expr = f(x, theta = 3), col = 5, add = T)
legend("topright", legend = c("1/3","1/2","1","2","3"), col = 1:5, fill = 1:5, border = 1:5, bty = "n")
\[ E(X) = \int_0^1 x*\theta x^{\theta-1}dx = \int_0^1 \theta x^{\theta} = \theta\frac{x^{\theta+1}}{\theta+1}\Big|_0^1= \frac{\theta}{\theta+1} \] e. Encontrar una expresión general para la varianza de \(X\). \[ Var(X) = E(X^2) - E(X)^2 = E(X^2) - \left[ \frac{\theta}{\theta+1} \right]^2 \] Además, \[ E(X^2) = \int_0^1 x^2*\theta x^{\theta-1}dx = \int_0^1 \theta x^{\theta+1}dx = \theta\frac{x^{\theta+2}}{\theta+2}\Big|_0^1= \frac{\theta}{\theta+2} \] Por lo tanto, \[ Var(X) = \left[ \frac{\theta}{\theta+2} \right] - \left[ \frac{\theta}{\theta+1} \right]^2 = \frac{\theta}{(\theta+1)^2(\theta+2)} \]
\[ CV(X) = \Big|\frac{\sigma_X}{\mu_X} \Big | = \frac{\sqrt{ \frac{\theta}{(\theta+1)^2(\theta+2)} }}{ \frac{\theta}{\theta+1} } = \frac{1}{\sqrt{\theta(\theta+2)}} \]
\[ F_X(x) = \int_{-\infty}^x f_X(u)du = \int_{0}^x \theta u^{\theta-1} du = u^{\theta}\Big|_{u=0}^{u=x} = x^\theta \]
Por lo tanto, \[ f_X(x) = \left\{ \begin{array}{ll} 0, & \hbox{si $x \leq 0$} \\ x^{\theta}, & \hbox{si $0<x<1$;} \\ 1, & \hbox{si $x \geq 1$} \end{array} \right. \]
La mediana \(\pi_{50}\) es tal que \(F_X(\pi_{50}) = 0.5\) y por lo tanto \[ \pi_{50}^\theta = 0.5 \] de donde \(\pi_{50} = 0.5^{1/\theta}\).