Considera las siguientes matrices de covarianzas de un vector aleatorio X. Obtener la matriz de coeficiente de correlaciones para cada caso. Después, interpreta los valores obtenidos.
#matriz de covarianzas
matA <- matrix(c(4,3,-2,3,6,2,-2,2,5), nrow = 3, byrow = TRUE)
# Obtener la diagonal de la matriz de covarianzas que viene siendo las varianzas de cada variable
StdDiagA <- sqrt(diag(matA))
# Estandarizar la diagonal de varianzas, es decir las desviaciones estandar de cada variable o matriz V12
V12matA <- matrix(c(StdDiagA[1],0,0,0,StdDiagA[2],0,0,0,StdDiagA[3]), nrow = 3, byrow = TRUE)
#obtener inversa de la matriz V1/2
InvV12matA <- solve(V12matA)
CorrA <- InvV12matA %*% matA %*% InvV12matA
CorrA## [,1] [,2] [,3]
## [1,] 1.0000000 0.6123724 -0.4472136
## [2,] 0.6123724 1.0000000 0.3651484
## [3,] -0.4472136 0.3651484 1.0000000
La variable 1 y 2 tienen moderada correlacion con .61 lo cual quiere decir que es la proporcion de la varianza explicada por la interacción entre variables el resto se le debo a factores externos. Las otras dos interacciónes son de baja correlación con una creciente de .36 entre variable 2 y 3 y una decreciente con la variable 1 y 3 . Una variable con correlación negativa significa que a medida que una variable sube otra baja
#matriz de covarianzas
matB <- matrix(c(10,-3,-1,5,-3,8,3,0,-1,3,15,1,5,0,1,4), nrow = 4, byrow = TRUE)
# Obtener la diagonal de la matriz de covarianzas que viene siendo las varianzas de cada variable
StdDiagB <- sqrt(diag(matB))
# Estandarizar la diagonal de varianzas, es decir las desviaciones estandar de cada variable o matriz V12
V12matB <- matrix(c(StdDiagB[1],0,0,0,0,StdDiagB[2],0,0,0,0,StdDiagB[3],0,0,0,0,StdDiagB[4]), nrow = 4, byrow = TRUE)
#obtener inversa de la matriz V1/2
InvV12matB <- solve(V12matB)
CorrB <- InvV12matB %*% matB %*% InvV12matB
CorrB## [,1] [,2] [,3] [,4]
## [1,] 1.00000000 -0.3354102 -0.08164966 0.7905694
## [2,] -0.33541020 1.0000000 0.27386128 0.0000000
## [3,] -0.08164966 0.2738613 1.00000000 0.1290994
## [4,] 0.79056942 0.0000000 0.12909944 1.0000000
La variable 1 y 4 tienen buena correlacion con .79 lo cual quiere decir que es la proporcion de la varianza explicada por la interacción entre variables el resto se le debo a factores externos. Las otras tres interacciónes son de baja correlación (1 y 2 con -.33 y 3 y 4 con .12) o nulas (3 y 4 = variables independientes).
Con las mismas matrices de la sección anterior, verificar que las siguientes dos expresiónes son verdaderas:
\(\boldsymbol{\Sigma}=\mathbf{V}^{1 / 2} \boldsymbol{\rho} \mathbf{V}^{1 / 2}\)
\(\mathbf{\rho}=\mathbf{V}^{-1 / 2} \boldsymbol{\Sigma} \mathbf{V}^{-1 / 2}\)
V12matA <- matrix(c(StdDiagA[1],0,0,0,StdDiagA[2],0,0,0,StdDiagA[3]), nrow = 3, byrow = TRUE)
V12matA## [,1] [,2] [,3]
## [1,] 2 0.00000 0.000000
## [2,] 0 2.44949 0.000000
## [3,] 0 0.00000 2.236068
sigmaA <- V12matA %*% CorrA %*% V12matA
sigmaA ## [,1] [,2] [,3]
## [1,] 4 3 -2
## [2,] 3 6 2
## [3,] -2 2 5
# Se confirma primera expresión para A V12matB <- matrix(c(StdDiagB[1],0,0,0,0,StdDiagB[2],0,0,0,0,StdDiagB[3],0,0,0,0,StdDiagB[4]), nrow = 4, byrow = TRUE)
V12matB## [,1] [,2] [,3] [,4]
## [1,] 3.162278 0.000000 0.000000 0
## [2,] 0.000000 2.828427 0.000000 0
## [3,] 0.000000 0.000000 3.872983 0
## [4,] 0.000000 0.000000 0.000000 2
sigmaB <- V12matB %*% CorrB %*% V12matB
sigmaB ## [,1] [,2] [,3] [,4]
## [1,] 10 -3 -1 5
## [2,] -3 8 3 0
## [3,] -1 3 15 1
## [4,] 5 0 1 4
# Se confirma primera expresión para B rhoA <- InvV12matA %*% sigmaA %*% InvV12matA
rhoA## [,1] [,2] [,3]
## [1,] 1.0000000 0.6123724 -0.4472136
## [2,] 0.6123724 1.0000000 0.3651484
## [3,] -0.4472136 0.3651484 1.0000000
# Se confirma que la segunda expresión es verdadera. rhoB <- InvV12matB %*% sigmaB %*% InvV12matB
rhoB## [,1] [,2] [,3] [,4]
## [1,] 1.00000000 -0.3354102 -0.08164966 0.7905694
## [2,] -0.33541020 1.0000000 0.27386128 0.0000000
## [3,] -0.08164966 0.2738613 1.00000000 0.1290994
## [4,] 0.79056942 0.0000000 0.12909944 1.0000000
# Se confirma que la segunda expresión es verdadera. Considerando la siguiente matriz
\(\boldsymbol{\Sigma}=\left[\begin{array}{cccc} 10 & -3 & -1 & 5 \\ -3 & 8 & 3 & 0 \\ -1 & 3 & 15 & 1 \\ 5 & 0 & 1 & 4 \end{array}\right]\)
Obtener:
Cov(2X1,-4X2)
Utilizando la propiedad \(\operatorname{Cov}\left(a X_1, b X_2\right)=E\left\{\left(a X_1-a \mu_1\right)\left(b X_2-b \mu_2\right)\right\}=a b \sigma_{12}\)
\(a b \sigma_{12}\) = 2-4-3 = 24
Var(3X2 - 2X3) Utilizando la propiedad \(\operatorname{Var}\left(a X_1+b X_2\right)=a^2 \sigma_{11}+b^2 \sigma_{22}+2 a b \sigma_{12}\)
\(a^2 \sigma_{11}+b^2 \sigma_{22}+2 a b \sigma_{12}\) = (3)^2(8) + (-2)^2(15) + 2(3)(-2)(3) = 96
Var(2X1 - 4X2 +3X3 - X4 ) Utilizando la propiedad \(\operatorname{Var}\left(\mathbf{c}^{\prime} \mathbf{X}\right)=\mathbf{c}^{\prime} \mathbf{\Sigma} \mathbf{c}\)
c <- matrix(c(2,-4,3,-1), nrow = 1, byrow = TRUE)
c_trans <- t(c)
sigma3 <- matA <- matrix(c(10,-3,-1,5,-3,8,3,0,-1,3,15,1,5,0,1,4), nrow = 4, byrow = TRUE)
Resultado <- c %*% sigma3 %*% c_trans
Resultado## [,1]
## [1,] 245
4.- Considera que \(\boldsymbol{\Sigma}=\left[\begin{array}{ccc}12 & 5 & 12 \\ 5 & 16 & 15 \\ 12 & 15 & 20\end{array}\right]\). Obtener la matriz de covarianzas del vector aleatorio \(\mathbf{Z}\) donde: A) \(Z_1=3 X_1-2 X_2+5 X_3, Z_2=9 X_1+6 X_2-8 X_3, Z_3=4 X_1+X_2-X_3\). B) \(Z_1=5 X_1-2 X_2+9 X_3, Z_2=X_1+X_2-X_3, Z_3=3 X_1+X_2-2 X_3, Z_4=4 X_1+X_2\).
Para esta sección se utilizará la siguiente propiedad
\(\mathbf{\Sigma}_{\mathbf{Z}}=\operatorname{Cov}(\mathbf{Z})=\operatorname{Cov}(\mathbf{C X})=\mathbf{C} \boldsymbol{\Sigma}_{\mathbf{X}} \mathbf{C}^{\prime}\)
sigma4 <- matrix(c(12,5,12,5,16,15,12,15,20), nrow = 3, byrow = TRUE)
cA <- matrix(c(3,-2,5,9,6,-8,4,1,-1), nrow = 3, byrow = TRUE)
cA_t <- t(cA)
covZa <- cA %*% sigma4 %*% cA_t
covZa## [,1] [,2] [,3]
## [1,] 672 274 296
## [2,] 274 200 151
## [3,] 296 151 142
cB <- matrix(c(5,-2,9,1,1,-1,3,1,-2,4,1,0), nrow = 4, byrow = TRUE)
cB_t <- t(cB)
covZb <- cB %*% sigma4 %*% cB_t
covZb## [,1] [,2] [,3] [,4]
## [1,] 2424 76 182 760
## [2,] 76 4 7 26
## [3,] 182 7 30 69
## [4,] 760 26 69 248
Considera la matriz Σdel problema 4. Obtener la distancia estadística (Mahalanobis) entre los dos puntos A, B dados. A)A(5,4,3−) y B(2,3,1−). B) A(9,8,4−) y B(10,9,6).C) A(15,4,10) y el origen.
Para esta seccónn se utilizará la siguiente propiedad
\(d^2(P Q)=(\mathbf{x}-\mathbf{y})^{\prime}\left(\begin{array}{lllll} a_{11} & a_{12} & a_{13} & \cdots & a_{1 p} \\ & a_{22} & a_{23} & \cdots & a_{2 p} \\ & & a_{33} & \cdots & a_{3 p} \\ & \text { simétrica } & & \ddots & \vdots \\ & & & & a_{p p} \end{array}\right)(\mathbf{x}-\mathbf{y}) \quad \operatorname{con} \mathbf{x}, \mathbf{y} \in \mathfrak{R}^p\)
A <- c(3,-4,5)
B <- c(1,3,-2)
sigma4 <- matrix(c(12,5,12,5,16,15,12,15,20), nrow = 3, byrow = TRUE)
sigma4inv <- solve(sigma4)
AmenosB <- A - B
AmenosBT <- t(AmenosB)
d2 <- AmenosBT %*% sigma4inv %*% AmenosB
d <- d2**.5
d## [,1]
## [1,] 11.97761
A <- c(4,-8,9)
B <- c(6,9,10)
sigma4 <- matrix(c(12,5,12,5,16,15,12,15,20), nrow = 3, byrow = TRUE)
sigma4inv <- solve(sigma4)
AmenosB <- A - B
AmenosBT <- t(AmenosB)
d2 <- AmenosBT %*% sigma4inv %*% AmenosB
d <- d2**.5
d## [,1]
## [1,] 14.64858
A <- c(10,4,15)
B <- c(0,0,0)
sigma4 <- matrix(c(12,5,12,5,16,15,12,15,20), nrow = 3, byrow = TRUE)
sigma4inv <- solve(sigma4)
AmenosB <- A - B
AmenosBT <- t(AmenosB)
d2 <- AmenosBT %*% sigma4inv %*% AmenosB
d <- d2**.5
d## [,1]
## [1,] 6.365694
Considera las matrices de covarianzas del problema 1. Para cada una obtener su varianza generalizada.
Se utiliza la siguiente propiedad Donde \(|\boldsymbol{\Sigma}|\) es el determinante de \(\boldsymbol{\Sigma}\) (se le llama varianza generalizada) y \(\boldsymbol{\Sigma}^{-1}\) es la matriz inversa de \(\boldsymbol{\Sigma}\). Se denota como \(N_p(\boldsymbol{\mu}, \boldsymbol{\Sigma})\).
matA <- matrix(c(4,3,-2,3,6,2,-2,2,5), nrow = 3, byrow = TRUE)
var_genA <- det(matA)
var_genA## [1] 11
matB <- matrix(c(10,-3,-1,5,-3,8,3,0,-1,3,15,1,5,0,1,4), nrow = 4, byrow = TRUE)
var_genB <- det(matB)
var_genB ## [1] 1104
7.- Sea \(\mathbf{X}\) un vector aleatorio con distribución \(N_5(\boldsymbol{\mu}, \boldsymbol{\Sigma})\), obtener: A) \(P\left\{(\mathbf{X}-\boldsymbol{\mu})^{\prime} \boldsymbol{\Sigma}^{-1}(\mathbf{X}-\boldsymbol{\mu})>3\right\}\). B) \(P\left\{4<(\mathbf{X}-\boldsymbol{\mu})^{\prime} \boldsymbol{\Sigma}^{-1}(\mathbf{X}-\boldsymbol{\mu})<6\right\}\) C) \(P\left\{(\mathbf{X}-\boldsymbol{\mu})^{\prime} \boldsymbol{\Sigma}^{-1}(\mathbf{X}-\boldsymbol{\mu})<2\right\}\). D) Obtener el valor de \(w\) tal que \(P\left\{(\mathbf{X}-\boldsymbol{\mu})^{\prime} \boldsymbol{\Sigma}^{-1}(\mathbf{X}-\boldsymbol{\mu})<\boldsymbol{w}\right\}=0.85\).
Para este ejercicio se utilizará la siguiente propiedad: 3) El hiperelips e sólido que cumple con \((\mathbf{x}-\boldsymbol{\mu})^{\prime} \mathbf{\Sigma}^{-1}(\mathbf{x}-\boldsymbol{\mu}) \leq \chi_{\alpha, p}^2\) tiene probabilid ad \(1-\alpha\).
p1 <- 1 - pchisq(3,5)
p1## [1] 0.6999858
p2 <- pchisq(6,5) - pchisq(4,5)
p2## [1] 0.243197
p3 <- pchisq(2,5)
p3## [1] 0.150855
# Tuve problemas para hacerlo en R y lo hice en excel
#p4 <- dinvchisq(.85,5)
# dinv.chisq(.8,5, log = FALSE)
p4 <- pchisq(8.1151994,5)
p4## [1] 0.85
Considerala muestra aleatoria de un vector aleatorio (datos en el ícono).Obtener X y S.Interpreta los valores obtenidos.
La media muestral se obtiene de la siguiente manera \(\overline{\mathbf{X}}^{\prime}=\left(\bar{x}_1, \bar{x}_2, \ldots, \bar{x}_p\right)\)
La covarianza muestra se obtiene con : \(\mathbf{S}=\left[\begin{array}{cccc}s_{11} & s_{12} & \cdots & s_{1 p} \\ & s_{22} & \cdots & s_{2 p} \\ & \ddots & \vdots \\ \text { simétrica } & \ddots & s_{p p}\end{array}\right]\) donde \(s_{i j}=\frac{\sum_{k=1}^n\left(x_{k i}-\bar{x}_i\right)\left(x_{k j}-\bar{x}_j\right)}{n-1}\)
El vector X barra se interpreta como el promedio de la muestra para cada una de las variables. Tenemos 5 variables por ende tenemos 5 promedios.
X_barra <- matrix(c(91.218,101.927,149.209,300.451,501.207), nrow = 1, byrow = TRUE)
X_barra## [,1] [,2] [,3] [,4] [,5]
## [1,] 91.218 101.927 149.209 300.451 501.207
La matriz de covarianzas muestra las varianzas de cada variable en su diagonal y las covarianzas con las otras varaiables en su respectiva casilla con sus índices. La matiz es simetrica reflejada en su diagonal.
S <- matrix(c(27.088,43.029,26.503,13.003,17.403,43.029,109.938,35.671,49.544,53.919,26.503,35.671,103.328,33.267,36.492,13.003,49.544,33.267,80.260,22.006,17.403,53.919,36.492,22.006,70.952), nrow = 5, byrow = TRUE)
S ## [,1] [,2] [,3] [,4] [,5]
## [1,] 27.088 43.029 26.503 13.003 17.403
## [2,] 43.029 109.938 35.671 49.544 53.919
## [3,] 26.503 35.671 103.328 33.267 36.492
## [4,] 13.003 49.544 33.267 80.260 22.006
## [5,] 17.403 53.919 36.492 22.006 70.952