Sección 1

Considera las siguientes matrices de covarianzas de un vector aleatorio X. Obtener la matriz de coeficiente de correlaciones para cada caso. Después, interpreta los valores obtenidos.

Ejercicio A

  1. \(\boldsymbol{\Sigma}=\left[\begin{array}{ccc}4 & 3 & -2 \\ 3 & 6 & 2 \\ -2 & 2 & 5\end{array}\right]\)
#matriz de covarianzas 
matA <- matrix(c(4,3,-2,3,6,2,-2,2,5), nrow = 3, byrow = TRUE) 
# Obtener la diagonal de la matriz de covarianzas que viene siendo las varianzas de cada variable
StdDiagA <- sqrt(diag(matA)) 
# Estandarizar la diagonal de varianzas, es decir las desviaciones estandar de cada variable o matriz V12
V12matA <- matrix(c(StdDiagA[1],0,0,0,StdDiagA[2],0,0,0,StdDiagA[3]), nrow = 3, byrow = TRUE) 
#obtener inversa de la matriz V1/2
InvV12matA <- solve(V12matA)

CorrA <- InvV12matA %*% matA  %*% InvV12matA
CorrA
##            [,1]      [,2]       [,3]
## [1,]  1.0000000 0.6123724 -0.4472136
## [2,]  0.6123724 1.0000000  0.3651484
## [3,] -0.4472136 0.3651484  1.0000000

La variable 1 y 2 tienen moderada correlacion con .61 lo cual quiere decir que es la proporcion de la varianza explicada por la interacción entre variables el resto se le debo a factores externos. Las otras dos interacciónes son de baja correlación con una creciente de .36 entre variable 2 y 3 y una decreciente con la variable 1 y 3 . Una variable con correlación negativa significa que a medida que una variable sube otra baja

Ejercicio B

  1. \(\boldsymbol{\Sigma}=\left[\begin{array}{cccc}10 & -3 & -1 & 5 \\ -3 & 8 & 3 & 0 \\ -1 & 3 & 15 & 1 \\ 5 & 0 & 1 & 4\end{array}\right]\)
#matriz de covarianzas 
matB <- matrix(c(10,-3,-1,5,-3,8,3,0,-1,3,15,1,5,0,1,4), nrow = 4, byrow = TRUE) 
# Obtener la diagonal de la matriz de covarianzas que viene siendo las varianzas de cada variable
StdDiagB <- sqrt(diag(matB)) 
# Estandarizar la diagonal de varianzas, es decir las desviaciones estandar de cada variable o matriz V12
V12matB <- matrix(c(StdDiagB[1],0,0,0,0,StdDiagB[2],0,0,0,0,StdDiagB[3],0,0,0,0,StdDiagB[4]), nrow = 4, byrow = TRUE) 
#obtener inversa de la matriz V1/2
InvV12matB <- solve(V12matB)

CorrB <- InvV12matB %*% matB  %*% InvV12matB
CorrB
##             [,1]       [,2]        [,3]      [,4]
## [1,]  1.00000000 -0.3354102 -0.08164966 0.7905694
## [2,] -0.33541020  1.0000000  0.27386128 0.0000000
## [3,] -0.08164966  0.2738613  1.00000000 0.1290994
## [4,]  0.79056942  0.0000000  0.12909944 1.0000000

La variable 1 y 4 tienen buena correlacion con .79 lo cual quiere decir que es la proporcion de la varianza explicada por la interacción entre variables el resto se le debo a factores externos. Las otras tres interacciónes son de baja correlación (1 y 2 con -.33 y 3 y 4 con .12) o nulas (3 y 4 = variables independientes).

Sección 2

Con las mismas matrices de la sección anterior, verificar que las siguientes dos expresiónes son verdaderas:

\(\boldsymbol{\Sigma}=\mathbf{V}^{1 / 2} \boldsymbol{\rho} \mathbf{V}^{1 / 2}\)

\(\mathbf{\rho}=\mathbf{V}^{-1 / 2} \boldsymbol{\Sigma} \mathbf{V}^{-1 / 2}\)

Verificación 1

V12matA <- matrix(c(StdDiagA[1],0,0,0,StdDiagA[2],0,0,0,StdDiagA[3]), nrow = 3, byrow = TRUE) 
V12matA
##      [,1]    [,2]     [,3]
## [1,]    2 0.00000 0.000000
## [2,]    0 2.44949 0.000000
## [3,]    0 0.00000 2.236068
sigmaA <- V12matA %*% CorrA %*% V12matA
sigmaA 
##      [,1] [,2] [,3]
## [1,]    4    3   -2
## [2,]    3    6    2
## [3,]   -2    2    5
# Se confirma primera expresión para A 
V12matB <- matrix(c(StdDiagB[1],0,0,0,0,StdDiagB[2],0,0,0,0,StdDiagB[3],0,0,0,0,StdDiagB[4]), nrow = 4, byrow = TRUE) 
V12matB
##          [,1]     [,2]     [,3] [,4]
## [1,] 3.162278 0.000000 0.000000    0
## [2,] 0.000000 2.828427 0.000000    0
## [3,] 0.000000 0.000000 3.872983    0
## [4,] 0.000000 0.000000 0.000000    2
sigmaB <- V12matB %*% CorrB %*% V12matB
sigmaB 
##      [,1] [,2] [,3] [,4]
## [1,]   10   -3   -1    5
## [2,]   -3    8    3    0
## [3,]   -1    3   15    1
## [4,]    5    0    1    4
# Se confirma primera expresión para B 

Verificación 2

rhoA <- InvV12matA %*% sigmaA %*% InvV12matA
rhoA
##            [,1]      [,2]       [,3]
## [1,]  1.0000000 0.6123724 -0.4472136
## [2,]  0.6123724 1.0000000  0.3651484
## [3,] -0.4472136 0.3651484  1.0000000
# Se confirma que la segunda expresión es verdadera. 
rhoB <- InvV12matB %*% sigmaB %*% InvV12matB
rhoB
##             [,1]       [,2]        [,3]      [,4]
## [1,]  1.00000000 -0.3354102 -0.08164966 0.7905694
## [2,] -0.33541020  1.0000000  0.27386128 0.0000000
## [3,] -0.08164966  0.2738613  1.00000000 0.1290994
## [4,]  0.79056942  0.0000000  0.12909944 1.0000000
# Se confirma que la segunda expresión es verdadera. 

Sección 3

Considerando la siguiente matriz

\(\boldsymbol{\Sigma}=\left[\begin{array}{cccc} 10 & -3 & -1 & 5 \\ -3 & 8 & 3 & 0 \\ -1 & 3 & 15 & 1 \\ 5 & 0 & 1 & 4 \end{array}\right]\)

Obtener:

Ejercicio A

Cov(2X1,-4X2)

Utilizando la propiedad \(\operatorname{Cov}\left(a X_1, b X_2\right)=E\left\{\left(a X_1-a \mu_1\right)\left(b X_2-b \mu_2\right)\right\}=a b \sigma_{12}\)

\(a b \sigma_{12}\) = 2-4-3 = 24

Ejercicio B

Var(3X2 - 2X3) Utilizando la propiedad \(\operatorname{Var}\left(a X_1+b X_2\right)=a^2 \sigma_{11}+b^2 \sigma_{22}+2 a b \sigma_{12}\)

\(a^2 \sigma_{11}+b^2 \sigma_{22}+2 a b \sigma_{12}\) = (3)^2(8) + (-2)^2(15) + 2(3)(-2)(3) = 96

Ejercicio C

Var(2X1 - 4X2 +3X3 - X4 ) Utilizando la propiedad \(\operatorname{Var}\left(\mathbf{c}^{\prime} \mathbf{X}\right)=\mathbf{c}^{\prime} \mathbf{\Sigma} \mathbf{c}\)

c <- matrix(c(2,-4,3,-1), nrow = 1, byrow = TRUE)
c_trans <- t(c) 
sigma3 <- matA <- matrix(c(10,-3,-1,5,-3,8,3,0,-1,3,15,1,5,0,1,4), nrow = 4, byrow = TRUE)

Resultado <- c %*% sigma3 %*% c_trans
Resultado
##      [,1]
## [1,]  245

Sección 4

4.- Considera que \(\boldsymbol{\Sigma}=\left[\begin{array}{ccc}12 & 5 & 12 \\ 5 & 16 & 15 \\ 12 & 15 & 20\end{array}\right]\). Obtener la matriz de covarianzas del vector aleatorio \(\mathbf{Z}\) donde: A) \(Z_1=3 X_1-2 X_2+5 X_3, Z_2=9 X_1+6 X_2-8 X_3, Z_3=4 X_1+X_2-X_3\). B) \(Z_1=5 X_1-2 X_2+9 X_3, Z_2=X_1+X_2-X_3, Z_3=3 X_1+X_2-2 X_3, Z_4=4 X_1+X_2\).

Para esta sección se utilizará la siguiente propiedad

\(\mathbf{\Sigma}_{\mathbf{Z}}=\operatorname{Cov}(\mathbf{Z})=\operatorname{Cov}(\mathbf{C X})=\mathbf{C} \boldsymbol{\Sigma}_{\mathbf{X}} \mathbf{C}^{\prime}\)

Ejercicio A

sigma4 <- matrix(c(12,5,12,5,16,15,12,15,20), nrow = 3, byrow = TRUE)
cA <- matrix(c(3,-2,5,9,6,-8,4,1,-1), nrow = 3, byrow = TRUE)
cA_t <- t(cA)

covZa <- cA %*% sigma4  %*% cA_t
covZa
##      [,1] [,2] [,3]
## [1,]  672  274  296
## [2,]  274  200  151
## [3,]  296  151  142

Ejercicio B

cB <- matrix(c(5,-2,9,1,1,-1,3,1,-2,4,1,0), nrow = 4, byrow = TRUE)
cB_t <- t(cB)
covZb <- cB %*% sigma4  %*% cB_t
covZb
##      [,1] [,2] [,3] [,4]
## [1,] 2424   76  182  760
## [2,]   76    4    7   26
## [3,]  182    7   30   69
## [4,]  760   26   69  248

Sección 5

Considera la matriz Σdel problema 4. Obtener la distancia estadística (Mahalanobis) entre los dos puntos A, B dados. A)A(5,4,3−) y B(2,3,1−). B) A(9,8,4−) y B(10,9,6).C) A(15,4,10) y el origen.

Para esta seccónn se utilizará la siguiente propiedad

\(d^2(P Q)=(\mathbf{x}-\mathbf{y})^{\prime}\left(\begin{array}{lllll} a_{11} & a_{12} & a_{13} & \cdots & a_{1 p} \\ & a_{22} & a_{23} & \cdots & a_{2 p} \\ & & a_{33} & \cdots & a_{3 p} \\ & \text { simétrica } & & \ddots & \vdots \\ & & & & a_{p p} \end{array}\right)(\mathbf{x}-\mathbf{y}) \quad \operatorname{con} \mathbf{x}, \mathbf{y} \in \mathfrak{R}^p\)

Ejericio A

A <- c(3,-4,5)
B <- c(1,3,-2)
sigma4 <- matrix(c(12,5,12,5,16,15,12,15,20), nrow = 3, byrow = TRUE)
sigma4inv <- solve(sigma4)

AmenosB <- A - B
AmenosBT <- t(AmenosB)
d2 <-  AmenosBT %*% sigma4inv %*% AmenosB
d <- d2**.5
d
##          [,1]
## [1,] 11.97761

Ejericio B

A <- c(4,-8,9)
B <- c(6,9,10)
sigma4 <- matrix(c(12,5,12,5,16,15,12,15,20), nrow = 3, byrow = TRUE)
sigma4inv <- solve(sigma4)

AmenosB <- A - B
AmenosBT <- t(AmenosB)
d2 <-  AmenosBT %*% sigma4inv %*% AmenosB
d <- d2**.5
d
##          [,1]
## [1,] 14.64858

Ejericio C

A <- c(10,4,15)
B <- c(0,0,0)
sigma4 <- matrix(c(12,5,12,5,16,15,12,15,20), nrow = 3, byrow = TRUE)
sigma4inv <- solve(sigma4)

AmenosB <- A - B
AmenosBT <- t(AmenosB)
d2 <-  AmenosBT %*% sigma4inv %*% AmenosB
d <- d2**.5
d
##          [,1]
## [1,] 6.365694

Sección 6

Considera las matrices de covarianzas del problema 1. Para cada una obtener su varianza generalizada.

Se utiliza la siguiente propiedad Donde \(|\boldsymbol{\Sigma}|\) es el determinante de \(\boldsymbol{\Sigma}\) (se le llama varianza generalizada) y \(\boldsymbol{\Sigma}^{-1}\) es la matriz inversa de \(\boldsymbol{\Sigma}\). Se denota como \(N_p(\boldsymbol{\mu}, \boldsymbol{\Sigma})\).

Ejercicio A

matA <- matrix(c(4,3,-2,3,6,2,-2,2,5), nrow = 3, byrow = TRUE) 
var_genA <- det(matA)
var_genA
## [1] 11

Ejercicio b

matB <- matrix(c(10,-3,-1,5,-3,8,3,0,-1,3,15,1,5,0,1,4), nrow = 4, byrow = TRUE) 

var_genB <- det(matB)
var_genB 
## [1] 1104

Seccion 7

7.- Sea \(\mathbf{X}\) un vector aleatorio con distribución \(N_5(\boldsymbol{\mu}, \boldsymbol{\Sigma})\), obtener: A) \(P\left\{(\mathbf{X}-\boldsymbol{\mu})^{\prime} \boldsymbol{\Sigma}^{-1}(\mathbf{X}-\boldsymbol{\mu})>3\right\}\). B) \(P\left\{4<(\mathbf{X}-\boldsymbol{\mu})^{\prime} \boldsymbol{\Sigma}^{-1}(\mathbf{X}-\boldsymbol{\mu})<6\right\}\) C) \(P\left\{(\mathbf{X}-\boldsymbol{\mu})^{\prime} \boldsymbol{\Sigma}^{-1}(\mathbf{X}-\boldsymbol{\mu})<2\right\}\). D) Obtener el valor de \(w\) tal que \(P\left\{(\mathbf{X}-\boldsymbol{\mu})^{\prime} \boldsymbol{\Sigma}^{-1}(\mathbf{X}-\boldsymbol{\mu})<\boldsymbol{w}\right\}=0.85\).

Para este ejercicio se utilizará la siguiente propiedad: 3) El hiperelips e sólido que cumple con \((\mathbf{x}-\boldsymbol{\mu})^{\prime} \mathbf{\Sigma}^{-1}(\mathbf{x}-\boldsymbol{\mu}) \leq \chi_{\alpha, p}^2\) tiene probabilid ad \(1-\alpha\).

Ejercicio 1

p1 <- 1 - pchisq(3,5)
p1
## [1] 0.6999858

Ejercicio 2

p2 <- pchisq(6,5) - pchisq(4,5)
p2
## [1] 0.243197

Ejercicio 3

p3 <- pchisq(2,5) 
p3
## [1] 0.150855

Ejercicio 4

# Tuve problemas para hacerlo en R y lo hice en excel
#p4 <- dinvchisq(.85,5)
# dinv.chisq(.8,5, log = FALSE) 

p4 <- pchisq(8.1151994,5) 
p4
## [1] 0.85

Seccion 8

Considerala muestra aleatoria de un vector aleatorio (datos en el ícono).Obtener X y S.Interpreta los valores obtenidos.

La media muestral se obtiene de la siguiente manera \(\overline{\mathbf{X}}^{\prime}=\left(\bar{x}_1, \bar{x}_2, \ldots, \bar{x}_p\right)\)

La covarianza muestra se obtiene con : \(\mathbf{S}=\left[\begin{array}{cccc}s_{11} & s_{12} & \cdots & s_{1 p} \\ & s_{22} & \cdots & s_{2 p} \\ & \ddots & \vdots \\ \text { simétrica } & \ddots & s_{p p}\end{array}\right]\) donde \(s_{i j}=\frac{\sum_{k=1}^n\left(x_{k i}-\bar{x}_i\right)\left(x_{k j}-\bar{x}_j\right)}{n-1}\)

El vector X barra se interpreta como el promedio de la muestra para cada una de las variables. Tenemos 5 variables por ende tenemos 5 promedios.

X_barra <- matrix(c(91.218,101.927,149.209,300.451,501.207), nrow = 1, byrow = TRUE) 

X_barra
##        [,1]    [,2]    [,3]    [,4]    [,5]
## [1,] 91.218 101.927 149.209 300.451 501.207

La matriz de covarianzas muestra las varianzas de cada variable en su diagonal y las covarianzas con las otras varaiables en su respectiva casilla con sus índices. La matiz es simetrica reflejada en su diagonal.

S <- matrix(c(27.088,43.029,26.503,13.003,17.403,43.029,109.938,35.671,49.544,53.919,26.503,35.671,103.328,33.267,36.492,13.003,49.544,33.267,80.260,22.006,17.403,53.919,36.492,22.006,70.952), nrow = 5, byrow = TRUE) 

S 
##        [,1]    [,2]    [,3]   [,4]   [,5]
## [1,] 27.088  43.029  26.503 13.003 17.403
## [2,] 43.029 109.938  35.671 49.544 53.919
## [3,] 26.503  35.671 103.328 33.267 36.492
## [4,] 13.003  49.544  33.267 80.260 22.006
## [5,] 17.403  53.919  36.492 22.006 70.952