Material base para a disciplina Estatística Multivariada com
aplicações no R
. Neste primeiro momento mostra-se as
principais definições algébricas para um melhor entendimento de como uma
componente principal é construída.
R
O R vem com as configurações mínimas ao ser instalado. Para realizar tarefas mais específicas pode ser necessário instalar pacotes adicionais (packages), clicando em “pacotes>>instalar pacotes”;
É necessário escolher o CRAN (Comprehensive R Archive Network), que são arquivos disponibilizados na rede por diversas IES do mundo inteiro, inclusive do Brasil.
O R é case-sensitive, isto é, ele diferencia letras minúsculas de maiúsculas;
O separador de casas decimais é o “.”;
A vírgula é usada para separar argumentos;
O prompt do R
é o sinal de maior “>”;
Após instalarmos algum pacote sempre será necessário carregá-lo
com o comando: library(“nome do pacote”)
;
Para verificar como citar o pacote instalado digite:
citation(“nome do pacote”)
;
Para obter ajuda dos arquivos do R
use o comando
help(nome da função)
.
Exemplos:
# help(sqrt) #ajuda sobre a função raiz quadrada
# help(lm) # ajuda sobre a função linear models
R
#demo(graphics) #pressione Enter
#demo(persp)
#demo(image)
Vamos crias um vetor de notas de 10 alunos da turma. A função
length(notas)
fornece o número de observações (n) dentro do
objeto.
OBS: o comando <-
significa assinalar; o
comando c
significa concatenar (colocar
junto).
notas = c(9,6,8,5,7,8,6,9,10,6)
print(notas)
## [1] 9 6 8 5 7 8 6 9 10 6
length(notas)
## [1] 10
Para objetos com letras (variáveis qualitativas), basta colocar cada observação entre aspas.
Para listar quais objetos temos salvo utiliza-se a função
ls()
.
Para remover um objeto: rm(“nome do objeto”)
.
letras<-c("a","b","c","d")
print(letras)
## [1] "a" "b" "c" "d"
ls()
## [1] "letras" "notas"
1:10
: sequência de 1 até 10, de um em um.
seq(from = 1, to = 10, by = 2 )
, isto é, sequência(de um, a
dez, em intervalos de 2). Ou ainda seq(1,100,5)
: sequência
de 1 a 100 em intervalos de 5
1:10
## [1] 1 2 3 4 5 6 7 8 9 10
seq(from = 1, to = 10, by = 2 )
## [1] 1 3 5 7 9
seq(1,100,5)
## [1] 1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
rbinom(n, size, prob)
: gera uma distribuição
aleatória Binomial com n
valores (observações), número de
tentativas size
e probabilidade de sucesso
prob
.
rgeom(n, prob)
: gera uma distribuição aleatória
Geométrica com n
valores e probabilidade de sucesso
prob
.
rpois(n, lambda)
: gera uma distribuição aleatória
Poisson com n
valores e vetor de médias
lambda
.
runif(n, min=0, max=1)
: gera uma distribuição
aleatória Uniforme contínua com n
valores, começando em
min
e terminando em max
.
rexp(n, rate = 1)
: gera uma distribuição aleatória
Exponencial com n
valores e taxa
rate
.
rnorm(n, mean = 0, sd = 1))
: gera uma distribuição
aleatória Normal com n
valores, média mean
e
desvio padrão sd
.
rbinom(10, 4, 0.2)
## [1] 1 1 0 1 1 0 2 0 0 0
rgeom(5,0.1)
## [1] 5 7 3 14 5
rpois(8,2)
## [1] 5 0 4 1 2 0 1 2
rexp(6,1)
## [1] 1.6847840 0.7725487 1.4494138 0.2872838 0.4492415 0.8446422
runif(4, 0.2,.9)
## [1] 0.5897873 0.7366440 0.8084414 0.2808867
rnorm(7)
## [1] -1.7806223 -0.3069625 -0.2735254 -1.0578858 -0.4629794 2.0556548 -1.1621014
x1 = rnorm(200)
hist(x1,
col = "lightblue",
freq = F,
main = "",
xlab = "Dados de X~N(0,1)",
ylab = "f(x): f.d.p. de X",
breaks = 20)
curve(dnorm(x,mean = mean(x1),sd=sd(x1)),add = T)
Exemplo
sample(1:10,5) # tira 5 amostras com valores entre 1 e 10
## [1] 8 9 4 1 5
Como não especificamos o argumento replace o padrão é considerar que a amostra é sem reposição (= FALSE).
sample(1:10,15,replace=TRUE)
## [1] 9 9 1 3 3 4 10 2 4 4 6 6 7 7 2
Lembram dos exemplos da moeda em probabilidade? Então,
moeda = c("C","K") # primeiro criamos a moeda
sample(moeda,10,replace=TRUE) # não podemos esquecer do TRUE
## [1] "C" "C" "K" "C" "K" "C" "C" "C" "K" "K"
\[ x = \boldsymbol{x}_{1,1} = x_{i} \]
As matrizes e os sistemas lineares têm larga aplicação em problemas práticos. Dá-se o nome de matriz a uma tabela organizada em linhas e colunas, denotadas por \(\boldsymbol{X}=[x_{ij}]_{m\times n}\), onde o par de índices \(ij\) representa a posição de cada elemento \(x_{ij}\) dentro da matriz, sendo que o índice \(i\) indica a linha e o índice \(j\) a coluna. O par de índice \(m \times n\) é chamado de dimensão da matriz e representa o seu tamanho. O índice \(m\) indica o número de linhas e \(n\), o número de colunas
\[\begin{eqnarray*}\boldsymbol{X}=\left[ \begin{array}{cccc} x_{11} & x_{12} & \dots & x_{1n}\\ x_{21} & x_{22} & \dots & x_{2n}\\ \vdots & \vdots & \ddots & \vdots\\ x_{m1} & x_{m2} & \dots & x_{mn}\\ \end{array} \right] \end{eqnarray*}\]Para inserir uma matriz no R
utiliza-se a função
matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL)
.
Note que, basta colocar como argumentos o conjunto de dados e indicar o
número de linhas e de colunas da matriz.
M1 = matrix(data = 1:9, nrow = 3, ncol = 3)
print(M1)
## [,1] [,2] [,3]
## [1,] 1 4 7
## [2,] 2 5 8
## [3,] 3 6 9
Observe que a matriz foi organizada por default por colunas.
Entretanto, podemos mudar isso para linhas utilizando-se o argumento
byrow = TRUE
na função matrix
.
M2 = matrix(data = 1:9, nrow = 3, ncol = 3, byrow = TRUE)
print(M2)
## [,1] [,2] [,3]
## [1,] 1 2 3
## [2,] 4 5 6
## [3,] 7 8 9
Se tivermos um ou mais vetores para formar uma matriz, basta informar o número de linhas do vetor.
Exemplo: Uma seleção de 4 firmas de ração de Minas Gerais foi obtida para avaliar a venda de rações. Cada observação bivariada forneceu a quantidade de sacos de ração vendidos e a quantidade de reais de cada venda. Os dados obtidos na forma tabular são:
\[\begin{eqnarray*} \begin{array}{l|cccc}\hline \text{Váriavel 1 (reais/vendas)} & 80 & 120 & 90 & 110 \\ \hline \text{Váriavel 2 (número de sacos de ração vendidos)} & 10 & 12 & 6 & 8\\ \hline \end{array} \end{eqnarray*}\]M_E1 = matrix(c(80,120,90,110,10,12,6,8),4,2)
print(M_E1)
## [,1] [,2]
## [1,] 80 10
## [2,] 120 12
## [3,] 90 6
## [4,] 110 8
Pode-se acessar os elementos de uma matriz usando o nome do objeto
(matriz) seguido de colchetes. Para acessar o segundo elemento da
variável 1, no exemplo anterior, M_E1[2,1]
. Para o terceiro
elemento da variável 2, M_E1[3,2]
. E, para selecionar todos
os elementos da variável 1, M_E1[,1]
.
M_E1[2,1] # segundo elemento da variável 1
## [1] 120
M_E1[3,2] # terceiro elemento da variável 2
## [1] 6
M_E1[,1] # todos os elementos da variável 1
## [1] 80 120 90 110
Dadas duas matrizes de mesma dimensão \(A=[a_{ij}]_{m\times n}\) e \(B=[b_{ij}]_{m\times n}\), temos que \(A + B = [a_{ij} + b_{ij}]\).
\[\begin{eqnarray*}\left[ \begin{array}{cc} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{array} \right] + \left[ \begin{array}{cc} b_{11} & b_{12} \\ b_{21} & b_{22} \\ \end{array} \right] = \left[ \begin{array}{cc} a_{11} + b_{11} & a_{12} + b_{12} \\ a_{21} + b_{21} & a_{22} + b_{22} \\ \end{array} \right] \end{eqnarray*}\]Exemplo: Dadas as matrizes
\[\begin{eqnarray*}A=\left[ \begin{array}{cccc} -1 & 2 & 10 & 8 \\ 2 & 0 & -3 & 3 \\ 0 & 5 & -8 & 1 \\ \end{array} \right] \quad \text{e}\quad B = \left[ \begin{array}{cccc} 0 & 3 & -2 & 7 \\ 3 & -4 & 9 & 2 \\ 21 & 0 & -1 & 12 \\ \end{array} \right], \text{temos que} \end{eqnarray*}\]A = matrix(c(-1,2,10,8,2,0,-3,3,0,5,-8,1),3,4, byrow = TRUE)
print(A)
## [,1] [,2] [,3] [,4]
## [1,] -1 2 10 8
## [2,] 2 0 -3 3
## [3,] 0 5 -8 1
B = matrix(c(0,3,-2,7,3,-4,9,2,21,0,-1,12),3,4,byrow = TRUE)
print(B)
## [,1] [,2] [,3] [,4]
## [1,] 0 3 -2 7
## [2,] 3 -4 9 2
## [3,] 21 0 -1 12
S_AB = A + B # soma das matrizes A e B
print(S_AB)
## [,1] [,2] [,3] [,4]
## [1,] -1 5 8 15
## [2,] 5 -4 6 5
## [3,] 21 5 -9 13
Dada uma matriz \(A=[a_{ij}]_{m\times n}\) e um número real \(k\), temos que \(k \times A=[k \times a_{ij}]_{m\times n}\).
\[\begin{eqnarray*}k \times A=[k \times a_{ij}]_{m\times n} = k \times \left[ \begin{array}{cc} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{array} \right] \longrightarrow \left[ \begin{array}{cc} k \times a_{11} & k \times a_{12} \\ k \times a_{21} & k \times a_{22} \\ \end{array} \right] \end{eqnarray*}\]Exemplo: Dada a matriz A do exemplo anterior, pode-se multiplicar essa matriz por qualquer escalar \(k\). Por exemplo, para \(k = -3\), temos
k = 3 # denifindo um escalar qualquer
A = matrix(c(-1,2,10,8,2,0,-3,3,0,5,-8,1),3,4, byrow = TRUE)
print(A)
## [,1] [,2] [,3] [,4]
## [1,] -1 2 10 8
## [2,] 2 0 -3 3
## [3,] 0 5 -8 1
kA = k*A
print(kA)
## [,1] [,2] [,3] [,4]
## [1,] -3 6 30 24
## [2,] 6 0 -9 9
## [3,] 0 15 -24 3
Dadas duas matrizes \(A=[a_{ij}]_{m\times n}\) e \(B=[b_{jk}]_{n\times p}\), temos que \(A\times B = C[c_{ik}]_{m\times p}\). Vale ressaltar que este produto só será possível se o número de colunas de \(A\) for igual ao número de linhas de \(B\).
Exemplo: Dadas as matrizes
\[\begin{eqnarray*} A = \left[ \begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ \end{array} \right] \quad \text{e} \quad B= \left[ \begin{array}{cc} b_{11} & b_{12} \\ a_{21} & a_{22} \\ a_{31} & a_{32} \\ \end{array} \right] \end{eqnarray*}\]Observe que o número de colunas da matriz \(A\) é igual ao número de linhas da matriz \(B\), portanto, por definição temos que a matriz \(C\) terá dimensão \(2\times 2\), como segue
\[\begin{eqnarray*} C = \left[ \begin{array}{cc} c_{11} & c_{12} \\ c_{21} & c_{22} \\ \end{array} \right], \quad \text{em que} \end{eqnarray*}\] \[\begin{eqnarray*} \begin{array}{cc} c_{11} = & a_{11}b_{11}+a_{12}b_{21}+a_{13}b_{31} \\ c_{12} = & a_{11}b_{12}+a_{12}b_{22}+a_{13}b_{32} \\ c_{21} = & a_{21}b_{11}+a_{22}b_{21}+a_{23}b_{31} \\ c_{22} = & a_{21}b_{12}+a_{22}b_{22}+a_{23}b_{32} \\ \end{array} \end{eqnarray*}\]No R
o produto de matrizes é feito pelo uso do operador
%*%
.
Exercício: Sejam as matrizes
\[\begin{eqnarray*} X = \left[ \begin{array}{cc} 2 & -1 \\ 0 & 1 \\ \end{array} \right], Y = \left[ \begin{array}{ccc} 5 & 0 & 1 \\ 2 & -1 & 3 \\ \end{array} \right] \quad \text{e} \quad Z = \left[ \begin{array}{cc} 4 & -8 \\ 1 & 0 \\ \end{array} \right] \end{eqnarray*}\]Determine:
\(2X+Y\)
\(XY\)
\(Y+Z\)
\(YZ\)
\((X-3Z)Y\)
\(X^{2}\)
Dada a matriz \(A=[a_{ij}]_{m\times n}\), sua transposta é dada por \(A^{t}=[a_{ji}]_{n\times m}\).
Exemplo: Dada a matriz
\[\begin{eqnarray*} A = \left[ \begin{array}{ccc} 1 & 2 & 7 \\ 4 & -3 & 8 \\ \end{array} \right]_{2\times 3} \quad \text{sua transposta é} \quad A^{t} = \left[ \begin{array}{rr} 1 & 4 \\ 2 & -3 \\ 7 & 8 \\ \end{array} \right]_{3\times 2} \end{eqnarray*}\]No R
utiliza-se a função t()
para obter a
transposta de uma matriz.
A = matrix(c(1,5,2,-3,7,8),2,3)
print(A)
## [,1] [,2] [,3]
## [1,] 1 2 7
## [2,] 5 -3 8
A_t = t(A)
print(A_t)
## [,1] [,2]
## [1,] 1 5
## [2,] 2 -3
## [3,] 7 8
Dada a matriz \(A[a_{11}]\), temos que \(det(A) = a_{11}\).
Dada a matriz
seu determinante é:
\[\begin{eqnarray*} det(A) = \left| \begin{array}{cc} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{array} \right| = a_{11}a_{22}-a_{12}a_{21} \end{eqnarray*}\]Exemplo: Dada a matriz
\[\begin{eqnarray*} A = \left[ \begin{array}{rr} -3 & 2 \\ 4 & 2 \\ \end{array} \right], \end{eqnarray*}\]seu determinante é:
\[\begin{eqnarray*} det(A) = \left| \begin{array}{rr} -3 & 2 \\ 4 & 2 \\ \end{array} \right| = (-3.2)-(2.4) = -14 \end{eqnarray*}\]Seja a matriz \(A_{3\times 3}\),
\[\begin{eqnarray*} A = \left[ \begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{array} \right], \end{eqnarray*}\]seu determinante é calculado pela regra de Sarrus da seguinte maneira
\[\begin{eqnarray*} det(A)= \left| \begin{array}{ccc|cc} a_{11} & a_{12} & a_{13} & a_{11} & a_{12}\\ a_{21} & a_{22} & a_{23} & a_{21} & a_{21}\\ a_{31} & a_{32} & a_{33} & a_{31} & a_{32}\\ \end{array} \right| \end{eqnarray*}\] \[\begin{eqnarray*} \begin{array}{c} = a_{11}a_{22}a_{33} + a_{12}a_{23}a_{31} + a_{13}a_{21}a_{32} + \\ - (a_{13}a_{22}a_{31} + a_{11}a_{23}a_{32} + a_{12}a_{21}a_{33})\\ \end{array} \end{eqnarray*}\]Exemplo: Dada a matriz
\[\begin{eqnarray*} A = \left[ \begin{array}{rrr} 1 & 2 & 0 \\ -1 & 3 & 2 \\ 3 &-4 & 2 \\ \end{array} \right], \end{eqnarray*}\]seu determinante é:
\[\begin{eqnarray*} det(A) = \left| \begin{array}{rrr|rr} 1 & 2 & 0 & 1 & 2 \\ -1 & 3 & 2 &-1 & 3\\ 3 &-4 & 2 & 3 &-4\\ \end{array} \right| \end{eqnarray*}\] \[\begin{eqnarray*} \begin{array}{c} = &[1.3.2+2.2.3+0.(-1).(-4)] - [0.3.3+1.2.(-4)+2.(-1).2] \\ = & (6+12+0)-(0-8-4) = 18+12 = 30\\ \end{array} \end{eqnarray*}\]No R
o derterminante de uma matriz é calculado pela
função det()
.
A = matrix(c(1,-1,3,2,3,-4,0,2,2),3,3)
print(A)
## [,1] [,2] [,3]
## [1,] 1 2 0
## [2,] -1 3 2
## [3,] 3 -4 2
det(A)
## [1] 30
Dada uma matriz quadrada \(A_{n\times n}\), se existir uma matriz quadrada \(B\), de mesma ordem, tal que \(A.B=B.A=Id_{n}\), em que \(Id_{n}\) é a matriz identidade de mesma dimensão de \(A\), então \(B\) é a inversa de \(A\) e diz-se que \(A\) é inversível. Notação \(A^{-1}\). Se \(A\) é inversível, sua inversa é única. Se \(A\) não admite inversa, diz-se que \(A\) é singular.
No R
utiliza-se a função solve()
para obter
a inversa de uma matriz.
A = matrix(c(1,2,3,4),2,2)
print(A)
## [,1] [,2]
## [1,] 1 3
## [2,] 2 4
A_inversa = solve(A)
print(A_inversa)
## [,1] [,2]
## [1,] -2 1.5
## [2,] 1 -0.5
Pode-se verificar a condição de existência
A_inversa%*%A
## [,1] [,2]
## [1,] 1 0
## [2,] 0 1
A%*%A_inversa
## [,1] [,2]
## [1,] 1 0
## [2,] 0 1
O traço de uma matriz \(A_{n\times n}\) é definido como a soma dos elementos de sua diagonal principal.
\[\begin{eqnarray*} \begin{array}{c} tr(A) = \sum_{i=1}^{n} a_{ii} = a_{11} + a_{22} + ...+ a_{nn} \end{array} \end{eqnarray*}\]No R
para calcular o traço de uma matriz, extrai-se os
elementos da diagonal principal a partir da função diag()
e
a soma destes elementos a partir da função sum()
.
A = matrix(c(1,-1,3,2,3,-4,0,2,2),3,3)
print(A)
## [,1] [,2] [,3]
## [1,] 1 2 0
## [2,] -1 3 2
## [3,] 3 -4 2
diag(A) ### extraindo os elementos da diagonal principal
## [1] 1 3 2
tr_A = sum(diag(A)) #somando os elementos da diagonal principal
print(tr_A)
## [1] 6
As raízes características de uma matriz \(A_{n\times n}\) são as soluções da equação dada pelo determinante \(|A - \lambda I| = 0\) e são chamadas de autovalores de \(A\). O Determinante \(|A - \lambda I|\) é um polinômio na variável \(\lambda\) denominado polinômio característico e denotado por \(p(\lambda) = |A - \lambda I|\).
Usando a equação característica:
\[\begin{eqnarray*} \left|\left[ \begin{array}{rr} 1 & 4 \\ 2 & 3 \\ \end{array} \right]-\lambda \left[ \begin{array}{rr} 1 & 0 \\ 0 & 1 \\ \end{array} \right] \right| = 0 \Leftrightarrow \left| \begin{array}{cc} 1 - \lambda & 4 \\ 2 & 3 - \lambda \\ \end{array} \right| = (1-\lambda)(3-\lambda) -8 = 0 \end{eqnarray*}\]Portanto,
\[\begin{eqnarray*} \begin{array}{c} p(\lambda) = \lambda^2 - 4\lambda - 5 = 0 \end{array}, \end{eqnarray*}\]desta forma as raízes \(\lambda_{1} = 5\) e \(\lambda_{2} = -1\) são os autovalores da matriz \(A\).
Determinados os autovalores \(\lambda_{i}\), pode-se encontrar os autovetores pela seguinte equação:
\[\begin{eqnarray*} \begin{array}{c} A v = \lambda v \end{array} \Leftrightarrow \begin{array}{c} (A-5 I) v = 0 \end{array} \Leftrightarrow \left\{\left[ \begin{array}{rr} 1 & 4 \\ 2 & 3 \\ \end{array} \right]-5 \left[ \begin{array}{rr} 1 & 0 \\ 0 & 1 \\ \end{array} \right] \right\} \left[ \begin{array}{c} v_{1} \\ v_{2} \\ \end{array} \right] = \left[ \begin{array}{c} 0 \\ 0 \\ \end{array} \right] \end{eqnarray*}\] \[\begin{eqnarray*}\Leftrightarrow \left[ \begin{array}{rr} -4 & 4 \\ 2 & -2 \\ \end{array} \right] \left[ \begin{array}{c} v_{1} \\ v_{2} \\ \end{array} \right] = \left[ \begin{array}{c} 0 \\ 0 \\ \end{array} \right] \Leftrightarrow \left\{ \begin{array}{r} -4v_{1} + 4v_{2} = 0 \\ 2v_{1} - 2v_{2} = 0 \\ \end{array} \right. \Leftrightarrow v_{1} = v_{2} = r \Leftrightarrow \boldsymbol{v} = \left[ \begin{array}{c} r \\ r \\ \end{array} \right], r \in \mathbb{R} \end{eqnarray*}\] \[\begin{eqnarray*} \Rightarrow \lambda_{1} = 5 \Leftrightarrow \boldsymbol{v} = r \left[ \begin{array}{c} 1 \\ 1 \\ \end{array} \right] \end{eqnarray*}\]No R
utiliza-se a função eigen()
para obter
os autovalores e autovetores de uma matriz.
R
.A = matrix(c(1,2,4,3),2,2)
print(A)
## [,1] [,2]
## [1,] 1 4
## [2,] 2 3
eigen(A)
## eigen() decomposition
## $values
## [1] 5 -1
##
## $vectors
## [,1] [,2]
## [1,] -0.7071068 -0.8944272
## [2,] -0.7071068 0.4472136
Vetor transposto: \(\boldsymbol{X}^{'} = [\boldsymbol{X}_{1} \boldsymbol{X}_{2}\dots\boldsymbol{X}_{p}]\).
Exemplo: Considere uma empresa de minério de ferro. Algumas variáveis importantes para avaliação da qualidade do minério são: \(X_{1}\) - teor de ferro (em %); \(X_{2}\) - teor de umidade e \(X_{3}\) - granulometria do minério, que são v.a.
Então \(\boldsymbol{X} = [\boldsymbol{X}_{1}\boldsymbol{X}_{2}\boldsymbol{X}_{3}]^{'}\) é um vetor com \(p = 3\).
Exemplo: Uma seleção de 4 firmas de ração de Minas Gerais foi obtida para avaliar a venda de rações. Cada observação bivariada forneceu a quantidade de sacos de ração vendidos e a quantidade de reais de cada venda. Os dados obtidos na forma tabular são:
\[\begin{eqnarray*} \begin{array}{l|cccc}\hline \text{Váriavel 1 (reais/vendas)} & 80 & 120 & 90 & 110 \\ \hline \text{Váriavel 2 (número de sacos de ração vendidos)} & 10 & 12 & 6 & 8\\ \hline \end{array} \end{eqnarray*}\]Pode-se escrever estes dados na forma matricial.
\[\begin{eqnarray*}\boldsymbol{X}=\left[ \begin{array}{cc} X_{11} & X_{12} \\ X_{21} & X_{22} \\ X_{31} & X_{32} \\ X_{41} & X_{42} \\ \end{array} \right] = \left[ \begin{array}{rr} 80 & 10 \\ 120 & 12 \\ 90 & 6 \\ 110 & 8 \\ \end{array} \right] \end{eqnarray*}\]R
.M1 = matrix(c(80,120,90,110,10,12,6,8),4,2,byrow = FALSE)
M1
## [,1] [,2]
## [1,] 80 10
## [2,] 120 12
## [3,] 90 6
## [4,] 110 8
em que \(\mu_{i}=E(X_{i})\) é a média ou esperança da v.a. \(X_{i}\), \(i=1,2,...,p\).
A covariância amostral entre duas variáveis \(X_{j}\) e \(X_{j^{'}}\), que mede o grau de relacionamento linear entre elas, é dada por:
\[\begin{eqnarray*} S_{jj^{'}} = \dfrac{\displaystyle\sum_{i=1}^{p} (X_{ij}-\bar{X}_{j})(X_{ij^{'}}-\bar{X}_{j^{'}})}{n-1}, \text{com j=j$^{'}$=1,2,...,p.} \end{eqnarray*}\]O grau de correlação entre \(X_{j}\) e \(X_{j^{'}}\) é dada por:
\[\begin{eqnarray*} r_{jj^{'}} = \dfrac{S_{jj^{'}}}{\sqrt{S_{jj}}\sqrt{S_{jj'}}} = \dfrac{\displaystyle\sum_{i=1}^{n} (X_{ij}-\bar{X}_{j})(X_{ij^{'}}-\bar{X}_{j^{'}})}{\sqrt{\displaystyle\sum_{i=1}^{n} (X_{ij}-\bar{X}_{j})^{2}}\sqrt{\displaystyle\sum_{i=1}^{n}(X_{ij^{'}}-\bar{X}_{j^{'}}} )^{2}} \end{eqnarray*}\]Voltando ao exemplo anterior, temos:
\[\begin{eqnarray*} \bar{X}_{1} = \dfrac{\displaystyle \sum_{i=1}^{4} X_{i1}}{4} = \dfrac{80 + 120 + 90 + 110}{4} = 100 \end{eqnarray*}\] \[\begin{eqnarray*} \bar{X}_{2} = \dfrac{\displaystyle \sum_{i=1}^{4} X_{i2}}{4} = \dfrac{10 + 12 + 6 + 8}{4} = 9 \end{eqnarray*}\]Portanto, o vetor de médias é:
\[\begin{eqnarray*}\boldsymbol{\bar{X}}=\left[ \begin{array}{c} \bar{X}_{1} \\ \bar{X}_{2} \\ \end{array} \right] = \left[ \begin{array}{c} 100 \\ 9 \\ \end{array} \right] \end{eqnarray*}\]Agora, calculando as covariâncias
\[\begin{eqnarray*} \begin{array}{ll} S_{11} = & \dfrac{\left[ (80-100) ^{2} + (120-100)^{2} + (90-100)^{2} + (110-100)^{2}\right] }{3} = 333,333 \\ S_{22} = & \dfrac{\left[ (10-9) ^{2} + (12-9)^{2} + (6-9)^{2} + (8-9)^{2}\right] }{3} = 6,667 \\ S_{12} =& [(80-100)(10-9)+(120-100)(12-9) \\ & +(90-100)(6-9)+(110-100)(8-9)]/3 = 20 \\ S_{21} = S_{12} & = 20 \\ \end{array} \end{eqnarray*}\]Matriz de covariância
\[\begin{eqnarray*}\boldsymbol{S}=\left[ \begin{array}{cc} S_{11} & S_{12} \\ S_{21} & S_{22} \\ \end{array} \right] = \left[ \begin{array}{cc} 333,333 & 20,000 \\ 20,000 & 6,667 \\ \end{array} \right] \end{eqnarray*}\]Calculando as correlações
\[\begin{eqnarray*} r_{12} = \dfrac{S_{12}}{\sqrt{S_{11}}\sqrt{S_{12}}} = \dfrac{20}{\sqrt{333,333}\sqrt{6,667}} = 0,4243, \end{eqnarray*}\]Matriz de correlação
como \(r_{21}=r_{12} = 0,4243\), temos
\[\begin{eqnarray*}\boldsymbol{R}=\left[ \begin{array}{cc} r_{11} & r_{12} \\ r_{21} & r_{22} \\ \end{array} \right] = \left[ \begin{array}{cc} 1,0000 & 0,4243 \\ 0,4243 & 1,0000 \\ \end{array} \right] \end{eqnarray*}\]Soluções no R
M1 = matrix(c(80,120,90,110,10,12,6,8),4,2,byrow = FALSE)
print(M1)
## [,1] [,2]
## [1,] 80 10
## [2,] 120 12
## [3,] 90 6
## [4,] 110 8
med_x1 = mean(M1[,1])
med_x1
## [1] 100
med_x2 = mean(M1[,2])
med_x2
## [1] 9
rbind(med_x1,med_x2)
## [,1]
## med_x1 100
## med_x2 9
S = var(M1)
S
## [,1] [,2]
## [1,] 333.3333 20.000000
## [2,] 20.0000 6.666667
R = cor(M1)
R
## [,1] [,2]
## [1,] 1.0000000 0.4242641
## [2,] 0.4242641 1.0000000
A variância total do vetor aleatório \(\boldsymbol{X}\) é definida como:
\[\begin{eqnarray*} \begin{array}{c} \text{traço} (\boldsymbol{S}_{p\times p}) = tr(\boldsymbol{S}_{p\times p}) = S_{11}+S_{22} + ...+ S_{pp} \end{array} \end{eqnarray*}\]É definida como o determinante da matriz \(\boldsymbol{S}_{p\times p}\), ou seja, \(|\boldsymbol{S}_{p\times p}|\). Ao contrário da variância total, ela é influenciada pelas covariâncias (ou correlações) entre as variáveis \(X_{i}\), \(i=1,2,...,p\).
Exemplo: Coletou-se uma amostra de 12 rochas de uma determinada região. Para cada rocha, tem-se as porcentagens de quartzo (\(X_{1}\)) e feldspato (\(X_{2}\)), além do valor de um índice que mede a sua cor (\(X_{3}\)).
\[\begin{eqnarray*} \begin{array}{cccc}\hline \text{Rocha} & \text{Quartzo (%)} & \text{Feldspato (%)} & \text{Cor} \\ \hline 1 & 39,6 & 73,0 & 3,6 \\ 2 & 38,9 & 57,4 & 2,7 \\ 3 & 4,9 & 74,3 & 18,8 \\ 4 & 4,5 & 63,9 & 30,5 \\ 5 & 13,7 & 64,0 & 21,2 \\ 6 & 30,9 & 65,1 & 1,2 \\ 7 & 27,9 & 69,1 & 5,6 \\ 8 & 23,7 & 76,0 & 3,4 \\ 9 & 20,1 & 74,1 & 8,9 \\ 10 & 16,4 & 61,7 & 35,9 \\ 11 & 15,0 & 65,6 & 16,6 \\ 12 & 18,4 & 62,5 & 14,2 \\ \hline \end{array} \end{eqnarray*}\]