Estatística Descritiva Multivariada

Exercícios para amostras multivariadas : Os dados referem-se ao diâmetro (DAP) e altura (H) de duas espécies de eucalipto (X e Y). Calcule

a) o vetor de médias para as variáveis

Criando vetores para os dados da Espécie A e B

Definimos a matriz X que contém os dados fornecidos no exercício. A primeira linha corresponde aos valores da variável \(X_1\) e a segunda linha corresponde aos valores da variável \(X_2\) usamos a função matrix() para criar a matriz e especificamos nrow = 2 para indicar que a matriz tem 2 linhas (uma para cada variável) e byrow = TRUE para preencher a matriz por linha.

diametroA <- c(5.7, 8.9, 6.2, 5.8, 6.8, 6.2)
alturaA <- c(2.1, 1.9, 1.98, 1.92, 2, 2.01)


diametroB <- c(4.4, 7.5, 5.4, 4.6, 5.9, NA)  # Adicionando NA para manter o comprimento igual
alturaB <- c(1.8, 1.75, 1.78, 1.89, 1.9, NA)  # Adicionando NA para manter o comprimento igual


join_AB <- data.frame(DAP_A = diametroA,
                      HA = alturaA,
                      DAP_B = diametroB,
                      HB = diametroB)

Tabela dos dados Para uma melhor visualização

datatable(join_AB, extensions = "Buttons",
          options = list(dom = "Bfetip",
                         buttons = c("pdf")))

a) Vetor de médias para a Espécie A e B

Utilizamos a função colMeans() para calcular as médias de cada coluna da matriz X. Isso nos fornece as médias das variáveis \(X_1\) e \(X_2\) armazenamos as médias em um vetor chamado media_A

media_A <- colMeans(data.frame(DAP = diametroA, HA = alturaA))
cat("Vetor de médias para a Espécie A:", media_A, "\n")

## Vetor de médias para a Espécie A: 6.6 1.985

media_B <- colMeans(data.frame(DAP_B = diametroB[!is.na(diametroB)], HB = alturaB[!is.na(alturaB)]))
cat("Vetor de médias para a Espécie B:", media_B, "\n")

## Vetor de médias para a Espécie B: 5.56 1.824

b) Matriz de variância/covariância para a Espécie A e B

Usamos a função cov() para calcular a matriz de covariância das variáveis em X. Antes de calcular a matriz de covariância, transpomos a matriz X usando t(X) para que as variáveis sejam tratadas como colunas. Isso porque a função cov() espera que cada coluna represente uma variável. A matriz de covariância nos fornece informações sobre como as variáveis se relacionam umas com as outras.

cov_A <- cov(data.frame(DAP_A = diametroA, HA = alturaA))
cat("Matriz de variância/covariância para a Espécie A:\n")

## Matriz de variância/covariância para a Espécie A:

print(cov_A)

##         DAP_A       HA
## DAP_A  1.4200 -0.05040
## HA    -0.0504  0.00511

cov_B <- cov(data.frame(DAP_B = diametroB, HB = alturaB), use="complete.obs")
cat("Matriz de variância/covariância para a Espécie B:\n")

## Matriz de variância/covariância para a Espécie B:

print(cov_B)

##          DAP_B       HB
## DAP_B  1.54300 -0.03655
## HB    -0.03655  0.00453

c) Matriz de correlações para a Espécie A e B

Utilizamos a função cor() para calcular a matriz de correlação das variáveis em \(X\). Novamente, transpomos a matriz \(X\) antes de calcular a matriz de correlação para que as variáveis sejam tratadas como colunas. A matriz de correlação nos fornece informações sobre a direção e a força da relação linear entre as variáveis.

cor_A <- cor(data.frame(DAP = diametroA, HA = alturaA))
cat("Matriz de correlações para a Espécie A:\n")

## Matriz de correlações para a Espécie A:

print(cor_A)

##           DAP        HA
## DAP  1.000000 -0.591665
## HA  -0.591665  1.000000

cor_B <- cor(data.frame(DAP = diametroB, HB = alturaB), use = "complete.obs")
cat("Matriz de correlações para a Espécie B:\n")

## Matriz de correlações para a Espécie B:

print(cor_B)

##           DAP        HB
## DAP  1.000000 -0.437175
## HB  -0.437175  1.000000

d) Calculando a distância de Mahalanobis para a Espécie A e B

dist_Mahalanobis_A <- mahalanobis(x = data.frame(DAP = diametroA, H = alturaA), center = media_A, cov = cov_A)
cat("Distância de Mahalanobis para a Espécie A:\n")

## Distância de Mahalanobis para a Espécie A:

print(dist_Mahalanobis_A)

## [1] 2.6475178 3.7287640 0.2236410 3.0770519 0.1752106 0.1478147

dist_Mahalanobis_B <- mahalanobis(x = data.frame(DAP = diametroB, H = alturaB), center = media_B, cov = cov_B)
cat("Distância de Mahalanobis para a Espécie B:\n")

## Distância de Mahalanobis para a Espécie B:

print(dist_Mahalanobis_B)

## [1] 1.5952634 2.6538094 0.6398854 1.1080058 2.0030360        NA

3) Considerando duas variáveis X1 e X2, com 4 medidas em cada uma delas, obteve-se os seguintes resultados:

# Dados
X <- matrix(c(42, 52, 48, 58, 4, 5, 4, 3), nrow = 2, byrow = TRUE) # nrow = 2 para indicar que a matriz tem 2 linhas (uma para cada variável) e byrow = TRUE para preencher a matriz por linha.

a) Médias

medias <- colMeans(X)
print("Medias:")

## [1] "Medias:"

print(medias)

## [1] 23.0 28.5 26.0 30.5

b) Matriz de covariância

covariancia <- cov(t(X))
print("Matriz de covariância:")

## [1] "Matriz de covariância:"

print(covariancia)

##          [,1]       [,2]
## [1,] 45.33333 -2.0000000
## [2,] -2.00000  0.6666667

c) Matriz de correlação

correlacao <- cor(t(X))
print("Matriz de correlação:")

## [1] "Matriz de correlação:"

print(correlacao)

##            [,1]       [,2]
## [1,]  1.0000000 -0.3638034
## [2,] -0.3638034  1.0000000