Neste trabalho, a proposta é aplicar de um modelo de regressão linear múltipla para prever o nível de degradação da pastagem com base em variáveis explicativas relacionadas ao estágio de desenvolvimento das plantas, presença de invasoras, cupins, e outras variáveis indicativas da condição da pastagem.
2. Descrição dos Dados
Em cada unidade amostral avaliadores atribuíram ao analisar visualmente as características da pastagem, e atribuíram nota de 1 a 7. As variáveis incluíam:
Estágio de desenvolvimento das plantas
Presença de invasoras
Presença de cupins
Cobertura vegetal do solo
Disponibilidade de forragem
Disponibilidade de folhas verdes
Condição Atual da pastagem
Potencial Produtivo
Nível de Degradação
Manejo
3. Metodologia
Neste trabalho, aplicamos a regressão linear múltipla para prever o nível de degradação das pastagens com base em variáveis relacionadas à altura do dossel, presença de invasoras, presença de cupins, cobertura vegetal, entre outras características da pastagem.
Além disso, utilizamos a correlação intraclasse (ICC) para avaliar a concordância entre diferentes avaliadores que atribuíram notas às variáveis da pastagem, garantindo a consistência das medidas.
Para garantir que as variáveis estivessem na mesma direção e fossem comparáveis, realizamos uma padronização das escalas. Algumas variáveis tinham a escala onde valores mais baixos indicavam melhores condições (como a presença de invasoras), enquanto em outras, valores mais altos indicavam melhores condições (como disponibilidade de folhas verdes).
4. Resultados
Limitações
Multicolinearidade
Diagnóstico de Resíduos
Homocedasticidade
Normalidade dos erros
Principais pontos:
1. Avaliação de Concordância:: A CIC indica o grau de semelhança nas classificações.
2. Cálculo: Baseia-se na comparação da variabilidade total entre e dentro dos avaliadores.
3. Interpretação: Valores próximos a 1 indicam alta concordância; valores próximos a 0, baixa concordância.
4. Aplicações: É utilizada em pesquisa clínica, psicometria e avaliação educacional.
Com respeito degradação pode observar uma for correlação deesta variavel com a quantidade de invasoras uma vez que um grande proporção de invasors dos mostra que o solo não esta rico em um vegetação condizente com aquela que lhe traria maiores beneficios.
Destacamos tambem 5 variaveis que possuem um correlação modera ou forte entre si (todas positiva)
CobertSolo (moderada com todas)
DispForr (moderada com CobertSolo, forte com as demais)
DispFolhVerd ( moderada para fraca com CobertSolo, forte com as demais)
CondAtual ( moderadda com CobertSolo,muito forte com PotProd, e fortes com as demais)
PotProd ( moderada com CobertSolo,muito forte com CondAtual e fortes com as demais)
Limitações
Multicolinearidade
Diagnóstico de Resíduos
Homocedasticidade
Normalidade dos erros
Correlação intra-classe para testar a concordância entre avaliadores
Ajuste das escalas
Code
#trocando NA pela medianadados_escores=read.csv("C:/Users/Aman_/Downloads/dados_escores (1) (1).csv")for(i in8:18){ dados_faltantes=is.na(dados_escores[,i]) media=median(dados_escores[,i],na.rm = T) dados_escores[,i][which(dados_faltantes)] = media} dados = dados_escores # pradronização:bom_pra_ruim =c(9,10,11,17)for ( i in bom_pra_ruim){#if( dados[,i] != NA ) dados[,i] =8-as.vector(dados[,i])}
Code
library(readxl)library(irr)dados_escores=read.csv("C:/Users/Aman_/Downloads/dados_escores (1) (1).csv")dados_geoloc_classe <-read_excel("C:/Users/Aman_/Downloads/dados_geoloc_classe.xlsx")dados_escores <- dados#trocando NA pela medianafor(i in8:18){ dados_faltantes=is.na(dados_escores[,i])media=median(dados_escores[,i],na.rm = T)dados_escores[,i][which(dados_faltantes)] = media}#Fragmentando os dados pelos pontostabela=split(dados_escores,dados_escores$Ponto)n=length(tabela)#Calculando o Coenficiente de correlação intra-classecoefi=c()for (i in1:n) {tab1=tabela[[i]][7:18]tab1 = tab1[-2]teste=subset(tab1, select =c(EstDesenv,Invasoras,Cupins,CobertSolo,DispForr,DispFolhVerd,CondAtual,PotProd,Degrad,Manejo))a=data.frame(t(teste))coefi[i]=icc(a)$value}#os coeficientes calculados coefi
library(ggplot2)dados <-read.csv("C:/Users/Aman_/Downloads/dados_escores (1).csv")df <- dados[, 9:18]df <-sapply(df, as.numeric)correlacoes <-cor(df, use ="complete.obs")df_cor <-as.data.frame(as.table(correlacoes))colnames(df_cor) <-c("Var1", "Var2", "Correlation")p <-ggplot(df_cor, aes(x = Var1, y = Var2, fill = Correlation)) +geom_tile() +scale_fill_gradient2(low ="#D1E5F0", high ="#92C5DE", mid ="white", midpoint =0) +labs(title ='Correlação entre Variáveis', x ='Variável 1', y ='Variável 2') +theme(axis.text.x =element_text(angle =45, hjust =1)) +geom_text(aes(label =round(Correlation, 2)), color ="black", size =4)p
Com respeito degradação pode observar uma for correlação deesta variavel com a quantidade de invasoras uma vez que um grande proporção de invasors dos mostra que o solo não esta rico em um vegetação condizente com aquela que lhe traria maiores beneficios.
Destacamos tambem 5 variaveis que possuem um correlação modera ou forte entre si (todas positiva)
CobertSolo (moderada com todas)
DispForr (moderada com CobertSolo, forte com as demais)
DispFolhVerd ( moderada para fraca com CobertSolo, forte com as demais)
CondAtual ( moderadda com CobertSolo,muito forte com PotProd, e fortes com as demais)
PotProd ( moderadda com CobertSolo,muito forte com CondAtual e fortes com as demais)
Mapa temático com base no que nos foi dito sobre o tipo de degradação
Code
dados <-read_excel("C:/Users/Aman_/Downloads/dados_geoloc_classe.xlsx")dados
# A tibble: 460 × 11
PontoID Ponto LON LAT REGIAO UF ESTADO gridM_ID gridG_ID LOCCLASS
<dbl> <chr> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <chr>
1 750 M1001-E1-… -50.8 -15.4 Centr… GO Goiás M1001 G15 outside
2 748 M1001-E1-… -50.8 -15.5 Centr… GO Goiás M1001 G15 inside
3 713 M1009-E3-… -50.8 -16.1 Centr… GO Goiás M1009 G15 inside
4 708 M1009-E3-… -50.8 -16.2 Centr… GO Goiás M1009 G15 inside
5 706 M1009-E3-… -50.8 -16.2 Centr… GO Goiás M1009 G15 outside
6 705 M1009-E3-… -50.8 -16.2 Centr… GO Goiás M1009 G15 inside
7 710 M1009-E3-… -50.8 -16.2 Centr… GO Goiás M1009 G15 inside
8 711 M1009-E3-… -50.8 -16.2 Centr… GO Goiás M1009 G15 inside
9 709 M1009-E3-… -50.8 -16.2 Centr… GO Goiás M1009 G15 outside
10 712 M1009-E3-… -50.8 -16.2 Centr… GO Goiás M1009 G15 outside
# ℹ 450 more rows
# ℹ 1 more variable: CLASS_DED <chr>
# TRATAMENTOdados_escores=read.csv("C:/Users/Aman_/Downloads/dados_escores (1) (1).csv")#trocando NA pela medianafor(i in8:18){ dados_faltantes=is.na(dados_escores[,i]) media=median(dados_escores[,i],na.rm = T) dados_escores[,i][which(dados_faltantes)] = media} dados = dados_escores dados
# pradronização:bom_pra_ruim =c(9,10,11,17)for ( i in bom_pra_ruim){#if( dados[,i] != NA ) dados[,i] =8-as.vector(dados[,i])}# modelo de regressãoattach(dados)DADOS = dados[,8:18]ajuste =lm( Degrad ~ ., data = DADOS )#install.packages("MASS")require(MASS) #pacote necessário para usar o comando abaixo.fit.model =stepAIC(ajuste)
Non-constant Variance Score Test
Variance formula: ~ fitted.values
Chisquare = 13.91973, Df = 1, p = 0.00019078
Code
new_data =as.data.frame(dados[,8:18])y_chapeu =predict(fit.model, newdata = new_data )y_chapeu =round(y_chapeu,2)#y_chapeu# não rejeitou pra homoceidasticidade e pra normalidade dos resíduos.# verificar a distância de cookiesummary(y_chapeu)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.260 4.115 5.080 4.930 5.850 7.630
Code
## tabela de classificação:library(dplyr)library(tidyr)library(knitr)library(kableExtra)tipo_deg =c( "Degradação Biológica Severa","Degradação Agrícola Severa","Degradação Moderada" ,"Degradação Baixa","Não degradada" )row_names <-c("[1; 2.4)", "[2.4; 3.8)", "[3.8; 5.2)", "[5.2; 6.6)", "(6.6; 8]")df =data.frame( row_names, tipo_deg )colnames(df) <-c("Intervalos","Degradação")# outra tabela# Criar a tabela formatada usando kable e aplicar cor azultabela2 <-kable(df, caption ="Tabela de Degradação do Pasto. Fonte: LAPIG", align ="c") %>%row_spec(0, background ="#92C5DE", color ="white") %>%# Cabeçalho azulrow_spec(1:nrow(df), background ="#D1E5F0") # Linhas com fundo azul claro# Exibir a tabelatabela2
Tabela de Degradação do Pasto. Fonte: LAPIG
Intervalos
Degradação
[1; 2.4)
Degradação Biológica Severa
[2.4; 3.8)
Degradação Agrícola Severa
[3.8; 5.2)
Degradação Moderada
[5.2; 6.6)
Degradação Baixa
(6.6; 8]
Não degradada
Code
## A tabela das contagens# Definir os intervalosintervalos <-c(1.2, 2.4, 3.8, 5.2, 6.6, 8)# Classificar os dados em intervaloscategorias <-cut(y_chapeu, breaks = intervalos, right =FALSE, labels = row_names)# Contar as ocorrências em cada intervalotabela_contagem <-as.data.frame(table(categorias))# Renomear colunas do data framecolnames(tabela_contagem) <-c("Intervalos", "Degradação (frequência)")# Criar a tabela formatada usando kable e aplicar cor azultabela <-kable(tabela_contagem, caption ="Tabela de Degradação do Pasto. Fonte: LAPIG", align ="c") %>%row_spec(0, background ="#92C5DE", color ="white") %>%# Cabeçalho azulrow_spec(1:nrow(tabela_contagem), background ="#D1E5F0") # Linhas com fundo azul clarotabela
Tabela de Degradação do Pasto. Fonte: LAPIG
Intervalos
Degradação (frequência)
[1; 2.4)
69
[2.4; 3.8)
258
[3.8; 5.2)
536
[5.2; 6.6)
570
(6.6; 8]
166
Code
attach(dados)for(i in8:18){ dados[,i] <-sqrt(dados[,i])}DADOS = dados[,8:18]ajuste =lm( dados$Degrad ~ ., data = DADOS )#install.packages("MASS")require(MASS) #pacote necessário para usar o comando abaixo.fit.model =stepAIC(ajuste)