Datathon

Author

Assintóticos

1. Introdução

Neste trabalho, a proposta é aplicar de um modelo de regressão linear múltipla para prever o nível de degradação da pastagem com base em variáveis explicativas relacionadas ao estágio de desenvolvimento das plantas, presença de invasoras, cupins, e outras variáveis indicativas da condição da pastagem.

2. Descrição dos Dados

Em cada unidade amostral avaliadores atribuíram ao analisar visualmente as características da pastagem, e atribuíram nota de 1 a 7. As variáveis incluíam:
Estágio de desenvolvimento das plantas
Presença de invasoras
Presença de cupins
Cobertura vegetal do solo
Disponibilidade de forragem
Disponibilidade de folhas verdes
Condição Atual da pastagem
Potencial Produtivo
Nível de Degradação
Manejo

3. Metodologia

Neste trabalho, aplicamos a regressão linear múltipla para prever o nível de degradação das pastagens com base em variáveis relacionadas à altura do dossel, presença de invasoras, presença de cupins, cobertura vegetal, entre outras características da pastagem.
Além disso, utilizamos a correlação intraclasse (ICC) para avaliar a concordância entre diferentes avaliadores que atribuíram notas às variáveis da pastagem, garantindo a consistência das medidas.
Para garantir que as variáveis estivessem na mesma direção e fossem comparáveis, realizamos uma padronização das escalas. Algumas variáveis tinham a escala onde valores mais baixos indicavam melhores condições (como a presença de invasoras), enquanto em outras, valores mais altos indicavam melhores condições (como disponibilidade de folhas verdes).

4. Resultados

Limitações
Multicolinearidade
Diagnóstico de Resíduos
Homocedasticidade
Normalidade dos erros
Principais pontos:
1. Avaliação de Concordância:: A CIC indica o grau de semelhança nas classificações.
2. Cálculo: Baseia-se na comparação da variabilidade total entre e dentro dos avaliadores.
3. Interpretação: Valores próximos a 1 indicam alta concordância; valores próximos a 0, baixa concordância.
4. Aplicações: É utilizada em pesquisa clínica, psicometria e avaliação educacional.
Com respeito degradação pode observar uma for correlação deesta variavel com a quantidade de invasoras uma vez que um grande proporção de invasors dos mostra que o solo não esta rico em um vegetação condizente com aquela que lhe traria maiores beneficios.
Destacamos tambem 5 variaveis que possuem um correlação modera ou forte entre si (todas positiva)
CobertSolo (moderada com todas)
DispForr (moderada com CobertSolo, forte com as demais)
DispFolhVerd ( moderada para fraca com CobertSolo, forte com as demais)
CondAtual ( moderadda com CobertSolo,muito forte com PotProd, e fortes com as demais)
PotProd ( moderada com CobertSolo,muito forte com CondAtual e fortes com as demais)
Limitações
Multicolinearidade
Diagnóstico de Resíduos
Homocedasticidade
Normalidade dos erros

Correlação intra-classe para testar a concordância entre avaliadores

Ajuste das escalas

  [1] 0.8820862 0.9429537 0.8850356 0.9176201 0.9408034 0.6802326 0.9453165
  [8] 0.9316778 0.8522034 0.9281437 0.9268293 0.9538715 0.9574909 0.9623800
 [15] 0.9383077 0.9383077 0.9620966 0.9925368 0.9624949 0.9821447 0.9782354
 [22] 0.9445398 0.9818274 0.9787360 0.9700491 0.9491028 0.9899153 0.9645991
 [29] 0.9256680 0.9311927 0.9956240 0.9008811 0.9073549 0.9422222 0.8722397
 [36] 0.9550477 0.9606223 0.8643933 0.8152794 0.9853367 0.9461161 0.9496537
 [43] 0.9712690 0.9676259 0.9560595 0.9227675 0.6307692 0.9219089 0.8422535
 [50] 0.9480941 0.9842288 0.9672292 0.9832985 0.9520091 0.9694094 0.9090690
 [57] 0.9312977 0.9540347 0.9971087 0.9268623 0.9500231 0.9251969 0.9788484
 [64] 0.9659179 0.9703550 0.8423792 0.9662447 0.9404707 0.9474865 0.9129992
 [71] 0.9615434 0.9325200 0.9831513 0.9782976 0.9800713 0.9585761 0.8166719
 [78] 0.9467080 0.9894026 0.9880689 0.9905660 0.9623022 0.9771574 0.6662494
 [85] 0.9881152 0.9113924 0.9519288 0.9862339 0.9614351 0.9902289 0.9731966
 [92] 0.9819225 0.9695510 0.9902360 0.9832631 0.9821266 0.9757456 0.9595142
 [99] 0.9975550 0.8960924 0.9006791 0.9723997 0.9283186 0.8892535 0.9136000
[106] 0.9481434 0.9466825 0.9652733 0.9092123 0.9585901 0.9259580 0.9743330
[113] 0.9220000 0.6426799 0.9013503 0.8855619 0.9469628 0.9283484 0.9462763
[120] 0.9350181 0.9295605 0.9935355 0.9780349 0.9374517 0.9215452 0.8426396
[127] 0.8021173 0.9784141 0.9257349 0.9571234 0.9730449 0.9205415 0.8203422
[134] 0.9527709 0.9315113 0.9598528 0.9587083 0.9618326 0.9735400 0.9862069
[141] 0.9503228 0.9758165 0.9835580 0.9603541 0.9052485 0.9829921 0.8787456
[148] 0.9215515 0.9269939 0.8834951 0.9416253 0.8439358 0.9425437 0.9897605
[155] 0.9685561 0.9170900 0.8943894 0.9333424 0.9335541 0.9350474 0.9569892
[162] 0.9445435 0.9424102 0.9701195 0.9692775 0.9389642 0.9806498 0.9595741
[169] 0.9518048 0.9788600 0.9496477 0.9777175 0.9694190 0.9295605 0.9904863
[176] 0.9243371 0.9954515 0.9933623 0.9826756 0.9465573 0.9944965 0.9837467
[183] 0.8666301 0.9896074 0.9561985 0.9448121 0.9478338 0.8851064 0.9267337
[190] 0.9422714 0.4361659 0.9809742 0.9402655 0.9592487 0.9694471 0.9969560
[197] 0.9959921 0.9199639 0.9623693 0.9654289 0.9796561 0.9711607 0.9819663
[204] 0.9855247 0.9822699 0.9800118 0.9675919 0.9704775 0.9918404 0.9786195
[211]        NA 0.8072626 0.9573544 0.9731610 0.9745523 0.9777385 0.9664358
[218] 0.9782469 0.9628202 0.9677548 0.9120007        NA 0.9467940 0.9708056
[225] 0.7005119 0.9548193 0.9694647 0.9645343 0.9310646 0.9823622 0.9865861
[232] 0.9860366 0.9481218 0.9788836 0.9802285 0.9421346 0.9901878 0.8631882
[239] 0.9901289 0.9445848 0.8878482 0.8357864 0.9657004 0.8125571 0.9905429
[246] 0.9433368 0.9662594 0.9527917 0.8885736 0.5208872 0.9498374 0.9648965
[253] 0.9484979 0.9412172 0.9687988 0.8374974 0.9710823 0.9395085 0.7575170
[260] 0.9634375 0.9694533 0.9559514 0.9697105 0.9470699 0.9589690 0.9674008
[267] 0.9795975 0.9744582 0.9393812 0.9392934 0.9453770 0.8437606 0.9713518
[274] 0.8027888 0.9403535 0.9357449 0.9065097 0.9873287 0.9522257 0.9411666
[281] 0.8389262 0.9529148 0.9727312 0.9451715 0.9381779 0.8279966 0.9364899
[288] 0.8905727 0.9723025 0.9897603 0.9623706 0.9780903 0.9424168 0.9815100
[295] 0.9823918 0.9865737 0.9601838 0.9727317 0.9971851 0.9560286 0.9358289
[302] 0.9353413 0.9336813 0.9740509 0.9284084 0.9641616 0.9205663 0.9769686
[309] 0.9494606 0.9681609 0.9713646 0.9903983 0.9888715 0.9922469 0.9495327
[316] 0.9768127 0.9644643 0.9719140 0.9913190 0.9504814 0.9437796 0.9099656
[323] 0.9905153 0.9779951 0.9425299 0.9221757 0.9653361 0.9719273 0.9917341
[330] 0.9586931 0.9666880 0.9725203 0.9378587 0.9429083 0.9671302 0.9450709
[337] 0.9832780 0.9862962 0.9687391 0.9661903 0.9313208 0.9287129 0.9127221
[344] 0.9797737 0.8358013 0.9552020 0.9292058 0.9255700 0.9281162 0.9705611
[351] 0.9094719 0.9560738 0.9684825 0.9347125 0.9389681 0.9164948 0.9752869
[358] 0.9762857 0.9830491 0.9922302 0.8825406 0.8354849 0.9878586 0.9710635
[365] 0.9779622 0.9567993 0.9408129 0.9338434 0.9394442 0.9819691 0.8295681
[372] 0.9438608 0.8244353 0.9383186 0.9698526 0.9772600 0.8758213 0.9770017
[379] 0.9621584 0.9452998 0.9303765 0.9846613 0.9009670 0.9068162 0.8861591
[386] 0.9621381 0.9233764 0.9398688 0.9477228 0.9388900 0.9026825 0.8025373
[393] 0.9722968 0.9205452 0.9713545 0.9846939 0.9759725 0.9179830 0.9688372
[400] 0.9019650 0.9557241 0.9226213 0.9335396 0.9718326 0.9549786 0.9301875
[407] 0.9779151 0.8947325 0.9842800 0.6142857 0.8189330 0.9106466 0.9929742
[414] 0.9639175 0.9812109 0.9809813 0.9704132 0.9772279 0.9693931 0.9637987
[421] 0.9692387 0.9804125 0.9420745 0.9455401 0.9538330 0.9727960 0.9284010
[428] 0.9471973 0.9505455 0.9585862 0.9708108 0.9904249 0.9774122 0.9820870
[435] 0.9940367 0.9782308 0.9667760 0.9460951 0.9732254 0.9432956 0.9578501
[442] 0.8802218 0.9674110 0.8876872 0.9989576 0.8307081 1.0000000 0.9929190
[449] 0.8808756 0.9607477 0.9397199 0.9916201 0.9491252 0.9939712 0.9938928
[456] 0.9872931 0.8901136 0.9732048 0.9143202 0.8205643 0.9749884 0.8975232
[463] 0.9050800 0.9428186 0.9836533 0.9483578 0.9953807 0.9856383 0.8958646
[470] 0.9723116 0.7158169 0.9299109
Média dos coeficientes: 0.9406097

A média está perto de 1, o que significa que eles concordam entre si.


 Degradação Agrícola Severa            Degradação Baixa 
                         53                          88 
Degradação Biológica Severa         Degradação Moderada 
                         51                         201 
              Não degradada 
                         67 


 Degradação Agrícola Severa            Degradação Baixa 
                      11.52                       19.13 
Degradação Biológica Severa         Degradação Moderada 
                      11.09                       43.70 
              Não degradada 
                      14.57 

Com respeito degradação pode observar uma for correlação deesta variavel com a quantidade de invasoras uma vez que um grande proporção de invasors dos mostra que o solo não esta rico em um vegetação condizente com aquela que lhe traria maiores beneficios.
Destacamos tambem 5 variaveis que possuem um correlação modera ou forte entre si (todas positiva)
CobertSolo (moderada com todas)
DispForr (moderada com CobertSolo, forte com as demais)
DispFolhVerd ( moderada para fraca com CobertSolo, forte com as demais)
CondAtual ( moderadda com CobertSolo,muito forte com PotProd, e fortes com as demais)
PotProd ( moderadda com CobertSolo,muito forte com CondAtual e fortes com as demais)

Mapa temático com base no que nos foi dito sobre o tipo de degradação

Nossos próprio jeito de avaliar os níveis

Nível de ruim para bom

1 é muito ruim

7 é muito bom

Start:  AIC=-1105.01
Degrad ~ Altura + EstDesenv + Invasoras + Cupins + CobertSolo + 
    DispForr + DispFolhVerd + CondAtual + PotProd + Manejo

               Df Sum of Sq     RSS      AIC
- CondAtual     1      0.01  790.23 -1106.99
- DispForr      1      0.04  790.26 -1106.94
- Cupins        1      0.77  791.00 -1105.44
<none>                       790.22 -1105.01
- DispFolhVerd  1      1.30  791.52 -1104.39
- Altura        1      4.48  794.70 -1097.97
- EstDesenv     1      4.76  794.98 -1097.41
- Manejo        1     14.57  804.80 -1077.79
- PotProd       1     16.48  806.70 -1074.01
- CobertSolo    1     66.13  856.35  -978.50
- Invasoras     1    694.39 1484.62   -98.68

Step:  AIC=-1106.99
Degrad ~ Altura + EstDesenv + Invasoras + Cupins + CobertSolo + 
    DispForr + DispFolhVerd + PotProd + Manejo

               Df Sum of Sq     RSS      AIC
- DispForr      1      0.03  790.26 -1108.93
- Cupins        1      0.77  791.00 -1107.44
<none>                       790.23 -1106.99
- DispFolhVerd  1      1.32  791.55 -1106.32
- Altura        1      4.49  794.72 -1099.93
- EstDesenv     1      4.75  794.98 -1099.40
- Manejo        1     14.75  804.98 -1079.41
- PotProd       1     24.20  814.43 -1060.76
- CobertSolo    1     66.37  856.60  -980.03
- Invasoras     1    694.64 1484.87  -100.41

Step:  AIC=-1108.93
Degrad ~ Altura + EstDesenv + Invasoras + Cupins + CobertSolo + 
    DispFolhVerd + PotProd + Manejo

               Df Sum of Sq     RSS      AIC
- Cupins        1      0.76  791.02 -1109.39
<none>                       790.26 -1108.93
- DispFolhVerd  1      2.27  792.53 -1106.34
- Altura        1      4.97  795.23 -1100.90
- EstDesenv     1      6.00  796.26 -1098.84
- Manejo        1     14.73  804.99 -1081.41
- PotProd       1     28.35  818.61 -1054.57
- CobertSolo    1     66.97  857.23  -980.87
- Invasoras     1    698.51 1488.77   -98.21

Step:  AIC=-1109.39
Degrad ~ Altura + EstDesenv + Invasoras + CobertSolo + DispFolhVerd + 
    PotProd + Manejo

               Df Sum of Sq     RSS      AIC
<none>                       791.02 -1109.39
- DispFolhVerd  1      2.22  793.23 -1106.92
- Altura        1      6.16  797.18 -1099.00
- EstDesenv     1      6.34  797.36 -1098.63
- Manejo        1     14.28  805.30 -1082.78
- PotProd       1     28.89  819.91 -1054.04
- CobertSolo    1     66.37  857.38  -982.57
- Invasoras     1    703.50 1494.52   -94.05

    Shapiro-Wilk normality test

data:  residuos
W = 0.96181, p-value < 2.2e-16
Non-constant Variance Score Test 
Variance formula: ~ fitted.values 
Chisquare = 13.91973, Df = 1, p = 0.00019078
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.260   4.115   5.080   4.930   5.850   7.630 
Tabela de Degradação do Pasto. Fonte: LAPIG
Intervalos Degradação
[1; 2.4) Degradação Biológica Severa
[2.4; 3.8) Degradação Agrícola Severa
[3.8; 5.2) Degradação Moderada
[5.2; 6.6) Degradação Baixa
(6.6; 8] Não degradada
Tabela de Degradação do Pasto. Fonte: LAPIG
Intervalos Degradação (frequência)
[1; 2.4) 69
[2.4; 3.8) 258
[3.8; 5.2) 536
[5.2; 6.6) 570
(6.6; 8] 166
Start:  AIC=-5642.78
dados$Degrad ~ Altura + EstDesenv + Invasoras + Cupins + CobertSolo + 
    DispForr + DispFolhVerd + CondAtual + PotProd + Manejo

               Df Sum of Sq    RSS     AIC
- CondAtual     1     0.001 46.268 -5644.7
- DispForr      1     0.015 46.282 -5644.3
- Cupins        1     0.036 46.303 -5643.5
<none>                      46.267 -5642.8
- DispFolhVerd  1     0.140 46.407 -5640.0
- EstDesenv     1     0.278 46.545 -5635.2
- Altura        1     0.458 46.725 -5629.0
- PotProd       1     0.839 47.106 -5616.1
- Manejo        1     0.878 47.145 -5614.7
- CobertSolo    1     3.436 49.703 -5530.2
- Invasoras     1    44.008 90.275 -4576.0

Step:  AIC=-5644.74
dados$Degrad ~ Altura + EstDesenv + Invasoras + Cupins + CobertSolo + 
    DispForr + DispFolhVerd + PotProd + Manejo

               Df Sum of Sq    RSS     AIC
- DispForr      1     0.014 46.282 -5646.3
- Cupins        1     0.035 46.304 -5645.5
<none>                      46.268 -5644.7
- DispFolhVerd  1     0.142 46.411 -5641.8
- EstDesenv     1     0.277 46.545 -5637.2
- Altura        1     0.460 46.728 -5630.9
- Manejo        1     0.884 47.152 -5616.5
- PotProd       1     1.199 47.468 -5605.8
- CobertSolo    1     3.452 49.720 -5531.7
- Invasoras     1    44.081 90.349 -4576.7

Step:  AIC=-5646.27
dados$Degrad ~ Altura + EstDesenv + Invasoras + Cupins + CobertSolo + 
    DispFolhVerd + PotProd + Manejo

               Df Sum of Sq    RSS     AIC
- Cupins        1     0.035 46.317 -5647.0
<none>                      46.282 -5646.3
- DispFolhVerd  1     0.296 46.578 -5638.1
- EstDesenv     1     0.377 46.659 -5635.3
- Altura        1     0.467 46.749 -5632.2
- Manejo        1     0.874 47.156 -5618.4
- PotProd       1     1.447 47.728 -5599.1
- CobertSolo    1     3.498 49.780 -5531.8
- Invasoras     1    44.509 90.791 -4570.8

Step:  AIC=-5647.05
dados$Degrad ~ Altura + EstDesenv + Invasoras + CobertSolo + 
    DispFolhVerd + PotProd + Manejo

               Df Sum of Sq    RSS     AIC
<none>                      46.317 -5647.0
- DispFolhVerd  1     0.295 46.612 -5638.9
- EstDesenv     1     0.402 46.719 -5635.2
- Altura        1     0.573 46.890 -5629.4
- Manejo        1     0.854 47.172 -5619.8
- PotProd       1     1.488 47.805 -5598.5
- CobertSolo    1     3.468 49.785 -5533.6
- Invasoras     1    44.661 90.978 -4569.6

        Ponto PontoID       Data Campo Equipe            Especie01
1 M1001-E1-P1     750 20-03-2022     2      1 Brachiaria brizantha
2 M1001-E1-P1     750 20-03-2022     2      1 Brachiaria brizantha
3 M1001-E1-P1     750 20-03-2022     2      1 Brachiaria brizantha
4 M1001-E1-P1     750 20-03-2022     2      1 Brachiaria brizantha
5 M1001-E1-P3     748 20-03-2022     2      1 Brachiaria brizantha
6 M1001-E1-P3     748 20-03-2022     2      1 Brachiaria brizantha
             Avaliador   Altura EstDesenv Invasoras   Cupins CobertSolo
1 Maria Eduarda Passos 4.171331  2.121320  2.000000 2.345208   2.236068
2           João Abrão 4.171331  2.121320  1.870829 2.236068   2.121320
3     Lara Guilarducci 4.171331  2.121320  1.870829 2.121320   2.345208
4               Victor 4.171331  2.121320  2.121320 2.236068   2.236068
5           João Abrão 4.795832  1.732051  2.449490 2.449490   2.000000
6     Lara Guilarducci 4.795832  1.732051  2.449490 2.345208   2.236068
  DispForr DispFolhVerd CondAtual  PotProd   Degrad   Manejo categorias
1 1.870829     1.732051  1.581139 1.732051 2.121320 1.581139 [3.8; 5.2)
2 1.870829     1.870829  1.732051 1.870829 2.121320 1.581139 [3.8; 5.2)
3 1.732051     1.581139  1.732051 1.870829 2.236068 1.732051 [3.8; 5.2)
4 1.732051     1.732051  1.732051 1.732051 2.121320 1.581139 [3.8; 5.2)
5 1.732051     1.732051  1.870829 2.000000 2.345208 1.870829 [5.2; 6.6)
6 1.870829     1.732051  1.870829 2.000000 2.449490 2.121320 [5.2; 6.6)
  degradação_encontrada
1   Degradação Moderada
2   Degradação Moderada
3   Degradação Moderada
4   Degradação Moderada
5      Degradação Baixa
6      Degradação Baixa
          Ponto PontoID       Data Campo Equipe            Especie01
1594 M937-E2-P5     743 20-03-2022     2      2 Brachiaria brizantha
1595 M937-E2-P5     743 20-03-2022     2      2 Brachiaria brizantha
1596 M937-E2-P6     742 20-03-2022     2      2   Andropogon gayanus
1597 M937-E2-P6     742 20-03-2022     2      2   Andropogon gayanus
1598 M937-E2-P6     742 20-03-2022     2      2   Andropogon gayanus
1599 M937-E2-P6     742 20-03-2022     2      2   Andropogon gayanus
          Avaliador    Altura EstDesenv Invasoras   Cupins CobertSolo DispForr
1594 Natália Vieira  2.738613  2.000000  1.224745 2.345208   1.581139 1.224745
1595    Lucas Tales  2.738613  1.870829  1.224745 2.449490   2.121320 1.414214
1596 Franciele Fath 10.099505  2.000000  2.000000 2.549510   2.449490 2.449490
1597     Jade Plaza 10.099505  2.000000  2.000000 2.549510   2.345208 2.449490
1598 Natália Vieira 10.099505  2.121320  2.000000 2.645751   2.236068 2.345208
1599    Lucas Tales 10.099505  2.000000  1.870829 2.549510   2.345208 2.449490
     DispFolhVerd CondAtual  PotProd   Degrad   Manejo categorias
1594     1.224745  1.000000 1.000000 1.581139 1.000000   [1; 2.4)
1595     1.414214  1.414214 1.414214 1.414214 1.000000 [2.4; 3.8)
1596     2.345208  2.236068 2.449490 2.000000 1.870829 [5.2; 6.6)
1597     2.236068  2.236068 2.449490 2.121320 1.870829 [5.2; 6.6)
1598     2.121320  2.236068 2.345208 2.121320 1.870829 [3.8; 5.2)
1599     2.236068  2.236068 2.449490 2.000000 1.732051 [3.8; 5.2)
           degradação_encontrada
1594 Degradação Biológica Severa
1595  Degradação Agrícola Severa
1596            Degradação Baixa
1597            Degradação Baixa
1598         Degradação Moderada
1599         Degradação Moderada