## [1] "0. Pacotes e caminhos"
## [1] "1. Leitura dos dados"
## Prévia dos dados:
## # A tibble: 6 × 34
##   ano   ponto         x     y variedade solos    tch_real   atr ph_cacl2_1  mo_1
##   <chr> <chr>     <dbl> <dbl> <chr>     <chr>       <dbl> <dbl>      <dbl> <dbl>
## 1 2016  CF1658277 -49.2 -21.3 CV6654    LVal md      63.5  148.       5.19  16.2
## 2 2016  CF1658272 -49.2 -21.3 CV6654    LVPd md…     63.5  148.       5.18  17.0
## 3 2016  CF1658273 -49.2 -21.3 CV6654    LVPd md…     63.5  148.       4.88  15.7
## 4 2016  CF1658274 -49.2 -21.3 CV6654    LVPd md…     63.5  148.       4.96  13.7
## 5 2016  CF1658275 -49.2 -21.3 CV6654    LVal md      63.5  148.       5.05  15.7
## 6 2016  CF1658276 -49.2 -21.3 CV6654    LVal md      63.5  148.       5.15  14.0
## # ℹ 24 more variables: p_resina_1 <dbl>, s_1 <dbl>, ca_1 <dbl>, mg_1 <dbl>,
## #   k_1 <dbl>, al_1 <dbl>, h_al_1 <dbl>, sb_1 <dbl>, ctc_1 <dbl>, v_1 <dbl>,
## #   m_1 <dbl>, ph_cacl2_2 <dbl>, mo_2 <dbl>, p_resina_2 <dbl>, s_2 <dbl>,
## #   ca_2 <dbl>, mg_2 <dbl>, k_2 <dbl>, al_2 <dbl>, h_al_2 <dbl>, sb_2 <dbl>,
## #   ctc_2 <dbl>, v_2 <dbl>, m_2 <dbl>
## 
## Colunas disponíveis:
##  [1] "ano"        "ponto"      "x"          "y"          "variedade" 
##  [6] "solos"      "tch_real"   "atr"        "ph_cacl2_1" "mo_1"      
## [11] "p_resina_1" "s_1"        "ca_1"       "mg_1"       "k_1"       
## [16] "al_1"       "h_al_1"     "sb_1"       "ctc_1"      "v_1"       
## [21] "m_1"        "ph_cacl2_2" "mo_2"       "p_resina_2" "s_2"       
## [26] "ca_2"       "mg_2"       "k_2"        "al_2"       "h_al_2"    
## [31] "sb_2"       "ctc_2"      "v_2"        "m_2"
## [1] "2. Seleção de ano e variável alvo"
## 
## Linhas após filtro de ano: 7961
## Linhas após remover NAs em atr : 7961
## [1] "3. Construção de X (features) e y (alvo)"
## 
## Formato de X (features): 7952 linhas x 125 colunas
## Formato de y (alvo): 7961 valores
## [1] "4. Divisão em treino e teste (80/20)"
## 
## Tamanho treino: 6361 | Tamanho teste: 1591
## [1] "5. Treinamento do modelo Random Forest"
## 
## Call:
##  randomForest(x = X_treino, y = y_treino, ntree = 400, importance = TRUE) 
##                Type of random forest: regression
##                      Number of trees: 400
## No. of variables tried at each split: 41
## 
##           Mean of squared residuals: 56.66567
##                     % Var explained: 46.95
## [1] "6. Previsões e métricas"
## 
## =========== RESULTADOS (Regressão) ===========
## Ano   : 2016
## R²    : 0.443
## MAE   : 5.545
## RMSE  : 7.73
## ==============================================
## [1] "7. Matriz de correlação (subset para visual ficar legível)"

## png 
##   2
## [1] "8. Importância das variáveis"
## 
## Top 10 variáveis mais importantes:
##                            variavel importancia
## y                                 y    60.79439
## tch_real                   tch_real    56.83603
## x                                 x    47.32438
## m_1                             m_1    38.24313
## solosPVe ar/md       solosPVe ar/md    26.73834
## variedadeRB867515 variedadeRB867515    24.45241
## ph_cacl2_1               ph_cacl2_1    23.21104
## variedadeRB966928 variedadeRB966928    23.20976
## p_resina_1               p_resina_1    23.12720
## h_al_1                       h_al_1    22.57175

## [1] "9. Gráfico Real vs. Previsto"

## [1] "10. Histograma dos resíduos"

## [1] "11. Resíduos vs. previsto"