setwd(“A:/UFRPE/RCAD”)

Conjunto de dados

Nesse exercício foi utilizado o banco de dado airquality para avaliar a variação da temperatura de maio a setembro.

Carregando o conjunto de dados

summary(airquality)
##      Ozone           Solar.R           Wind             Temp      
##  Min.   :  1.00   Min.   :  7.0   Min.   : 1.700   Min.   :56.00  
##  1st Qu.: 18.00   1st Qu.:115.8   1st Qu.: 7.400   1st Qu.:72.00  
##  Median : 31.50   Median :205.0   Median : 9.700   Median :79.00  
##  Mean   : 42.13   Mean   :185.9   Mean   : 9.958   Mean   :77.88  
##  3rd Qu.: 63.25   3rd Qu.:258.8   3rd Qu.:11.500   3rd Qu.:85.00  
##  Max.   :168.00   Max.   :334.0   Max.   :20.700   Max.   :97.00  
##  NA's   :37       NA's   :7                                       
##      Month            Day      
##  Min.   :5.000   Min.   : 1.0  
##  1st Qu.:6.000   1st Qu.: 8.0  
##  Median :7.000   Median :16.0  
##  Mean   :6.993   Mean   :15.8  
##  3rd Qu.:8.000   3rd Qu.:23.0  
##  Max.   :9.000   Max.   :31.0  
## 
##   Ozone Solar.R Wind Temp Month Day
## 1    41     190  7.4   67     5   1
## 2    36     118  8.0   72     5   2
## 3    12     149 12.6   74     5   3
## 4    18     313 11.5   62     5   4
## 7    23     299  8.6   65     5   7
## 8    19      99 13.8   59     5   8

Tabela iterativa

Tabela interativa

library(DT)

datatable(airquality,
          options = list(pageLength = 10, autoWidth = TRUE),
          rownames = FALSE)
airquality$Month <- factor(airquality$Month,
                           levels = 5:9,
                           labels = c("Maio", "Junho", "Julho", "Agosto", "Setembro"))

head(airquality)
##   Ozone Solar.R Wind Temp Month Day
## 1    41     190  7.4   67  Maio   1
## 2    36     118  8.0   72  Maio   2
## 3    12     149 12.6   74  Maio   3
## 4    18     313 11.5   62  Maio   4
## 7    23     299  8.6   65  Maio   7
## 8    19      99 13.8   59  Maio   8

Análise Gráfica

Análisando os dados

## Warning in (function (z, notch = FALSE, width = NULL, varwidth = FALSE, : some
## notches went outside hinges ('box'): maybe set notch=FALSE

Observa-se que a média do mês de Julho é a mais alta, embora o mês de agosto alcance temperaturas mais altas e setembro tenha uma maior variabilidade na temperatura.

Frequência

As temperaturas entre 25 a 30ºC são as mais comuns no banco de dados, com poucas temperaturas acima de 35º e abaixo de 15ºC.

Métricas de Avaliação

\[ R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2} \] Coeficiente de Determinação (R²): Mede a proporção da variabilidade explicada pelo modelo.

\[ NSE = 1 - \frac{\sum_{i=1}^{n}(y_i - \hat{y}_i)^2}{\sum_{i=1}^{n}(y_i - \bar{y})^2} \] Eficiência de Nash-Sutcliffe (NSE): Avalia a capacidade preditiva do modelo. NSE = 1 é ideal.

\[ PBIAS = 100 \times \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)}{\sum_{i=1}^{n} y_i} \] PBIAS: Mede a tendência do modelo. Negativo indica superestimação, positivo subestimação.

\[ RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2} \] RMSE: Raiz do erro quadrático médio. Valores menores indicam maior precisão.

\[ MAE = \frac{1}{n} \sum_{i=1}^{n} \left| y_i - \hat{y}_i \right| \] MAE: Média dos erros absolutos. Simples de interpretar e menos sensível a outliers.

References

@legates1999evaluating @gupta2009decomposition @moriasi2007model @moriasi2015hydrologic @willmott1981validation