MODELO 1

Esse modelo relaciona os 30 valores de DIESEL fornecidos pelo cliente com as TAS de HO do último dia útil do mês

Os problemas dessa estimativa são:

1- pouca serie de dados (apenas 30)

2- período de tempo muito longo para um mesmo valor de diesel (1 mês)

3- não sabemos de onde vem esse valor de diesel

Contudo, o resultado é significativo, com um \(beta 1\) de 0.62.

base <- read.csv("HO1.csv")
head(base)
##    Dates HO..REAIS.litro. DIESEL..REAIS.litro.
## 1 Jan-22         3.864281                5.800
## 2 Feb-22         4.108452                6.225
## 3 Mar-22         4.609990                6.650
## 4 Apr-22         6.236991                7.075
## 5 May-22         5.110693                7.500
## 6 Jun-22         5.344316                7.500
modelo_base <- lm(base$DIESEL..REAIS.litro.~base$HO..REAIS.litro.)

plot(base$HO..REAIS.litro., base$DIESEL..REAIS.litro.,
     xlab = "Heating Oil (reais/litro)",
     ylab = "Diesel (reais/litro)",
     main = "Preço de HO e Diesel")
abline(modelo_base, col = "grey", lwd = 1.5)

Aqui segue o modelo econométrico (um ajuste ok):

summary(modelo_base)
## 
## Call:
## lm(formula = base$DIESEL..REAIS.litro. ~ base$HO..REAIS.litro.)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.94432 -0.16034 -0.00655  0.23997  0.87958 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             3.7923     0.3589  10.565 2.82e-11 ***
## base$HO..REAIS.litro.   0.6200     0.0849   7.302 5.97e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.3764 on 28 degrees of freedom
## Multiple R-squared:  0.6557, Adjusted R-squared:  0.6434 
## F-statistic: 53.33 on 1 and 28 DF,  p-value: 5.968e-08

MODELO 2

Esse modelo relaciona o valor do CTE com o valor do Heating Oil.

Apesar de inicalmente não fazer sentido, a única maneira da relação ser positiva, é com a soma de ocorrências do Heating Oil com a soma do CTE, pois, tanto as médias ponderadas, quanto os valores sozinhos resultam em correlações negativas.

frete2 <- read.csv("cotação x HO.csv")

head(frete2)
##   Row.Labels Sum.of.Valor.CTe Sum.of.HEATING.OIL
## 1 03/05/2023          4146997             223.23
## 2 14/02/2024          3868270           65655.26
## 3 13/02/2024          3747406           30886.16
## 4 09/05/2023          3576585           48079.20
## 5 19/09/2023          3538769           15027.60
## 6 14/10/2023          3512362           13451.60
modelo_frete <- lm(frete2$Sum.of.Valor.CTe ~ frete2$Sum.of.HEATING.OIL)

plot(frete2$Sum.of.Valor.CTe, frete2$Sum.of.HEATING.OIL,
     xlab = "Heating Oil (reais/litro)",
     ylab = "Valores de frete",
     main = "Preço do frete x HO")
abline(modelo_frete, col = "grey", lwd = 1.5)

Ajuste minimamente estranho:

summary(modelo_frete)
## 
## Call:
## lm(formula = frete2$Sum.of.Valor.CTe ~ frete2$Sum.of.HEATING.OIL)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1213036  -599372  -159729   486141  3194581 
## 
## Coefficients:
##                            Estimate Std. Error t value Pr(>|t|)    
## (Intercept)               9.515e+05  5.237e+04  18.168  < 2e-16 ***
## frete2$Sum.of.HEATING.OIL 4.268e+00  1.377e+00   3.101  0.00199 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 775100 on 898 degrees of freedom
## Multiple R-squared:  0.01059,    Adjusted R-squared:  0.00949 
## F-statistic: 9.613 on 1 and 898 DF,  p-value: 0.001992