Quais são os determinantes do Consumo

Team 23

Author

Afonso Correia A111255 Afonso Ferreira A112736 Gonçalo Silva A112866 João Cunha A112039

Published

Invalid Date

Setup

# Load necessary libraries
library(dplyr)        # For data manipulation
Warning: package 'dplyr' was built under R version 4.5.2

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
library(ggplot2)      # For data visualization
Warning: package 'ggplot2' was built under R version 4.5.2
library(stargazer)    # For regression output tables
Warning: package 'stargazer' was built under R version 4.5.2

Please cite as: 
 Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
 R package version 5.2.3. https://CRAN.R-project.org/package=stargazer 
library(haven)
Warning: package 'haven' was built under R version 4.5.2
library(readxl)
Warning: package 'readxl' was built under R version 4.5.2

Introdução

A análise dos fatores que influenciam o consumo é uma das questões centrais na macroeconomia, visto que o consumo desempenha um papel crucial no crescimento económico.

A compreensão dos seus determinantes é, por isso, essencial para a análise da estabilidade macroeconómica e para a eficácia das políticas públicas. O presente trabalho tem como objetivo investigar os fatores que influenciam o comportamento do consumo, utilizando um modelo de regressão linear.

Data

df <- read_excel("C:/Users/gonca/Downloads/Template_with_data/Consumo.xlsx")

Os dados utilizados neste trabalho foram gerados artificialmente para fins de modelação econométrica, simulando as condições do mercado de trabalho em Portugal.

A amostra é constítuida por 145 observações, para a qual cada observação representa um país. Relativamente às variaveis independentes, iremos analisar o consumo de acordo com o PIB per capita do país, bem como, a sua Inflação, Desemprego e a sua Taxa de Juro.

Criação de uma Nova Variável

A variável dependente “ln_Consumo” foi criada através do logaritmo da variável original “Consumo”. Esta transformação é fundamental para reduzir a assimetria do Consumo, e permite a interpretação dos coeficientes como semielasticidades.

Descriptive statistics

Apresentamos aqui uma análise descritiva das variáveis em estudo, focando-nos na sua tendência central e dispersão. O objetivo é assegurar que a amostra possui a heterogeneidade necessária para identificar os efeitos económicos pretendidos e garantir a validade das inferências estatísticas realizadas posteriormente.

names(df)
[1] "País"           "Consumo"        "PIB_per_capita" "Taxa_de_Juro"  
[5] "Inflação"       "Desemprego"     "ln_Consumo"    
str(df)
tibble [145 × 7] (S3: tbl_df/tbl/data.frame)
 $ País          : chr [1:145] "USA" "China" "India" "Germany" ...
 $ Consumo       : num [1:145] 868 10606 12101 4148 7467 ...
 $ PIB_per_capita: num [1:145] 26866 71892 17967 24595 41194 ...
 $ Taxa_de_Juro  : num [1:145] 0.51 12.36 13.96 6.5 8.49 ...
 $ Inflação      : num [1:145] 5.35 19.76 21.63 12 10.37 ...
 $ Desemprego    : num [1:145] 13.8 27.08 16.33 7.83 15.82 ...
 $ ln_Consumo    : num [1:145] 6.77 9.27 9.4 8.33 8.92 ...
summary(df)
     País              Consumo        PIB_per_capita   Taxa_de_Juro   
 Length:145         Min.   :  172.8   Min.   : 2047   Min.   : 0.460  
 Class :character   1st Qu.: 4119.5   1st Qu.:19235   1st Qu.: 5.270  
 Mode  :character   Median : 7929.2   Median :37421   Median : 8.640  
                    Mean   : 7701.2   Mean   :38003   Mean   : 9.554  
                    3rd Qu.:11331.5   3rd Qu.:58213   3rd Qu.:14.270  
                    Max.   :14984.3   Max.   :74786   Max.   :20.000  
    Inflação       Desemprego      ln_Consumo   
 Min.   : 0.53   Min.   : 2.03   Min.   :5.152  
 1st Qu.: 8.16   1st Qu.: 8.24   1st Qu.:8.323  
 Median :13.28   Median :15.95   Median :8.978  
 Mean   :13.19   Mean   :16.28   Mean   :8.684  
 3rd Qu.:19.50   3rd Qu.:24.32   3rd Qu.:9.335  
 Max.   :24.77   Max.   :29.98   Max.   :9.615  

A análise da distribuição do Consumo revela uma amplitude considerável, com valores oscilando entre um mínimo de 172.8 e um máximo de 14.984,3. A proximidade entre a média de 7.701,2 e a mediana de 7.929,2 sugere uma distribuição relativamente equilibrada, embora com uma leve inclinação negativa.

No que diz respeito às variáveis explicativas, o PIB per capita destaca-se como o principal fator de influência positiva, apresentando uma média de 38.003 e uma vasta disparidade entre as unidades analisadas.

A taxa de juros média de 9,55% e uma taxa de desemprego elevada, situada em 16,28%, atuam como forças restritivas. Enquanto juros elevados encarecem o crédito e incentivam a poupança, originando menos gastos, o alto desemprego limita a massa salarial disponível na economia. A inflação média de 13,19% reforça um cenário de pressão sobre o poder de compra real das famílias.

hist(df$ln_Consumo)

O histograma do logaritmo do consumo revela uma assimetria negativa, pela cauda à esquerda, o que indica que a maioria das observações está concentrada em valores mais altos, especificamente entre os níveis 8 e 10. O pico de frequência ocorre próximo ao valor 9, demonstrando que uma grande parte da amostra possui um patamar de consumo elevado em relação aos poucos valores extremamente baixos registados.

# 
ggplot(df, aes(x = ln_Consumo)) +
  geom_histogram(bins = 30, fill = "blue", color = "black", alpha = 0.7) +
  labs(title = "Histograma do Consumo", x = "Consumo", y = "Frequencia") +
  theme_minimal()

Este histograma reforça a análise anterior, evidenciando uma assimetria negativa acentuada (cauda longa à esquerda). A maior parte das observações concentra-se no intervalo final do gráfico, entre os valores 9 e 9.5, onde a frequência atinge o seu pico. Isso demonstra que a vasta maioria da amostra apresenta níveis de consumo elevados, enquanto valores baixos (abaixo de 7) são raros e atuam como outliers ou casos isolados, puxando a média para baixo em relação à mediana.

Regression

Nesta secção, iremos descrever o modelo econométrico e a estratégia de estimação. Utilizamos o método de Mínimos Quadrados Ordinários (MQO) para estimar os determinantes do logaritmo do Consumo.

\[ \ln(Consumo) = \beta_0 + \beta_1 PIB_i + \beta_2Juros_i + \beta_3 Juros^2_i \]

df_ols <- df %>% mutate(Juros = Taxa_de_Juro, Juros_sq = Taxa_de_Juro^2)
model_est <- lm(data = df_ols, ln_Consumo ~ PIB_per_capita + Juros + Juros_sq)
summary(model_est)

Call:
lm(formula = ln_Consumo ~ PIB_per_capita + Juros + Juros_sq, 
    data = df_ols)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.5460 -0.3634  0.2100  0.6353  1.4042 

Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)     8.594e+00  2.558e-01  33.599   <2e-16 ***
PIB_per_capita  3.495e-06  3.399e-06   1.028    0.306    
Juros           2.743e-02  5.421e-02   0.506    0.614    
Juros_sq       -2.506e-03  2.583e-03  -0.970    0.334    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.8873 on 141 degrees of freedom
Multiple R-squared:  0.03447,   Adjusted R-squared:  0.01392 
F-statistic: 1.678 on 3 and 141 DF,  p-value: 0.1745