Afonso Correia A111255 Afonso Ferreira A112736 Gonçalo Silva A112866 João Cunha A112039
Published
Invalid Date
Setup
# Load necessary librarieslibrary(dplyr) # For data manipulation
Warning: package 'dplyr' was built under R version 4.5.2
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
library(ggplot2) # For data visualization
Warning: package 'ggplot2' was built under R version 4.5.2
library(stargazer) # For regression output tables
Warning: package 'stargazer' was built under R version 4.5.2
Please cite as:
Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
R package version 5.2.3. https://CRAN.R-project.org/package=stargazer
library(haven)
Warning: package 'haven' was built under R version 4.5.2
library(readxl)
Warning: package 'readxl' was built under R version 4.5.2
Introdução
A análise dos fatores que influenciam o consumo é uma das questões centrais na macroeconomia, visto que o consumo desempenha um papel crucial no crescimento económico.
A compreensão dos seus determinantes é, por isso, essencial para a análise da estabilidade macroeconómica e para a eficácia das políticas públicas. O presente trabalho tem como objetivo investigar os fatores que influenciam o comportamento do consumo, utilizando um modelo de regressão linear.
Os dados utilizados neste trabalho foram gerados artificialmente para fins de modelação econométrica, simulando as condições do mercado de trabalho em Portugal.
A amostra é constítuida por 145 observações, para a qual cada observação representa um país. Relativamente às variaveis independentes, iremos analisar o consumo de acordo com o PIB per capita do país, bem como, a sua Inflação, Desemprego e a sua Taxa de Juro.
Criação de uma Nova Variável
A variável dependente “ln_Consumo” foi criada através do logaritmo da variável original “Consumo”. Esta transformação é fundamental para reduzir a assimetria do Consumo, e permite a interpretação dos coeficientes como semielasticidades.
Descriptive statistics
Apresentamos aqui uma análise descritiva das variáveis em estudo, focando-nos na sua tendência central e dispersão. O objetivo é assegurar que a amostra possui a heterogeneidade necessária para identificar os efeitos económicos pretendidos e garantir a validade das inferências estatísticas realizadas posteriormente.
País Consumo PIB_per_capita Taxa_de_Juro
Length:145 Min. : 172.8 Min. : 2047 Min. : 0.460
Class :character 1st Qu.: 4119.5 1st Qu.:19235 1st Qu.: 5.270
Mode :character Median : 7929.2 Median :37421 Median : 8.640
Mean : 7701.2 Mean :38003 Mean : 9.554
3rd Qu.:11331.5 3rd Qu.:58213 3rd Qu.:14.270
Max. :14984.3 Max. :74786 Max. :20.000
Inflação Desemprego ln_Consumo
Min. : 0.53 Min. : 2.03 Min. :5.152
1st Qu.: 8.16 1st Qu.: 8.24 1st Qu.:8.323
Median :13.28 Median :15.95 Median :8.978
Mean :13.19 Mean :16.28 Mean :8.684
3rd Qu.:19.50 3rd Qu.:24.32 3rd Qu.:9.335
Max. :24.77 Max. :29.98 Max. :9.615
A análise da distribuição do Consumo revela uma amplitude considerável, com valores oscilando entre um mínimo de 172.8 e um máximo de 14.984,3. A proximidade entre a média de 7.701,2 e a mediana de 7.929,2 sugere uma distribuição relativamente equilibrada, embora com uma leve inclinação negativa.
No que diz respeito às variáveis explicativas, o PIB per capita destaca-se como o principal fator de influência positiva, apresentando uma média de 38.003 e uma vasta disparidade entre as unidades analisadas.
A taxa de juros média de 9,55% e uma taxa de desemprego elevada, situada em 16,28%, atuam como forças restritivas. Enquanto juros elevados encarecem o crédito e incentivam a poupança, originando menos gastos, o alto desemprego limita a massa salarial disponível na economia. A inflação média de 13,19% reforça um cenário de pressão sobre o poder de compra real das famílias.
hist(df$ln_Consumo)
O histograma do logaritmo do consumo revela uma assimetria negativa, pela cauda à esquerda, o que indica que a maioria das observações está concentrada em valores mais altos, especificamente entre os níveis 8 e 10. O pico de frequência ocorre próximo ao valor 9, demonstrando que uma grande parte da amostra possui um patamar de consumo elevado em relação aos poucos valores extremamente baixos registados.
# ggplot(df, aes(x = ln_Consumo)) +geom_histogram(bins =30, fill ="blue", color ="black", alpha =0.7) +labs(title ="Histograma do Consumo", x ="Consumo", y ="Frequencia") +theme_minimal()
Este histograma reforça a análise anterior, evidenciando uma assimetria negativa acentuada (cauda longa à esquerda). A maior parte das observações concentra-se no intervalo final do gráfico, entre os valores 9 e 9.5, onde a frequência atinge o seu pico. Isso demonstra que a vasta maioria da amostra apresenta níveis de consumo elevados, enquanto valores baixos (abaixo de 7) são raros e atuam como outliers ou casos isolados, puxando a média para baixo em relação à mediana.
Regression
Nesta secção, iremos descrever o modelo econométrico e a estratégia de estimação. Utilizamos o método de Mínimos Quadrados Ordinários (MQO) para estimar os determinantes do logaritmo do Consumo.