ECONOMETRIA

Estudo dos modelos: No presente estudo, analisamos diferentes tipos de modelos para compreender seus comportamentos. Além disso, realizamos exercícios em sala de aula, interpretando de forma clara os significados dos resultados numéricos. O código utilizado foi disponibilizado pelo docente da universidade. Utilizamos o pacote wooldridge para dirigir os estudos.

Linear Simples

O modelo de regressão linear simples é uma técnica estatística usada para descrever a relação entre duas variáveis:

Variável dependente (Y): aquela que queremos prever ou explicar. Variável independente (X): aquela que usamos para fazer a previsão.

A equação do modelo é dada por: Y = B0 + B1X + e

Onde:

B0 é o intercepto (valor de Y quando X = 0), B1 é o coeficiente angular (mede o efeito de X sobre Y), e é o erro aleatório, capturando a variação não explicada por X.

Logo, se B0 > 0, existe uma relação positiva: à medida que X aumenta, Y também tende a aumentar. Se B1 < 0, existe uma relação negativa: um aumento em X leva a uma diminuição em Y.

O modelo é amplamente utilizado em economia, ciências sociais, engenharia e outras áreas para prever tendências e tomar decisões baseadas em dados.

Aplicacao Linear Simples

wageModel <- lm(wage ~ educ + exper + tenure, data = wage1)

summary(wageModel)
## 
## Call:
## lm(formula = wage ~ educ + exper + tenure, data = wage1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7.6068 -1.7747 -0.6279  1.1969 14.6536 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.87273    0.72896  -3.941 9.22e-05 ***
## educ         0.59897    0.05128  11.679  < 2e-16 ***
## exper        0.02234    0.01206   1.853   0.0645 .  
## tenure       0.16927    0.02164   7.820 2.93e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.084 on 522 degrees of freedom
## Multiple R-squared:  0.3064, Adjusted R-squared:  0.3024 
## F-statistic: 76.87 on 3 and 522 DF,  p-value: < 2.2e-16

Interpretacao Linear Simples

Podemos interpretar que:

wage: salario do individuo, valor minimo 0,350 e valor maximo 24,980. educ: anos de educacao, tendo como um nivel minimo de 0,00, e um maximo de 18,00. exper: anos de experiencia no mercado de trabalho, temos a experiencia de 1,00 ate 51,00. tenure: anos de trabalho na empresa atual, temos como nenhum ano (0,00) ate 44,00 (anos).

Com isso, podemos concluir brevemente que:

educ (0.59897): Cada ano adicional de estudo está associado a um aumento médio de 0,60 unidades no salário, mantendo a experiência e o tempo de empresa constantes. O p-valor < 2e-16 indica forte significância estatística.

exper (0.02234): Cada ano adicional de experiência no mercado de trabalho aumenta o salário em 0,022 unidades. No entanto, o p-valor de 0,0645 indica que esse efeito não é estatisticamente significativo ao nível de 5%.

tenure (0.16927): Cada ano adicional de trabalho na mesma empresa aumenta o salário em 0,169 unidades, com alta significância estatística (p < 0,001).

Além disso, podemos observar a Estatística F:

Estatística F (76.87, p < 2.2e-16): O modelo é globalmente significativo, ou seja, pelo menos uma das variáveis independentes influencia o salário.

Log-log

O modelo log-log é uma forma de regressão em que tanto a variável dependente quanto a variável independente são transformadas pelo logaritmo natural.Ele segue a seguinte forma:

ln(????)= B0 + B1 ln (????) + e

Interpretação do Coeficiente (B1)

O coeficiente B1 representa a elasticidade de Y em relação a X. Ou seja, B1 indica a variação percentual em y para um aumento percentual de 1% em X. Se B1 = 0.5, isso significa que um aumento de 1% em X resulta em um aumento de 0.5% em Y.

Aplicacao Log-log

wageModel <- lm( lwage ~ educ  + exper + tenure, data = wage1)
summary(wageModel)
## 
## Call:
## lm(formula = lwage ~ educ + exper + tenure, data = wage1)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.05802 -0.29645 -0.03265  0.28788  1.42809 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.284360   0.104190   2.729  0.00656 ** 
## educ        0.092029   0.007330  12.555  < 2e-16 ***
## exper       0.004121   0.001723   2.391  0.01714 *  
## tenure      0.022067   0.003094   7.133 3.29e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4409 on 522 degrees of freedom
## Multiple R-squared:  0.316,  Adjusted R-squared:  0.3121 
## F-statistic: 80.39 on 3 and 522 DF,  p-value: < 2.2e-16

Interpretacao log-log

Podemos notar que um aumento de 1 ano na educacao esta associado a um aumento medio de 9.2% no salario (estimate+ 0.092029). Na experiência um ano adicional de experiência aumenta o salário em 0.4%. O coeficiente é pequeno, mas estatisticamente significativo. Já no tempo do emprego vemos que cada ano adicional no emprego aumenta o salário em 2.2%. O efeito é estatisticamente muito significativo.

Log-lin

O modelo log-lin é um tipo de regressão onde a variável dependente (Y) é transformada pelo logaritmo natural, enquanto a variável independente (X) permanece em sua escala original. A equação do modelo é dada por:

ln (????)= B0 + B1????+ e

Interpretação do Coeficiente (B1)

O coeficiente B1 representa a variação percentual média de Y para um aumento unitário em X. Especificamente, um aumento de 1 unidade em X leva a uma variação de aproximadamente 100 x B1% em Y. Se B1 =0.05, então um aumento de 1 unidade em X implica um aumento médio de 5% em Y.

Aplicacao Log-lin

wageModel <- lm( lwage ~ educ  + exper + tenure, data = wage1)

summary(wageModel)
## 
## Call:
## lm(formula = lwage ~ educ + exper + tenure, data = wage1)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.05802 -0.29645 -0.03265  0.28788  1.42809 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.284360   0.104190   2.729  0.00656 ** 
## educ        0.092029   0.007330  12.555  < 2e-16 ***
## exper       0.004121   0.001723   2.391  0.01714 *  
## tenure      0.022067   0.003094   7.133 3.29e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4409 on 522 degrees of freedom
## Multiple R-squared:  0.316,  Adjusted R-squared:  0.3121 
## F-statistic: 80.39 on 3 and 522 DF,  p-value: < 2.2e-16

Interpretacao log-lin

Aqui podemos perceber que em um aumento de 1 ano na escolaridade está associado a um aumento médio de 9.2% no salário.O p-valor muito pequeno indica que este efeito é estatisticamente significativo. Então a cada ano adicional de experiência está associado a um aumento médio de 0.41% no salário. O efeito é positivo, mas relativamente pequeno. O p-valor indica que é estatisticamente significativo, mas menos forte do que o da escolaridade. Cada ano adicional na empresa aumenta o salário em 2.2%. O p-valor muito pequeno indica que essa variável tem um efeito significativo. Concluindo que a escolaridade tem o maior impacto no salário, seguida por tenure e depois experiência.

Lin-log

O modelo lin-log é um tipo de regressão onde a variável dependente (Y) é mantida em sua escala original, enquanto a variável independente (X) é transformada pelo logaritmo natural. A equação do modelo é dada por:

Y = B0 + B1 ln(X) + e

Interpretação do Coeficiente (B1)

O coeficiente B1 representa a variação absoluta média de Y para um aumento percentual em X. Especificamente, um aumento de 1% em X leva a uma mudança de B1/100 unidades em Y. Se B1 = 2, então um aumento de 1% em X implica um aumento de 0,02 unidades em Y.

wageModel <- lm( lwage ~ educ  + exper + tenure, data = wage1)
summary(wageModel)
## 
## Call:
## lm(formula = lwage ~ educ + exper + tenure, data = wage1)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.05802 -0.29645 -0.03265  0.28788  1.42809 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.284360   0.104190   2.729  0.00656 ** 
## educ        0.092029   0.007330  12.555  < 2e-16 ***
## exper       0.004121   0.001723   2.391  0.01714 *  
## tenure      0.022067   0.003094   7.133 3.29e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4409 on 522 degrees of freedom
## Multiple R-squared:  0.316,  Adjusted R-squared:  0.3121 
## F-statistic: 80.39 on 3 and 522 DF,  p-value: < 2.2e-16

Interpretacaoo Lin-log

As variáveis “educ” e “tenure” são altamente significativas, ou seja, há forte evidência estatística de que influenciam o salário.

A variável “exper” é menos significativa, mas seu valor de p ainda está abaixo do nível de 5%, indicando que também é estatisticamente relevante.

O modelo sugere que a educação tem o maior impacto percentual sobre o salário, seguida pelo tempo de serviço (tenure) e, por último, pela experiência (exper).

Além disso, o ajuste do modelo é moderado, o que indica que outros fatores não incluídos podem influenciar o salário.