Econometria II
Lista 1
Revisão de Econometria I
Lista de Exercícios
Bloco 1: Fundamentos e RSL/RLM
Questão 1
Explique a diferença entre dados experimentais e não experimentais. Por que a econometria se concentra em dados não experimentais (observacionais)?
##### Resposta Q1
Os dados experimentais são coletados em um ambiente controlado onde o pesquisador seleciona aleatoriamente os grupos de tratamento e controle, garantindo que se houver diferença entre os grupos, ela será apenas causada pelo tratamento. De outro lado, os não experimentais são coletados através da observação da realidade, sem a necessidade de controlar as variáveis. Devido as dificuldades metodológicas, éticas e a impossibilidade técnica de randomização em fenômenos sociais e econômicos.
Questão 2
No modelo \(y = \beta_0 + \beta_1 x + u\), qual é o papel do termo de erro 𝑢 e por que assumimos que \(𝐸(𝑢∣𝑥) = 0\)?
##### Resposta Q2
O termo de erro ou variáveis não observadas representam todos os fatores que afetam \(y\), mas não foram incluídos no modelo. De outro lado, a hipótese de exogeneidade significa que os fatores não observados em \(u\) com média condicional zero e não estão correlacionados com as variáveis explicativas. Se a hipótese falhar significa que o estimador é enviesado.
Questão 3
Diferencie a Função de Regressão Populacional (FRP) da Função de Regressão Amostral (FRA). Por que os coeficientes mudam entre diferentes amostras?
##### Resposta Q3
A FRP é fixa e geralmente desconhecida e a FPA é a estimativa baseada em uma amostra específica. A variação dos coeficientes ocorre entre as amostras (FPA) devido ao erro amostral porque cada amostra é subconjunto diferente da população.
Questão 4
Interpretação: Em um modelo \(\log(\text{salario}) = \beta_0 + \beta_1 \, educ + u\), se \(\beta_1\) = 0.08, como interpretamos esse valor? E se o modelo fosse \(\log(\text{salario}) = \beta_0 + \beta_1 \log(\text{vendas}) + u\)?
##### Resposta Q4
No primeiro modelo, chamado de log-lin um ano adicional de educação está associado a um aumento de aproximadamente 8% no salário. Por outro lado, o segundo modelo, chamado de log-log, o \(beta_1\) representa a elasticidade, assim se as vendas aumentarem em 1%, o salário aumenta em \(\beta_1%\)
Bloco 2: Viés e Variância
Questão 5
O que acontece com o estimador de MQO se omitirmos uma variável que é relevante para explicar \(𝑦\) e que está correlacionada com \(x_1\)? Explique o sinal do viés.
##### Resposta Q5
Há um impacto no estimador do \(beta_1\), a saber, ele torna-se inconsistente e enviesado. Dito de outra forma, se uma variável \(x_2\) que se correlaciona com \(x_1\), o estimador de MQO da variável \(x_1\) absorve o efeito de \(x_2\). O sinal irá depender dos sinais da correlação entre as variáveis e a efeito de uma variável sobre a outra. Se a correlação entre \(x_1\) e \(x_2\) E o impacto de \(x_2\) sobre \(y\) tiverem o mesmo sinal, o viés é positivo. Se tiverem sinais opostos, o viés é negativo.
Questão 6
Por que o \(R^2\) nunca diminui quando adicionamos novas variáveis ao modelo? Por que o \(R^2\) ajustado é preferível para comparar modelos com diferentes números de explicativas?
##### Reposta Q6
O Método dos Mínimos Quadrados Ordinários (MQO) minimiza a soma dos quadrados dos resíduos, adicionar qualquer variável reduz ou mantém o resíduo mesmo que a variável adicionada seja irrelevante. O \(R^2\) ajustado penaliza a inclusão de novas variáveis, principalmente, as desnecessárias. Assim, ela é recomendada porque só aumenta se a nova variável melhorar o modelo mais do que o esperado pelo acaso.
Questão 7
O que significa dizer que um estimador é BLUE (MELNV)? Quais hipóteses de Gauss Markov precisam ser atendidas para isso?
##### Resposta Q7
A sigla MELNV significa Melhores Estimadores Lineares Não-enviesados, a saber, entre todos os estimadores lineares e não enviesados, o Metódo dos Mínimos Quadrados Ordinários é o que possui a menor variância.
As hipóteses de Gauss Markov são: - Linearidade nos parâmetros. - Amostragem aleatória. - Ausência de colinearidade perfeita. - Exogeneidade estrita (\(E(u|x)=0\)). - Homoscedasticidade (\(Var(u|x) = \sigma^2\)).
Bloco 3: Inferência e Assintótica
Questão 8
Explique a diferença entre significância estatística (teste \(𝑡\)) e significância econômica (magnitude do coeficiente).]
##### Resposta 8
Na significância econômica, um coeficiente pode ser estatisticamente significante, mas economicamente irrelevante , ou seja, irrelevante dependo do campo da análise. Do outro lado, a significância estatística do teste \(t\) testa se o coeficiente é diferente de zero, mais especificamente, se ele é fruto do acaso ou não.
Questão 9
Quando usamos o Teste \(𝐹\) em vez do Teste \(𝑡\)? O que é uma “restrição de exclusão”?
##### Resposta 9
O teste \(F\) é usado para testar múltiplas hipóteses lineares simultaneamente enquanto o teste \(t\) testa uma hipótese por vez. A restrição de exclusão é a hipótese de que um grupo de variáveis não tem efeito sobre \(y\), ou seja, seus parâmetros são conjuntamente iguais a zero e podem ser “excluídos” do modelo
Questão 10
O que é consistência e por que ela é considerada uma propriedade de “amostra grande”? Como ela difere do “não-viés”?
##### Resposta 10
Conforme aumenta o tamanho da amostra \((n)\), o estimador converge para o valor real do parâmetro. O não-viés é uma propriedade para qualquer tamanho da amostra e a consistência é uma propriedade sobre o comportamento do estimador quando \(n\) cresce.
Bloco 4: Variáveis Dummy e Chow
Questão 11
O que é a “Armadilha da Variável Dummy”? Como evitá-la se temos uma variável com 4 categorias (ex: as 4 regiões do país)?
##### Resposta 11
Acontece quando há uma dummy para cada categoria, a saber, ocorre multicolinearidade perfeita porque a soma das dummies é igual ao vetor de constantes. Para evitar a multicolinearidade perfeita, precisamos omitir uma categoria da variável e torna a categoria de referência.
Questão 12
Para que serve o Teste de Chow? Explique a intuição de comparar o modelo restrito com os modelos irrestritos.
##### Resposta 12
Testa se ocorreu quebra estrutural nos parâmetros do modelo entre dois grupos ou períodos. A ideia é comparar os modelos restrito (modelo único) com os irrestritos (modelo para cada subgrupo), se a Soma dos Quadrados dos Resíduos (SQE) for significativamente menor que a do modelo único, os grupos são diferentes.
Questão 13
Quais as principais desvantagens do Modelo de Probabilidade Linear (MPL) e por que devemos usar erros-padrão robustos nele?
##### Resposta 13
As principais desvantagens, a saber, prever probabilidades fora do intervalo, o termo de erro é heterocedástico e a relação linear pode não ser realista para probabilidades. Por isso, devemos usar os erros-padrão robustos para corrigir a heterocedasticidade inerente ao modelo citado, garantindo, assim, que os testes de hipótese sejam válidos.