Эконометрика (продвинутый курс)

Практика 1

Эконометрика (продвинутый курс)

  • 2 лекции
  • 5 практик
  • 1 практическая работа
  • экзамен


Практики:

  • пакет Gretl
  • решение задач
  • только необходимая теория

План практики №1


  • входной тест (30 минут)

  • построение факторной регрессионной модели в Gretl

  • сайт с материалами к курсу: http://msep.kiber-guu.ru/

Gretl --

Библиотека для регрессий, эконометрики и временных рядов (GNU Regression, Econometrics and Time-series Library).

  • бесплатный
  • кросс-платформенный
  • реализованы модели регрессии, временных рядов, системы одновременных уравнений
  • дополнительные пакеты; можно использовать язык R

Сайт проекта: http://gretl.sourceforge.net/

Gretl

Недостатки:

  • отсутствие интерактивных графиков
  • возможны вылеты: сохраняйтесь чаще

Принципы работы в Gretl:

  • ограничения на имена переменных
  • все действия с загруженным файлом данных сохраняются в текущей сессии
  • данные (таблица) и сессия (исполняемый код) сохраняются в отдельных файлах

Постановка задачи

Цель: построить модель, чтобы обосновать влияние различных факторов на размер среднемесячной заработной платы.

Данные: Подвыборка данных по 150 жителям Москвы из репрезентативной выборки по индивидуумам 21-ой волны обследования (2012г.) «Российского мониторинга экономического положения и здоровья населения НИУ-ВШЭ (RLMS-HSE)» (http://www.hse.ru/rlms).

Данные

  • salary – среднемесячная зарплата после вычета налогов за последние 12 месяцев (рублей);
  • male – пол: 1 – мужчина, 0 – женщина;
  • educ – уровень образования:
    • 1 – 0-6 классов,
    • 2 – незаконченное среднее (7-8 классов),
    • 3 - незаконченное среднее плюс что-то еще,
    • 4 – законченное среднее,
    • 5 – законченное среднее специальное,
    • 6 – законченное высшее образование и выше;
  • forlang - иност. язык: 1 – владеет, 0 – нет;
  • exper – официальный стаж с 1.01.2002 (лет).

Модели

  1. \( \hat{salary} = \hat{b}_0 + \hat{b}_1 \cdot male \)
  2. \( \hat{salary} = \hat{b}_0 + \hat{b}_1 \cdot male + \hat{b}_2 \cdot educ + \\ + \hat{b}_3 \cdot forlang + \hat{b}_4 \cdot exper \)

Необходимо:

  • оценить параметры
  • проверить гипотезы
  • протестировать остатки
  • дать интерпретацию

Теория

Парная регрессия:
\[ Y = b_0 + b_1 \cdot X + \epsilon \]

Объяснённая часть: \[ \hat{Y} = \hat{b}_0 + \hat{b}_1 \cdot X \]

Случайная составляющая (\( \epsilon \)):

  • остатки случайны;
  • среднее равно нулю;
  • дисперсия постоянна;
  • нет автокорреляции.

Метод наименьших квадратов

Метод наименьших квадратов

\( \sum{(y_i - \hat{y}_i)^2 \rightarrow min} \), где \( \hat{y}_i = \hat{b}_0 + \hat{b}_1 \cdot x_i \)

Множественная регрессия:

\[ Y = b_0 + b_1 \cdot X_1 + ... + b_j \cdot X_j + ... + b_m \cdot X_m + \epsilon \]

Проверка гипотез:

  1. Значимость модели в целом (F-критерий)
  2. Значимость каждого из параметров (t-критерий)

Те же требования к остаткам. Основные тесты:

  1. На гетероскедастичность (Вайта, Бриуша-Пагана и др.).
  2. На автокорреляцию (DW-статистика, коэфф. автокорреляции первого порядка).

Проверка гипотез

Значимость модели в целом (F-критерий) – только для множественной регрессии

\( H_0: b_1 = ... = b_m = 0 \), или модель в целом незначима в генеральной совокупности
\( H_1: b_1 \neq ... \neq b_m \neq 0 \), или модель в целом значима в ГС

Правило:

\( P\text{-}value > \alpha \Rightarrow H_0 \)
\( P\text{-}value < \alpha \Rightarrow H_1 \)

Уровень значимости \( \alpha \) принимает значения 0.05, 0.01, 0.10.

Проверка гипотез

Значимость каждого из параметров (t-критерий)

\( H_0: b_j = 0 \), или параметр незначим (равен нулю в генеральной совокупности)
\( H_1: b_j \neq 0 \), или параметр значим (не равен нулю в ГС)

Правило:

\( P\text{-}value > \alpha \Rightarrow H_0 \)
\( P\text{-}value < \alpha \Rightarrow H_1 \)

Уровень значимости \( \alpha \) принимает значения 0.05, 0.01, 0.10.