В нашей работе мы рассматриваем такую проблему, как влияние безработицы на уровень бедности в стране.

Прежде всего стоит конкретизировать эти два основных параметра- ключевой регрессор и объясняемая переменная (безработица “unemployment rate” и “poverty_gap”). В нашем проекте мы стремимся проанализировать такое сложное экономическое явление как уровень бедности, который просто нельзя анализировать только с точи зрения экономических терминов. Мы подходим к решению экономического вопроса с о стороны институционально-экономических и экономико-культурных сторон. Экономисты при рассмотрении понятия безработицы разделяют ее на три ключевых вида: структурную, фрикционную и сезонную безработицу. Каждая из трех видов имеет свои предпосылки возникновения и тенденции, однако в нашем исследовании мы не разделяем общую безработицу на подтипы, так как область наших интересов лежит вне этого деления. Мы выбрали ключевым регрессором именно безработицу, а не другие социально-экономические регрессоры, так как нам были близки по взглядам идеи

Джозефа Раунти, который изучал бедность не только с точки зрения экономики, но и с социальной точки зрения, уделяя особое внимание безработице не как экономическому циклу с поддержанием системы жёстких цен, а как фундаментальную причину в сбое работы рынка и государственной помощи для устранения причин бедности. Именно поэтому мы не делим безработицу на подвиды, но уделяем особое внимание ее связи с государством и социальными институтами. Мы хотим показать, что уровень занятости имеет особое значения для благосостояния каждого отдельного индивида, на его социальное положение и уровень его заработка.

И главным нашим вопросом проекта стал вопрос:

“Правда ли, что на уровень бедности в большей степени влияет уровень безработицы?”.

Мы поставили именно этот вопрос, так как хотели проверить суть теории Раунта, которую можно представить через такое короткое цитирование из его статьи:

“По мере роста безработицы и изменений в обществе все больше людей оказывется в зависимости от пособий по социальному обеспечению, которые отстают от среднего уровня жизни. В результате обоих факторов бедность растет.”

Однако, эта теория была создана в середине прошлого века,а мы хотим проверить, сохранила ли она актуальность и на сегодняшний день или нет?

Это и станет нашим экономическим механизмом при проведении проектных исследований.

Для начала закгрузим данные и визуализируем основные регрессоры нашей модели:уровень бедности и безработицы в странах.

Мы можем заметить, что уровень бедности в развитых странах ниже, чем в целом во всех развивающихся странах.Это подтверждает нашу первоначальный аргумент о том, что развитые страны поддерживают уровень бедность на относительно низком уровне, даже не смотря на высокий уровень безработицы за счет гос.поддержки нуждающихся при том что развитые страны, как и развивающиеся, имеют как высокую, так и низкий уровень безработицы, что видно из грайика. Давайте подтвердим наши умозаключения н данных: для этого врозьмем такие социально-экономические показатели, как траты на здравоохранение в процентном соотношении от ВВП страны, уровень демократии и криминала в стране и доступ к интернету, а также траты на образование по двум типам стран.

Как мы видим, наши рассуждения подтверждаются на данных, однако не все.Так, если рассмотреть траты на обучение, то большинство развивающихся стран тратят на обучение такой же процент ВВПкак и развитые, однако уровень бедности там заметно выше, это может быть связано с тем, что абсолютная величина ВВП развивающихся стран ниже.В дальнейшем мы это проверим.

Процент верующих людей явно коррелирует с уровнем бедности, и , хотя в развитых странах наблюдается разные уровни верующих, все же в развивающихся их больше, а с ростом “верующих” растет и уровень бедности.

Траты на здравоохранение также коррелируют с уровнем бедности- особенно это видно в развивающихся странах- там, где они особо малы, люди живут за гранью нищеты.

Что касается уровня преступности- здесь похожая картина- в развивающихся странах уровень преступности в среднем выше 40%, тогда как для развитых этот показатель не превышает 50%.Чем выше преступность- тем выше уровень бедности, это верно как для развитых, так и для развивающихся стран.

И, наконец, уровень доступа людей к интернету, взятый нами как аналог индекса демократии-показывает насколько страна интегрированна в мировое пространство, показывает похожие результаты при анализе: в большинстве развивающихся стран уровень доступа людей к мировому интернетному ресурсу не превышает 50%, тогда как в развитых эта цифра превышает порог 50% в 90% случаев.

Конечно, при изучении таких глобальных макроэкономических проблем мы не можем быть уверены, что учли все факторы, которые в той или иной степени могли повлиять на корректность нашего исследовательского вопроса и выводов.Поэтому прежде чем строить модели множественных регрессий мы должны выяснить, а могли мы не учесть какие-то факторы, которые могут привести к смещению оценки МНК.

Первым делом посмотрим на таблицу корреляций наших переменных:

Переменные Unemployment_rate и Povety_gap слабо коррелируют, тогда как уровень расходов на здравоохранение и уровень преступности,религиозности и индекс Джини положительно коррелируют с изучаемой переменной. Однако, мы не должны забывать, что наша модель может быть смещенной из-за нерасматриваемых факторов, которые просто не анализировались в нашей модели.Так, например, мы проигнориовали в силу отсутствия полных данных- такой фактор как погодные условия и климат.А ведь в странах ближе к экватору уровень жизни заметно падает из-за тяжелых погодных условий, то же происходит и в крайне северных городах, мы также не рассматриваем переменные, связанные с миграцией населения,процент трудоспособных мужчин в стране, зачастую составляющий основную экономическую силу, не рассматриваем образование по полу и многие другие факторы.

Построим модель множественной линейной регресии:

## 
## Call:
## lm(formula = Poverty_gap ~ Gini + PPP_perc + religion + crime + 
##     Unemployment_rate, data = final_data1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -31.166  -9.858  -3.447   8.889  43.158 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        3.05463    9.89566   0.309    0.758    
## Gini               0.28439    0.20694   1.374    0.172    
## PPP_perc          -4.27031    0.83541  -5.112 1.08e-06 ***
## religion           0.15688    0.08335   1.882    0.062 .  
## crime              0.17496    0.11174   1.566    0.120    
## Unemployment_rate  0.15549    0.20622   0.754    0.452    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 15.81 on 134 degrees of freedom
## Multiple R-squared:  0.4927, Adjusted R-squared:  0.4738 
## F-statistic: 26.03 on 5 and 134 DF,  p-value: < 2.2e-16
##       (Intercept)              Gini          PPP_perc          religion 
##         3.0546345         0.2843937        -4.2703119         0.1568802 
##             crime Unemployment_rate 
##         0.1749555         0.1554942

При построении данной множественной линейной регрессии только расходы государства является значмой переменной.То есть с ростом расходов государства на здоравоохраннение, уровень бедности индивида падает в среднем на 4.27 проц.пункта.

При добавлении регрессора типа страны в нашу модель:

## 
## Call:
## lm(formula = Poverty_gap ~ Gini + PPP_perc + religion + crime + 
##     Unemployment_rate + country_type + education + literacy, 
##     data = final_data1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -21.934  -7.832  -1.430   5.429  34.428 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)            67.27147    9.10189   7.391 1.53e-11 ***
## Gini                    0.62913    0.15507   4.057 8.48e-05 ***
## PPP_perc               -3.02933    0.70660  -4.287 3.48e-05 ***
## religion                0.06705    0.06205   1.081   0.2819    
## crime                   0.02839    0.08062   0.352   0.7253    
## Unemployment_rate       0.19519    0.14972   1.304   0.1946    
## country_typedeveloping  5.02293    3.78524   1.327   0.1868    
## education               1.41433    0.74499   1.898   0.0598 .  
## literacy               -0.89888    0.07707 -11.663  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.15 on 131 degrees of freedom
## Multiple R-squared:  0.7536, Adjusted R-squared:  0.7386 
## F-statistic: 50.08 on 8 and 131 DF,  p-value: < 2.2e-16
##            (Intercept)                   Gini               PPP_perc 
##            67.27147485             0.62913467            -3.02932714 
##               religion                  crime      Unemployment_rate 
##             0.06704692             0.02839000             0.19518656 
## country_typedeveloping              education               literacy 
##             5.02293036             1.41432998            -0.89887744
## 
## Call:
## lm(formula = Poverty_gap ~ I(Unemployment_rate^2) + literacy + 
##     I(taxes_on_inc^2) + log(Internet) + I(Gini^3) + I(PPP_perc^(1/2)), 
##     data = final_data1)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -24.9465  -5.0139  -0.1236   4.5016  25.8499 
## 
## Coefficients:
##                          Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             1.004e+02  4.824e+00  20.824  < 2e-16 ***
## I(Unemployment_rate^2)  5.894e-03  3.127e-03   1.885  0.06162 .  
## literacy               -4.674e-01  6.691e-02  -6.986 1.23e-10 ***
## I(taxes_on_inc^2)       2.320e-03  1.268e-03   1.830  0.06952 .  
## log(Internet)          -1.228e+01  1.211e+00 -10.144  < 2e-16 ***
## I(Gini^3)               9.472e-05  1.959e-05   4.836 3.60e-06 ***
## I(PPP_perc^(1/2))      -4.855e+00  1.664e+00  -2.918  0.00413 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.467 on 133 degrees of freedom
## Multiple R-squared:  0.8556, Adjusted R-squared:  0.8491 
## F-statistic: 131.4 on 6 and 133 DF,  p-value: < 2.2e-16
##            (Intercept) I(Unemployment_rate^2)               literacy 
##           1.004468e+02           5.893917e-03          -4.673890e-01 
##      I(taxes_on_inc^2)          log(Internet)              I(Gini^3) 
##           2.319973e-03          -1.228147e+01           9.471821e-05 
##      I(PPP_perc^(1/2)) 
##          -4.854848e+00

Наиболее значимые регрессоры в данной модели: literacy,Internet,Gini и PPP_perc

Все коэффициенты в уравнении статистически значимы с разным уровнем достоверности. Величина p-value:<2.2e-16 является статистически достоверной. Мы построили такую регрессию так, как мы считаем что такое представление регрессии более полно отражает нашу объясняемую переменную. Хочется также заметить, что мы считаем что уровень религи и преступности связаны так как при росте уровня религии люди становятся более законопослушными.

То есть с ростом уровня грамотности молодёжи,уровень бедности индивида в среднем падает на 4,67 проц.пункта С ростом уровня доступности открытого и долгосрочного выхода в Интернет, уровень бедности индивида падает в среднем на 1,23 проц.пункта То есть с ростом расходов государства на здоравоохраннение, уровень бедности индивида падает в среднем на 4.85 проц.пункта.

Гетероскедастичность — Var(ϵi|xi)≠const.

Так как нет единого подхода по выявлению гетероскедастичности, то использем наиболее распространенный подход - тест White’s test.

Покажем доверительные интервалы для коэффициентов из регрессии и дисперсию регрессионных констант на регрессоры:

##                                2.5 %        97.5 %
## (Intercept)             9.090570e+01  1.099879e+02
## I(Unemployment_rate^2) -2.908107e-04  1.207865e-02
## literacy               -5.997304e-01 -3.350475e-01
## I(taxes_on_inc^2)      -1.878574e-04  4.827803e-03
## log(Internet)          -1.467612e+01 -9.886811e+00
## I(Gini^3)               5.597814e-05  1.334583e-04
## I(PPP_perc^(1/2))      -8.145220e+00 -1.564476e+00

Так как предположение об условной гомоскедастичносити в нашей модели была отвергнута,то как и ожидалось в нашей модели имеет место быть условная гетероскедастичность.

Робастные стандартные ошибки:

Goldfeld-Quandt Test: мы предполагаем, что разброс дисперси иуровня бедности зависит от процента верующих людей и уровня преступности: p-value = 0. Гомоскедастичность отвергается.

Null (H0): Homoscedasticity is present. Alternative (HA): Heteroscedasticity is present.

Попробуем использовать тест на гетероскедастичность Бреуша-Пагана (используем робастный (стьюдентизированный) вариант теста ) :

## 
##  studentized Breusch-Pagan test
## 
## data:  new_reg_1
## BP = 22.929, df = 6, p-value = 0.0008206

При оценке гетероскедастичности модели мы использовали робастные стандартные ошибки, которые позволили нам адекватно оценить существующую модель. Использовав их, мы получили скорректированные оценки:

Проведем дополнительные тесты с типом страны, чтобы узнать какие еще взаимосвязи нам удасться выявить:

## # A tibble: 1 × 10
##   estimate estimate1 estimate2 statistic p.value parameter conf.low conf.high
##      <dbl>     <dbl>     <dbl>     <dbl>   <dbl>     <dbl>    <dbl>     <dbl>
## 1    -1.54      8.99      10.5     -1.72  0.0879      128.    -3.30     0.231
## # … with 2 more variables: method <chr>, alternative <chr>
## # A tibble: 1 × 10
##   estimate estimate1 estimate2 statistic  p.value parameter conf.low conf.high
##      <dbl>     <dbl>     <dbl>     <dbl>    <dbl>     <dbl>    <dbl>     <dbl>
## 1    -26.1     0.582      26.7     -12.6 8.95e-23      106.    -30.2     -22.0
## # … with 2 more variables: method <chr>, alternative <chr>
## # A tibble: 1 × 10
##   estimate estimate1 estimate2 statistic  p.value parameter conf.low conf.high
##      <dbl>     <dbl>     <dbl>     <dbl>    <dbl>     <dbl>    <dbl>     <dbl>
## 1     3.69      6.38      2.69      10.9 1.48e-14      48.1     3.01      4.37
## # … with 2 more variables: method <chr>, alternative <chr>
## # A tibble: 1 × 10
##   estimate estimate1 estimate2 statistic  p.value parameter conf.low conf.high
##      <dbl>     <dbl>     <dbl>     <dbl>    <dbl>     <dbl>    <dbl>     <dbl>
## 1    -8.95      31.5      40.5     -9.22 3.67e-15      104.    -10.9     -7.03
## # … with 2 more variables: method <chr>, alternative <chr>

При проведении тестов было выявлено, что тип страны взаимосвязан с уровнем бедности, неравенством распределения доходов (индекс GINI) и расходами госудорства на здоровье. Взаимосвязь уровня безработицы и типа страны незначимая.

Предположение: в связи с развитием транснациональных компаний большая часть производства была перенесена в развивающиеся страны, следовательно это значит наличие большого количества рабочих мест там. Но из-за низких заработных плат, уровень бедности в развивающихся странах все равно высок.

В нашей модели мы решили применить логарифмическую функцию к уровню неравенства в стране, так как именно эта функция сглаживает все наши наблюдения и используется в работе Ленса [1] для определения бедности в его регрессионном анализе, по тем же причинам мы прологарифмировали траты на здравоохранение.

## 
## ========================================================
##                                  Dependent variable:    
##                              ---------------------------
##                                      Poverty_gap        
## --------------------------------------------------------
## I(log(Gini))                          29.767***         
##                                        (6.649)          
##                                                         
## I(literacy * democracy_rate)          -0.140***         
##                                        (0.034)          
##                                                         
## --------------------------------------------------------
## Observations                             140            
## R2                                      0.723           
## Adjusted R2                             0.708           
## Residual Std. Error               11.770 (df = 132)     
## F Statistic                    49.251*** (df = 7; 132)  
## ========================================================
## Note:                        *p<0.1; **p<0.05; ***p<0.01
## 
## Call:
## lm(formula = Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + 
##     I(log(PPP_perc)) + I(education * religion) + I(log(Gini)) + 
##     democracy_rate + I(literacy * democracy_rate), data = final_data1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -31.444  -7.832  -0.749   4.836  35.424 
## 
## Coefficients:
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                  -81.033618  20.738545  -3.907 0.000148 ***
## Unemployment_rate             -0.420761   0.387944  -1.085 0.280080    
## I(Unemployment_rate^2)         0.018188   0.011281   1.612 0.109292    
## I(log(PPP_perc))              -9.545186   1.763958  -5.411 2.85e-07 ***
## I(education * religion)        0.027969   0.007706   3.630 0.000405 ***
## I(log(Gini))                  29.767200   5.753978   5.173 8.34e-07 ***
## democracy_rate                11.733744   1.368526   8.574 2.34e-14 ***
## I(literacy * democracy_rate)  -0.140113   0.014659  -9.558  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.77 on 132 degrees of freedom
## Multiple R-squared:  0.7231, Adjusted R-squared:  0.7084 
## F-statistic: 49.25 on 7 and 132 DF,  p-value: < 2.2e-16
##                  (Intercept)            Unemployment_rate 
##                 -81.03361846                  -0.42076058 
##       I(Unemployment_rate^2)             I(log(PPP_perc)) 
##                   0.01818820                  -9.54518553 
##      I(education * religion)                 I(log(Gini)) 
##                   0.02796943                  29.76720007 
##               democracy_rate I(literacy * democracy_rate) 
##                  11.73374409                  -0.14011253

Сравнивая нашу модель с базовой множественной линейной регрессией мы видим, что изменение предстваленных регрессором через экспоненциальную функцию и квадрат сильно увеличило качество приближения данных второй моделью,также регрессоры модели, такие как crime, PPP_perc и religion,literacy стали значимыми в нашей модели.Мы видим, что модель в целом значима, а также есть значимые регрессоры, значит мультиколинеарности нет.

Значимость регрессии в целом:

## Wald test
## 
## Model 1: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
## Model 2: Poverty_gap ~ 1
##   Res.Df Df      F    Pr(>F)    
## 1    132                        
## 2    139 -7 49.251 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Гомоскедастичность: p =8.2774e-09<0.05 нет гомоскедостичности.

## Non-constant Variance Score Test 
## Variance formula: ~ fitted.values 
## Chisquare = 33.20882, Df = 1, p = 8.2774e-09

Гетероскедастичность — Var(ϵi|xi)≠const.

Так как нет единого подхода по выявлению гетероскедастичности, то использем наиболее распространенный подход - тест White’s test.

Покажем доверительные интервалы для коэффициентов из регрессии и дисперсию регрессионных констант на регрессоры:

##                                      2.5 %       97.5 %
## (Intercept)                  -1.220565e+02 -40.01072745
## Unemployment_rate            -1.188152e+00   0.34663099
## I(Unemployment_rate^2)       -4.126957e-03   0.04050335
## I(log(PPP_perc))             -1.303447e+01  -6.05590250
## I(education * religion)       1.272671e-02   0.04321214
## I(log(Gini))                  1.838526e+01  41.14913734
## democracy_rate                9.026664e+00  14.44082445
## I(literacy * democracy_rate) -1.691097e-01  -0.11111532

Так как предположение об условной гомоскедастичносити в нашей модели была отвергнута,то как и ожидалось в нашей модели имеет место быть условная гетероскедастичность.

Робастные стандартные ошибки:

Значимость регрессии в целом мы можем проверить с помощью теста Вальда в нашем отчете p_value < 0.01. При оценке гетероскедастичности модели мы использовали робастные стандартные ошибки, которые позволили нам адекватно оценить существующую модель. Использовав их, мы получили скорректированные оценки:

Попробуем использовать тест на гетероскедастичность Бреуша-Пагана (используем робастный (стьюдентизированный) вариант теста ) :

## 
##  studentized Breusch-Pagan test
## 
## data:  final_regr
## BP = 26.348, df = 7, p-value = 0.0004364

Так как тест указывает на наличие гетероскедастичности, то следует использовать робастные тестовые статистики:

## 
## t test of coefficients:
## 
##                                 Estimate  Std. Error t value  Pr(>|t|)    
## (Intercept)                  -81.0336185  25.2156379 -3.2136  0.001647 ** 
## Unemployment_rate             -0.4207606   0.4094804 -1.0275  0.306042    
## I(Unemployment_rate^2)         0.0181882   0.0106370  1.7099  0.089633 .  
## I(log(PPP_perc))              -9.5451855   2.2189923 -4.3016 3.274e-05 ***
## I(education * religion)        0.0279694   0.0092334  3.0292  0.002951 ** 
## I(log(Gini))                  29.7672001   6.6485364  4.4773 1.619e-05 ***
## democracy_rate                11.7337441   3.4971289  3.3553  0.001036 ** 
## I(literacy * democracy_rate)  -0.1401125   0.0339324 -4.1292 6.417e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Как видим, влияние уровня безработицы Unemployment_rate+I(Unemployment_rate^2) стало значимым на уровне 5%.

Предельные эффекты

## Warning in check_values(data, at): A 'at' value for 'Unemployment_rate' is
## outside observed data range (0.255697522,45.29355975)!
## Average marginal effects at specified values
## lm(formula = Poverty_gap ~ I(Unemployment_rate^2) + literacy +     I(taxes_on_inc^2) + log(Internet) + I(Gini^3) + I(PPP_perc^(1/2)),     data = final_data1)
##  at(Unemployment_rate) at(Gini) at(taxes_on_inc) at(Internet) at(literacy)
##                      0    38.38            23.75        34.65        87.57
##                     10    38.38            23.75        34.65        87.57
##                     20    38.38            23.75        34.65        87.57
##                     30    38.38            23.75        34.65        87.57
##                     40    38.38            23.75        34.65        87.57
##  Unemployment_rate
##             0.0000
##             0.1179
##             0.2358
##             0.3536
##             0.4715
## Warning in check_values(data, at): A 'at' value for 'Unemployment_rate' is
## outside observed data range (0.255697522,45.29355975)!

## Warning in check_values(data, at): Some 'at' values for 'PPP_perc' are outside
## observed data range (0.21,9.27)!
## Warning: Removed 1 rows containing missing values (geom_point).

## 
## Call:
## lm(formula = Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + 
##     I(log(PPP_perc)) + educrelig + I(log(Gini)) + democracy_rate + 
##     litdemoc, data = final_data1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -31.444  -7.832  -0.749   4.836  35.424 
## 
## Coefficients:
##                          Estimate Std. Error t value Pr(>|t|)    
## (Intercept)            -81.033618  20.738545  -3.907 0.000148 ***
## Unemployment_rate       -0.420761   0.387944  -1.085 0.280080    
## I(Unemployment_rate^2)   0.018188   0.011281   1.612 0.109292    
## I(log(PPP_perc))        -9.545186   1.763958  -5.411 2.85e-07 ***
## educrelig                0.027969   0.007706   3.630 0.000405 ***
## I(log(Gini))            29.767200   5.753978   5.173 8.34e-07 ***
## democracy_rate          11.733744   1.368526   8.574 2.34e-14 ***
## litdemoc                -0.140113   0.014659  -9.558  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.77 on 132 degrees of freedom
## Multiple R-squared:  0.7231, Adjusted R-squared:  0.7084 
## F-statistic: 49.25 on 7 and 132 DF,  p-value: < 2.2e-16
##  at(Unemployment_rate) at(PPP_perc) at(educrelig) at(Gini) at(democracy_rate)
##                      0        3.557         328.8    38.38              6.064
##                     10        3.557         328.8    38.38              6.064
##                     20        3.557         328.8    38.38              6.064
##                     30        3.557         328.8    38.38              6.064
##                     40        3.557         328.8    38.38              6.064
##  at(litdemoc) Unemployment_rate
##           538           -0.4208
##           538           -0.0570
##           538            0.3068
##           538            0.6705
##           538            1.0343

Из графика мы видим, что предельный эффект уровня безработицы начинает быть значимым с 20%, причем полностью, положителен. Тогда как уровень безработицы незначим в отрезке от 0 до 20%.

Гипотезы

Проведемтесты Вальда : (Тест на все переменные)

## Linear hypothesis test
## 
## Hypothesis:
## Unemployment_rate = 0
## I(Unemployment_rate^2) = 0
## I(log(PPP_perc)) = 0
## I(log(Gini)) = 0
## democracy_rate = 0
## I(literacy * democracy_rate) = 0
## I(education * religion) = 0
## 
## Model 1: restricted model
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
## 
## Note: Coefficient covariance matrix supplied.
## 
##   Res.Df Df  Chisq Pr(>Chisq)    
## 1    139                         
## 2    132  7 382.38  < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Тестовая статистика равна 382.38 . На любом уровне значимости мы можем отвергнуть нулевую гипотезу о том, что все значения коэффициэнтов при регрессорах равны нулю.

Посмотрим на такие переменные как уровень демократии и грамотности населения: Потестируем значимость влияния уровня образования , т.е. гипотезу

H0 :democracy_rate=0,literacydemocracy_rate=0 H1 :democracy_rate!=0,literacydemocracy_rate!=0

используя робастный тест Вальда

## Linear hypothesis test
## 
## Hypothesis:
## democracy_rate = 0
## I(literacy * democracy_rate) = 0
## 
## Model 1: restricted model
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
## 
## Note: Coefficient covariance matrix supplied.
## 
##   Res.Df Df  Chisq Pr(>Chisq)    
## 1    134                         
## 2    132  2 40.759   1.41e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Тестовая статистика равна 40.759, мы можем отвергнуть нулевую гипотезу о том, что оба коэффициента равны нулю на любом уровне значимости, обычно используемом на практике.

HO:democracy_rate=I(literacy * democracy_rate) = 0

## Linear hypothesis test
## 
## Hypothesis:
## Unemployment_rate = 0
## I(Unemployment_rate^2) = 0
## 
## Model 1: restricted model
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
## 
## Note: Coefficient covariance matrix supplied.
## 
##   Res.Df Df  Chisq Pr(>Chisq)   
## 1    134                        
## 2    132  2 10.945   0.004202 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Влияние демократи значимо на любом уровне значимости.

H0: I(literacy * democracy_rate)= I(education * religion)

Ha: I(literacy * democracy_rate)!= I(education * religion)

## Linear hypothesis test
## 
## Hypothesis:
## - I(education * religion)  + I(literacy * democracy_rate) = 0
## 
## Model 1: restricted model
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
## 
##   Res.Df   RSS Df Sum of Sq  Chisq Pr(>Chisq)    
## 1    133 31406                                   
## 2    132 18286  1     13120 94.712  < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

HO: β1 + β2 + β3 + β4 + β5+β6+β7= 1 H1: β1 + β2 + β3 + β4 + β5+β6+β7!= 1

## Linear hypothesis test
## 
## Hypothesis:
## Unemployment_rate  + I(Unemployment_rate^2)  + I(log(PPP_perc))  + I(education * religion)  + I(log(Gini))  + democracy_rate  + I(literacy * democracy_rate) = 0.8
## 
## Model 1: restricted model
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
## 
##   Res.Df   RSS Df Sum of Sq      F    Pr(>F)    
## 1    133 21185                                  
## 2    132 18286  1      2899 20.927 1.087e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Linear hypothesis test
## 
## Hypothesis:
## I(log(PPP_perc))  + I(education * religion)  + democracy_rate  + I(literacy * democracy_rate) = 0
## 
## Model 1: restricted model
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
## 
## Note: Coefficient covariance matrix supplied.
## 
##   Res.Df Df Chisq Pr(>Chisq)
## 1    133                    
## 2    132  1 0.455        0.5
## Wald test
## 
## Model 1: Poverty_gap ~ I(log(PPP_perc)) + I(education * religion) + I(log(Gini)) + 
##     democracy_rate + I(literacy * democracy_rate)
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
##   Res.Df Df  Chisq Pr(>Chisq)
## 1    134                     
## 2    132  2 4.4879      0.106
## Wald test
## 
## Model 1: Poverty_gap ~ I(Unemployment_rate^2) + I(log(PPP_perc)) + I(education * 
##     religion) + I(log(Gini)) + democracy_rate + I(literacy * 
##     democracy_rate)
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
##   Res.Df Df  Chisq Pr(>Chisq)
## 1    133                     
## 2    132  1 1.0559     0.3042
## Wald test
## 
## Model 1: Poverty_gap ~ Unemployment_rate + I(log(PPP_perc)) + I(education * 
##     religion) + I(log(Gini)) + democracy_rate + I(literacy * 
##     democracy_rate)
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
##   Res.Df Df  Chisq Pr(>Chisq)  
## 1    133                       
## 2    132  1 2.9238    0.08728 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Wald test
## 
## Model 1: Poverty_gap ~ I(Unemployment_rate^2) + I(log(PPP_perc)) + I(education * 
##     religion) + I(log(Gini)) + democracy_rate + I(literacy * 
##     democracy_rate)
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
##   Res.Df Df      F Pr(>F)
## 1    133                 
## 2    132  1 1.0559  0.306
## Wald test
## 
## Model 1: Poverty_gap ~ I(log(PPP_perc)) + I(education * religion) + I(log(Gini)) + 
##     democracy_rate + I(literacy * democracy_rate)
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
##   Res.Df Df  Chisq Pr(>Chisq)
## 1    134                     
## 2    132  2 4.4879      0.106
## Linear hypothesis test
## 
## Hypothesis:
## Unemployment_rate = 0
## I(Unemployment_rate^2) = 0
## 
## Model 1: restricted model
## Model 2: Poverty_gap ~ Unemployment_rate + I(Unemployment_rate^2) + I(log(PPP_perc)) + 
##     I(education * religion) + I(log(Gini)) + democracy_rate + 
##     I(literacy * democracy_rate)
## 
## Note: Coefficient covariance matrix supplied.
## 
##   Res.Df Df  Chisq Pr(>Chisq)   
## 1    134                        
## 2    132  2 10.945   0.004202 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Теперь мы хотим изучить различия в уровне бедности в двух типах стран. Это можно сделать с помощью простой модели линейной регрессии при кластеризации стандартных ошибок по country_type. Уравнение оценки является:

## Registered S3 method overwritten by 'clubSandwich':
##   method    from    
##   bread.mlm sandwich
##                          Coef. Estimate      SE t-stat d.f. p-val (Satt) Sig.
## 1                  (Intercept) -81.0336 1.74428 -46.46    1       0.0137    *
## 2            Unemployment_rate  -0.4208 0.07318  -5.75    1       0.1096     
## 3       I(Unemployment_rate^2)   0.0182 0.00343   5.31    1       0.1185     
## 4             I(log(PPP_perc))  -9.5452 0.42206 -22.62    1       0.0281    *
## 5      I(education * religion)   0.0280 0.00282   9.93    1       0.0639    .
## 6                 I(log(Gini))  29.7672 0.70245  42.38    1       0.0150    *
## 7               democracy_rate  11.7337 0.54626  21.48    1       0.0296    *
## 8 I(literacy * democracy_rate)  -0.1401 0.00655 -21.41    1       0.0297    *

**type = “CR0” -это корректировка “линеаризации с уменьшением смещения”, предложенная Беллом и Маккаффри (2002) и получившая дальнейшее развитие в Пустеевском и Типтоне (2017). Корректировка выбирается таким образом, чтобы оценка дисперсии-ковариации была точно беспристрастной в соответствии с заданной пользователем рабочей моделью.

Чтобы проверить нулевую гипотезу, что β2=β3=0 основываясь на спецификации модели эффектов , мы можем использовать

##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
## [1,]    0    1    0    0    0    0    0    0
## [2,]    0    0    1    0    0    0    0    0
##  test Fstat df_num df_denom p_val sig
##   HTZ 0.065      2 1.84e-14     1

Результат включает подробную информацию о форме вычисленного теста, FF-статистике, степенях свободы числителя и знаменателя, используемых для вычисления эталонного распределения, и значении p, соответствующем указанной нулевой гипотезе(Unemployment_rate=Unemployment_rate^2=0). В этом примере p=0.996, поэтому мы не отвергаем нулевую гипотезу - тип страны статистически не значим для уровней безработицы- мы не будем включать ее в рассмотрение.

##                          Coef. Estimate       SE t-stat  d.f. p-val (Satt) Sig.
## 1                  (Intercept) -81.0336 25.01907  -3.24 45.19      0.00225   **
## 2            Unemployment_rate  -0.4208  0.40981  -1.03  3.70      0.36692     
## 3       I(Unemployment_rate^2)   0.0182  0.01063   1.71  1.73      0.24806     
## 4             I(log(PPP_perc))  -9.5452  2.20418  -4.33 30.91      < 0.001  ***
## 5      I(education * religion)   0.0280  0.00923   3.03 30.62      0.00495   **
## 6                 I(log(Gini))  29.7672  6.58453   4.52 47.71      < 0.001  ***
## 7               democracy_rate  11.7337  3.49877   3.35  5.67      0.01672    *
## 8 I(literacy * democracy_rate)  -0.1401  0.03392  -4.13  8.51      0.00288   **
##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
## [1,]    0    1    0    0    0    0    0    0
## [2,]    0    0    1    0    0    0    0    0
##  test Fstat df_num df_denom p_val sig
##   HTZ  1.68      2     3.04 0.323

Чтобы посмотреть на влияние эффектов регрессоров, которые составляют значимое влияние на уровень бедности в стране, пранализируем предельные эффекты их коэф.регрессоров.

Мы также протестировали предельные эффекты регрессора трат на образование:Оказалось, что на всем промежутке этот эффект имеет значимый отрицательный эффект, и чем ближе к нулю, тем большее влияние он имеет на уровень бедности.

##  at(PPP_perc) at(Gini) at(educrelig) at(Unemployment_rate) at(democracy_rate)
##             0    38.38         328.8                 10.16              6.064
##             2    38.38         328.8                 10.16              6.064
##             4    38.38         328.8                 10.16              6.064
##             6    38.38         328.8                 10.16              6.064
##             8    38.38         328.8                 10.16              6.064
##            10    38.38         328.8                 10.16              6.064
##  at(litdemoc) PPP_perc
##           538      NaN
##           538  -4.7726
##           538  -2.3863
##           538  -1.5909
##           538  -1.1931
##           538  -0.9545

##  at(Gini) at(PPP_perc) at(educrelig) at(Unemployment_rate) at(democracy_rate)
##        24        3.557         328.8                 10.16              6.064
##        34        3.557         328.8                 10.16              6.064
##        44        3.557         328.8                 10.16              6.064
##        54        3.557         328.8                 10.16              6.064
##        64        3.557         328.8                 10.16              6.064
##  at(litdemoc)   Gini
##           538 1.2403
##           538 0.8755
##           538 0.6765
##           538 0.5512
##           538 0.4651