Emisja dwutlenku węgla (CO2) jest jednym z kluczowych czynników wpływających na zmiany klimatyczne. W miarę globalizacji planety i rozwoju gospodarek światowych, badanie emisji CO2 na poziomie krajów oraz ich przestrzennych zależności staje się niezwykle istotne. Celem naszego projektu jest ocena istotności wpływu zmiennych gospodarczo-społecznych na emisję CO2 w krajach Europu i Azji Centralnej oraz wykazanie zależności przestrzennych
Wybór zmiennych objaśniających był uzasadniony przeglądem literatury. W case study “Spatial Econometric Analysis of Carbon Dioxide Emission – European Case Study”, w którym wykonano modele przestrzenne badające wpływ PKB, transportu oraz populacji, wykazano że wzrost PKB ma bezpośredni wpływ na wzrost emisji CO2. W tym badaniu uwzględniono również wpływ liczby samochodów osobowych na emisję CO2, wykazano brak wyraźnego wpływu. Jednak powstało wiele badań i artykułów naukowych potwierdzających wpływ transportu na emisję CO2 (“Transport infrastructure and the spatial distribution of CO2 emissions”; “Spatial heterogeneity of factors influencing transportation CO2 emissions in Chinese cities: based on geographically weighted regression model”) i dlatego też postanowiliśmy uwzględnić zmienne dotyczące transportu w naszej analizie. Inne publikacje tj. “Urbanization and industrialization impact of CO2 emissions in China” wykazały wpływ rozwoju przemysłu i urbanizacji na wysokość emisji CO2 w Chinach.
Zmienne które początkowo uznaliśmy za potencjalnie istotne można podzielić na dwie części, zmienne gospodarczo-ekonomiczne takie jak: Użycie chemikaliów w produkcji; zatrudnienie w przemyśle, rolnictwie i usługach; transport lotniczy; Udział usług transportowych w eksporcie; Udział usług transportowych w imporcie; PKB (wzrost i per capita); Eskport usług komercyjnych oraz na zmienne demograficzno-społeczne takie jak: Gęstość zaludnienia; ludność miejska; Ludność wiejska; Oczekiwana długość życia; Współczynniki umieralności
W programie Geoda została utworzona macierz sąsiedztwa Królowej I rzędu Zgodnie z powyższym wykresem wygenerowanym w Geoda, można stwierdzić, że najczęściej występującą liczbą sąsiadów jest 4.
Emisje dwutlenku węgla stanowią największą część gazów cieplarnianych, które przyczyniają się do globalnego ocieplenia. Wzrost koncentracji CO2 w atmosferze jest głównym czynnikiem napędzającym zmiany klimatyczne, prowadzącym do wzrostu temperatury globalnej, topnienia lodowców, podnoszenia poziomu mórz oraz ekstremalnych zjawisk pogodowych.
Zmienną objaśnianą w naszej analizie jest Emisja CO2 (tony metryczne na osobę).
Emisja CO2 (tony metryczne na osobę) mierzy ilość dwutlenku węgla emitowaną do atmosfery na jednego mieszkańca danego kraju w ciągu roku. Jest to miara intensywności emisji w przeliczeniu na jednostkę populacji, co pozwala na porównanie emisji pomiędzy krajami o różnej liczbie ludności.
Dane dotyczące emisji dwutlenku węgla obejmują gazy pochodzące ze spalania paliw kopalnych i produkcji cementu. W naszym projekcie analizujemy wpływ innych czynników na wysokość emisji CO2.
Do krajów z najwiekszą emisją CO2 per Capita należa kraje Europy Śrdokowej w tym Polska i Niemcy. Do krajów z duża emisją należy również Rosja wraz z Kazachstanem. Co ciekawe Ukraina posiada niski wskaźnik.
Pierwszą zmienną objaśniającą jest zmienna IMPORT_TRA - Usługi transportowe (% importu usług komercyjnych) obejmują wszystkie usługi transportowe (morskie, lotnicze, lądowe, wewnętrzne drogi wodne, przestrzeń kosmiczną i rurociągi) świadczone przez rezydentów jednej gospodarki na rzecz rezydentów innej gospodarki i obejmujące przewóz pasażerów, przemieszczanie towarów (fracht), wynajem przewoźników z załogą oraz powiązane usługi pomocnicze i dodatkowe. Transport jest jednym z kluczowych sektorów odpowiedzialnych za emisje dwutlenku węgla.
Transport Morski: Najbardziej ekonomiczny na duże odległości, ale emituje znaczną ilość CO2, zwłaszcza jeśli korzysta z ciężkiego oleju opałowego.
Transport Lotniczy: Wysoce emisjogenny na jednostkę przewozu ze względu na wysokie zużycie paliwa.
Transport Drogowy i Kolejowy: Transport drogowy jest bardzo emisjogenny, zwłaszcza jeśli wykorzystuje paliwa kopalne. Kolej może być mniej emisjogenna, zwłaszcza jeśli jest elektryfikowana.
Rurociągi: Mniej emisjogenne w porównaniu do transportu drogowego, ale również generują emisje CO2, zwłaszcza przy przesyle gazu ziemnego.
Do krajów z największym udziałem usług transpotowych w imporcie usług handlowych należą Ubzekistan oraz Obwód królewiecki. Natomiast Rosja charakteryzuję się niskim poziomiem tego wskaźnika.
Drugą zmienną objaśniającą jest zmienna Chemicals - Produkcja chemikaliów i wyrobów chemicznych jako % wartości dodanej w przemyśle. Wartość dodana w przemyśle wytwórczym to suma produkcji globalnej brutto pomniejszona o wartość nakładów pośrednich wykorzystanych w produkcji.
Produkcja chemikaliów i wyrobów chemicznych jest zazwyczaj energetycznie intensywna i często wiąże się z dużymi emisjami dwutlenku węgla, głównie ze względu na:
Zużycie Energii: Procesy chemiczne wymagają dużych ilości energii, zarówno elektrycznej, jak i cieplnej, która jest często generowana z paliw kopalnych.
Procesy Produkcyjne: Wiele procesów chemicznych, zwłaszcza tych związanych z produkcją podstawowych chemikaliów, takich jak amoniak, metanol czy chlor, bezpośrednio generuje CO2 jako produkt uboczny.
Surowce: Produkcja chemikaliów często wykorzystuje surowce pochodzące z ropy naftowej i gazu ziemnego, co również wiąże się z emisjami CO2 zarówno w fazie wydobycia, jak i przetwarzania.
Kraje, których produkcja chemikaliów ma najwyższy udział w wartości dodanej w produkcji to przede wszystkim Hiszpania, Francja, kraje Beneluxu i kraje Skandynawskie. Polska, Czechy, Słowacja jak i Kraje Azji Centralnej tj. Kazakhstan cechują się niskim udziałem produkcji chemikaliów w wartości dodanej w produkcji.
##
## Moran I test under randomisation
##
## data: dane$CO2
## weights: Wqueen
##
## Moran I statistic standard deviate = 2.1681, p-value = 0.01507
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.21506939 -0.02272727 0.01202921
##
## Moran I test under randomisation
##
## data: dane$CHEMICALS
## weights: Wqueen
##
## Moran I statistic standard deviate = 1.5235, p-value = 0.06381
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.13545282 -0.02272727 0.01077931
##
## Moran I test under randomisation
##
## data: dane$IMPORT_TRA
## weights: Wqueen
##
## Moran I statistic standard deviate = 2.8082, p-value = 0.002491
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.28299245 -0.02272727 0.01185196
## Ii E.Ii Var.Ii Z.Ii
## Min. :-0.60697 Min. :-2.344e-01 Min. :0.0000668 Min. :-1.7747
## 1st Qu.:-0.08371 1st Qu.:-1.936e-02 1st Qu.:0.0225812 1st Qu.:-0.3686
## Median : 0.04887 Median :-9.049e-03 Median :0.0861228 Median : 0.5748
## Mean : 0.21507 Mean :-2.273e-02 Mean :0.2813233 Mean : 0.3251
## 3rd Qu.: 0.38876 3rd Qu.:-1.870e-03 3rd Qu.:0.3131132 3rd Qu.: 0.9768
## Max. : 1.88494 Max. :-8.190e-06 Max. :2.5664748 Max. : 2.4619
## Pr(z != E(Ii))
## Min. :0.01382
## 1st Qu.:0.22874
## Median :0.44402
## Mean :0.44035
## 3rd Qu.:0.58931
## Max. :0.93745
Na podstawie testu Morana wniosujemy, że zmienna CO2 jest przestrzennie zależna, ponieważ p-value wynoszące 0,015 daje podstawy do odrzucefnia H0 na rzecz hipotezy alterantywnej (Przyjęty poziom istotności 0.05). Sprawdzenie zmiennych objaśniających wykazało, że zmienne IMPORT_TRA jest przestrzennie zależna na poziomie alfa 0,05 (p-value = 0,002). Zmienna CHEMICALS ma poziom p-value na poziomie 0,06 zatem jest przestrzenie zależna dopiero dla poziomu alfa 0,1
W projekcie powinien znaleźć się oszacowany model przyczynowo-skutkowy zawierający wybrane zmienne objaśniające. Dla tego modelu (jego reszt) i wybranej macierzy wag należy wyznaczyć testy ex-ante oraz dokonać ich interpretacji.
##
## Call:
## lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data = dane)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.42173 -0.32155 0.01937 0.34376 1.06059
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.1989 0.4304 5.109 7.47e-06 ***
## log(IMPORT_TRA) -0.3142 0.1163 -2.702 0.00989 **
## log(CHEMICALS) 0.2208 0.1049 2.105 0.04129 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4991 on 42 degrees of freedom
## Multiple R-squared: 0.2223, Adjusted R-squared: 0.1853
## F-statistic: 6.004 on 2 and 42 DF, p-value: 0.00509
Zmienne objaśniające IMPORT_TRA i CHEMICALS są istotne na poziome istotności alfa=0.05. Kiedy log(IMPORT_TRA) i log(CHEMICALS) są równe zero, przewidywana wartość log(CO2) wynosi 2.1989. Przy jednostkowym wzroście log(IMPORT_TRA), przewidywana wartość log(CO2) zmniejsza się średnio o 0,3142%, przy założeniu, że log(CHEMICALS) pozostaje stałe. Przy jednostkowym wzroście log(CHEMICALS), przewidywana wartość log(CO2) zwiększa się średnio o 0,2208%, przy założeniu, że log(IMPORT_TRA) pozostaje stałe. Model wyjaśnia 22.23% zmienności log(CO2). Skorygowana wartość R-kwadrat uwzględnia liczbę zmiennych w modelu i wielkość próby. Wskazuje, że po skorygowaniu model wyjaśnia 18.53% zmienności log(CO2). Statystyka F testuje, czy model jako całość jest istotny statystycznie. Niska wartość p-value (< 0.05) wskazuje, że model jest istotny statystycznie, co oznacza, że przynajmniej jeden z predyktorów ma istotny wpływ na log(CO2). Model sugeruje, że import handlowy log(IMPORT_TRA) ma negatywny wpływ na emisję CO2, podczas gdy przemysł chemiczny log(CHEMICALS) ma pozytywny wpływ. Model jest statystycznie istotny, ale wyjaśnia jedynie część zmienności w danych (R2 wynosi 0.2223), co sugeruje, że inne zmienne mogą również mieć wpływ na emisję CO2.
##
## Breusch-Pagan test
##
## data: modelOLS
## BP = 2.5994, df = 2, p-value = 0.2726
## White's test results
##
## Null hypothesis: Homoskedasticity of the residuals
## Alternative hypothesis: Heteroskedasticity of the residuals
## Test Statistic: 0.85
## P-value: 0.654759
##
## Jarque Bera Test
##
## data: res
## X-squared = 1.257, df = 2, p-value = 0.5334
##
## Shapiro-Wilk normality test
##
## data: res
## W = 0.98433, p-value = 0.7942
Inerpretacja weryfikacji modelu
Na podstawie testu breuscha-pagana uznajemy brak podstaw do odrzucenia H0, ponieważ p-value = 0.2726 jest większe od przyjętego poziomu istotności alfa= 0.05. Test white’a również pomaga nam przyjąć hipotezę zerową ponieważ p-value = 0,655 jestwiększe od alfy = 0.05. Zatem model cechuje się stałością wariancji. Test Shapiro-Wilk wykazuję normalność rozkłądu reszt (p-value = 0.7942 > alfa=0.05). Potwierdza to również test Jarque-Bery, gdzie p-value ma wartość równą 0.5334 (brak podstaw do odrzucenia H0). Wszystkie założenia KMNK zostały spełnione.
##
## Global Moran I for regression residuals
##
## data:
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## weights: Wqueen
##
## Moran I statistic standard deviate = 1.7177, p-value = 0.04292
## alternative hypothesis: greater
## sample estimates:
## Observed Moran I Expectation Variance
## 0.15546378 -0.03109963 0.01179617
## Please update scripts to use lm.RStests in place of lm.LMtests
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## test weights: listw
##
## RSerr = 1.7841, df = 1, p-value = 0.1816
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## test weights: listw
##
## RSlag = 3.2938, df = 1, p-value = 0.06954
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## test weights: listw
##
## adjRSerr = 0.58679, df = 1, p-value = 0.4437
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## test weights: listw
##
## adjRSlag = 2.0964, df = 1, p-value = 0.1476
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## test weights: listw
##
## SARMA = 3.8806, df = 2, p-value = 0.1437
W celu zbadania występowania zależności przestrzennych w modelu KMNK wykorzystano Test I Morana oraz Test Lagranga. Pierwszy przyjmuję Hipoteze zerową o braku występowania zależności przestrzennych, hipoteza alternatywna nie posiada precyzyjnego sformułowania w literaturze.
Wartość statystyki Morana I wyznaczonej dla reszt modelu szacowanego za pomocą metody najmniejszych kwadratów (1.7177) oraz wartość p (0.04292), która jest wyznaczona dla tej statystyki wskazują, że należy odrzucić hipotezę zerową o braku zależności przestrzennych na korzyść hipotezy alternatywnej dla przyjętego poziomu istotności α=0,05. (0.04292<α) Zatem można spodziewać się, że zależność przestrzenna w resztach modelu występuje.
W celu daleszej weryfikacji zależności przestrzennych w modelu przeprowadzono test mnożnika Lagrange’a dla autokorelacji przestrzennej LMsem i dla autoregresji przestrzennej LMsar.
W obu testach warość statystyki Rao’s score wyniosły odpowiednio 1.7841 (RSerr) i 3.2938 (RSlag). Wartość p dla statysyk były równe 0.1816 (RSerr) i 0.06954 (RSlag). Na tej podstawie stwierdzamy brak podstaw do odrzcenia hipotezy zerowej dla Testu autokorelacji przestrzennej LMsem (0.1816>α=0.10). Zatem wykazano brak autokorelacji przestrzennej w resztach modelu KMNK (λ = 0). Inaczej wskazuje to, że oszacowanie modelu SEM (model autokorelacji przestrzennej) dla omawianego zjawiska jest nieuzasadnione.
Natomiast wyniki drugiego testu (LMsar) wskazują na zasadność odrzucenia HO, która mówiła o braku występowania autoregresji przestrzennej (ρ = 0) na rzecz hipotezy alternatywnej (p-value=0.06954<α=0.10). Tym samym wykazano występowanie autoregresji przestrzennej w resztach modelu KMNK. W rezultacie mamy podstawy założyć, że zmienna objaśniana - Emisja CO2 per capita zostanie najlepiej wyjaśniona przy zastosowaniu modelu SAR (model autoregresji przestrzennej).
Weryfikacja ex-ante przeprowadzona powyżej wskazała na konieczność wykorzystania modelu SAR do oszacowania relacji opisanej:
Emisja CO2 = f (produkcja chemikaliów, transport w imporcie).
Model SAR oszacowano metodą największej wiarygodności.
Na poziomie istotniści α=0,05, zmienna Transport w usługach importowych (IMPORT_TRA) jest istotna, ponieważ wartość p dla tej zmiennej wynosi 0.022569, co jest mniejsze od założonego poziomu istotności. Druga zmienna - przemysł chemikaliów (CHEMICALS) w przedziale istotności α=0,05 jest nieistotna, gdyż wartość p równa 0.079114 jest większa od α. Natomiast przyjmując mniej restrykcyjne założenia, gdzie α=0,10, zmienna CHEMICALS jest istotna - P-value<α=0,10.
Wyznaczona wartość współczynnika pseudo R-kwadrat w modelu SAR jest niski i wynosi 0.3294728. Sugeruję to, że model słabo dopasowuje się do danych i nie wyjaśnia dobrze wariancji w zmiennej zależnej. Jednak jest tylko jedna z kilku miar, które posłużą do zweryfikowania modelu, jego poziomu dopasowania oraz w porównaniu do modeli alternatywnych.
W rozważaniach przyjęcia modelu SAR (inaczej modelu opóżnień przestrzennych) nie można pominąć parametru autoregresji 𝜌- parametr związany z opóźnioną przestrzennie zmienną objaśnianą (Wy) czyli w tym przypadku ze zmienną Rho. Dla oszacowanego modelu Rho = 0.39637 . Parametr ten jest statystycznie istotny ponieważ wartość p dla tego parametru wynosi 0.005267 i jest ona mniejsza od poziomu istotności α=0.05.
##
## Call:lagsarlm(formula = model, data = dane, listw = Wqueen)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.179509 -0.294562 -0.011559 0.290425 0.918979
##
## Type: lag
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.426288 0.491826 2.9000 0.003732
## log(IMPORT_TRA) -0.248319 0.108880 -2.2807 0.022569
## log(CHEMICALS) 0.166856 0.095029 1.7558 0.079114
##
## Rho: 0.39637, LR test value: 4.4776, p-value: 0.034341
## Asymptotic standard error: 0.14206
## z-value: 2.7902, p-value: 0.005267
## Wald statistic: 7.7854, p-value: 0.005267
##
## Log likelihood: -28.78652 for lag model
## ML residual variance (sigma squared): 0.20045, (sigma: 0.44771)
## Number of observations: 45
## Number of parameters estimated: 5
## AIC: 67.573, (AIC for lm: 70.051)
## LM test for residual autocorrelation
## test value: 0.5844, p-value: 0.44459
## [1] 0.3294728
## Impact measures (lag, exact):
## Direct Indirect Total
## log(IMPORT_TRA) -0.2615158 -0.1498609 -0.4113767
## log(CHEMICALS) 0.1757231 0.1006977 0.2764208
Oszacowano efekty bezpośrednie, pośrednie oraz całkowite w modelu SAR.
Bezpośrednie efekt IMPORT_TRA wynosi -0.26, co oznacza, że wzrost o 1% transportu w imporcie w danym państwie powodował spadek emisje CO2 tym samym państwie średnio o 0,26 pp. (efekt uśredniony po regionach) (zmiana w %, ponieważ zmienne są w logarytmach). Efekt bezpośredni produkcji chemikaliów wpływał dodatnio i powiemy, że wzrost produkcji chemikaliów w danym państwie o 1% powodował wzrost emisji CO2 tym samym państwie średnio o 0,176 pp.
Efekty pośrednie wyniosły odpowiednio -0,15 oraz 0,10. Oznacza to, że wzrost transportu w imporcie o 1% w danym państwie powodował spadek emisji CO2 per capita śrendio 0,14 pp. w pozostałych państwach (uśredniony po regionach, w których może wystąpić impuls). Tym samym, wzrost produkcji chemikaliów o 1% w danym państwie powodował wzrost emisji CO2 per capita średnio o 0,10 pp. w pozostałych państwach.
Na podstawie oszacowanych efektów całkowitych można stiwerdzić, że wraz ze wzrostem transportu w imporcie o 1% w danym państwie, malała emisja CO2 per capita we wszystkich państwach łącznie średnio o 0,41 pp.(uśredniony po regionach, w których może wystąpić impuls). Natomiast dodatni wpływ zmiennej CHEMICALS sugeruje, że wzrost produkcji chemikaliów o 1% w danym państwie powodował wzrost emisji CO2 per capita średnio o 0,27 pp. w we wszystkich państwach łącznie.
Do weryfikacji poprawności specyfikacji oszacowanego modelu autoregresji przestrzennej (SAR) wykorzystano Test Walda, Test LR, Test LM.
Hipoteza zerowa dla testu LR stanowi, że różnica pomiędzy oszacowaniami MNW i MNK jest nieistotna, wybieramy model bez interakcji przestrzennych. W oszacownaym modelu statystyka LRsar wynosi 4.4776, a p-value dla dla tej statystyki stanowi 0.034341. Odrzucamy H0, na rzeczy hipotezy alternatywnej, ponieważ p-value mniejsze od poziomu istotności α=0.05. Na tej podstawie wnioskujemy, że różnica pomiędzy oszacowaniami MNW i MNK jest istotna, a zatem wybieramy model SAR.
Test Walda bazuje jedynie na wynikach estymacji MNW. Hipoteza zerowa stanowi, że wyniki oszacowań modelu SAR nieistotnie różnią się od zera, w rezultacie należy wybrać model bez interakcji przestrzennych. W przeporwadzonym teście Walda dla oszacowanego Mdelu MNW statystyka Walda wyniosła 7.7854,a odpowiadająca dla niej wartość p to 0.005267. W rezultacie odrzucamy Ho na rzecz H1 (0.005267<0.05). Stwierdza się, że wyniki oszacowań modelu SAR istotnie różnią się od zera, co uzasadnia wybór modelu SAR.
Test LM bazuję na resztach oszacowanego MNW modelu SAR. Hipoteza zerowa zakłada, że model jest prawidłowo wyspecyfikowany, tym samym w modelu SAR nie występuje autokorelacja przestrzenna. Dla powyższych oszacowań statystyka LM wynosi 0.5844, a odpowiednia dla niej wartość p równa się 0.44459. Stwierdzamy brak podstaw do odrzucenia hipotezy zerowanej na rzecz hipotezy alternatywnej, ponieważ p-value 0.44459.<α=0.05. Zatem jest to potwierdzenie, że w modelu SAR nie ma dodatkowej autokorelacji.
Model SAR został prawidłowo wyspecyfikowany, ponieważ został spełniony warunek Wald(ρ) ⩾ LR(SAR) ⩾ LM(SAR), gdzie 7.7854⩾ 4.4776 ⩾ 0.5844. Dodatkowo wszystkie przeprowadzone testy ex-post, potwierdzają zasadność rezygnacji z modelu KMNK na rzecz modelu, który uwzględnia zależnosci przestrzenne - model opóźnień przestrzennych (SAR). W obu testach ex-post (Wald, LR) hipotezę zerową odrzuca się na korzyść hipotezy alternatywnej, a w teście LM stwierdza się brak dodatkowej autokorelacji (brak podstaw do odrzucenia H0).
Poniżej znajdują się oszacowane modele, których statystyki i parametry zostały wykorzystane do zbiorczego porównania w tabeli 1. poniżej.
##
## Call:errorsarlm(formula = model, data = dane, listw = Wqueen)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.3398104 -0.2882336 -0.0050728 0.3165262 0.9361538
##
## Type: error
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 2.131337 0.403896 5.2769 1.314e-07
## log(IMPORT_TRA) -0.265258 0.115558 -2.2954 0.02171
## log(CHEMICALS) 0.166540 0.096642 1.7233 0.08484
##
## Lambda: 0.35732, LR test value: 2.6498, p-value: 0.10357
## Asymptotic standard error: 0.15825
## z-value: 2.258, p-value: 0.023946
## Wald statistic: 5.0986, p-value: 0.023946
##
## Log likelihood: -29.70046 for error model
## ML residual variance (sigma squared): 0.21081, (sigma: 0.45914)
## Number of observations: 45
## Number of parameters estimated: 5
## AIC: 69.401, (AIC for lm: 70.051)
##
## Call:sacsarlm(formula = model, data = dane, listw = Wqueen)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.192186 -0.289269 -0.010677 0.286691 0.904970
##
## Type: sac
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.531085 0.870345 1.7592 0.07855
## log(IMPORT_TRA) -0.253842 0.124444 -2.0398 0.04137
## log(CHEMICALS) 0.164578 0.098257 1.6750 0.09394
##
## Rho: 0.34445
## Asymptotic standard error: 0.38976
## z-value: 0.88376, p-value: 0.37683
## Lambda: 0.12545
## Asymptotic standard error: 0.47924
## z-value: 0.26176, p-value: 0.7935
##
## LR test value: 4.6873, p-value: 0.095975
##
## Log likelihood: -28.68167 for sac model
## ML residual variance (sigma squared): 0.20118, (sigma: 0.44853)
## Number of observations: 45
## Number of parameters estimated: 6
## AIC: 69.363, (AIC for lm: 70.051)
##
## Call:lagsarlm(formula = model, data = dane, listw = Wqueen, type = "mixed")
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.018851 -0.280756 -0.015438 0.309324 1.047394
##
## Type: mixed
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.083925 0.927978 1.1681 0.24279
## log(IMPORT_TRA) -0.192774 0.122961 -1.5678 0.11694
## log(CHEMICALS) 0.168072 0.099098 1.6960 0.08988
## lag.log(IMPORT_TRA) -0.034480 0.162237 -0.2125 0.83169
## lag.log(CHEMICALS) 0.219418 0.212759 1.0313 0.30240
##
## Rho: 0.30036, LR test value: 1.911, p-value: 0.16685
## Asymptotic standard error: 0.16435
## z-value: 1.8276, p-value: 0.067609
## Wald statistic: 3.3401, p-value: 0.067609
##
## Log likelihood: -28.26483 for mixed model
## ML residual variance (sigma squared): 0.20018, (sigma: 0.44741)
## Number of observations: 45
## Number of parameters estimated: 7
## AIC: 70.53, (AIC for lm: 70.441)
## LM test for residual autocorrelation
## test value: 3.8544, p-value: 0.049615
Poniżej sporządzona tabele 1, przedstawia ona kryteria informacyjne oraz statystyki testowe wybranych modelu, w celu weryfikacji oraz wyboru najlepszego modelu na ich podstawie.
Lepszy model to ten, który ma wyższą wartość logarytmu wiarygoności oraz niższe wartości kryteriów informacyjnych (AIC, BIC). Porównując model bez interakcji przestrzennych oraz modele SAR, SEM, SARMA i Durbina logarytm wiarygodności jest najwyższy dla modelu Durbina (-28.26483). Natomiast oba kryteria informacyjne – Akaike i Schwarza (BIC) są niższe dla modelu SAR – odpowiednio: 67.57305 oraz 67.57305. Model SAR jest modelem najkorzystniejszym. Dodatkowo porównano statystyki testowe testu Walda oraz testu LR.
W tabeli przedstawiono wyznaczone dla statystyk wartości p. Tylko w modelu SAR są podstawy do odrzucenia H0 na rzecz hipotezy alternatywnej, ponieważ p-value równe 0.034341 jest mniejsze od przyjętego poziomu α=0.05. Statyski testu Walda zarówno w modelu SAR jak i modelu SEM sugerują przyjęcie hipotezy alternatywnej. Odpowiednio p-value 0.005267 i 0.023946 są mniejsze od α=0.05. Jednak to dla modelu SAR wartość p-value dla statystyki Walda jest najmniejsza (0.005267<0.023946).
Model | AIC | BIC | Log.wiarygodnosci | Wald.p.value | LR.p.value |
---|---|---|---|---|---|
KMNK | 70.05068 | 77.27733 | -31.02534 |
|
|
SAR | 67.57305 | 67.57305 | -28.78652 | 0.005267 | 0.034341 |
SEM | 69.40092 | 78.43423 | -29.70046 | 0.023946 | 0.10357 |
SARMA | 69.36334 | 80.20332 | -28.68167 |
|
0.095975 |
DURBIN | 70.52966 | 83.17630 | -28.26483 | 0.067609 | 0.16685 |
Celem powyższych roważań było oszacowanie jak najlepiej dopasowanego modelu z uwzględnieiem zależności przestrzennych, który wyjaśnia kształtowanie się emisji dwutlenku węgla (CO2) per capita w krajach Unii Europejskiej oraz Azji Centralnej w 2018 r.
Zmienna objaśniana wykazała występowanie zależności przestrzennych co było przesłanką do oszaczowania modelu, który wyjaśnia zjawisko oraz uwzględnia zależności przestrzenne. Do modelu podstawowego dobrano zmienne objaśniające - produkcja przemysłu chemikaliów (jako udział w wartosci dodanej w przemyśle razem) (Chemicals) oraz usługi transportowe (jako % importu usług komercyjnych) W modelu podstawowym KMNK stwierdzono spełnienie założeń KMNK dot. homoskedastyczności, normalności rozkładu.
Reszty modelu klasycznego poddano weryfikacji ex-ante. Wykazano występowanie zależności przestrzennych w resztach modelu (test Morana I) oraz autoregresji przestrzennej (tets Lagrang’a) w resztach modelu KMNK. Na tej podstawie wstępnie wybrano model SAR, a następnie oszacowano go.
Weryfikacja ex-post modelu opóźnień przestrzennych potwierdziła, zasadność wyboru tego modelu jako lepszy i przyjęcię go, jednocześnie odrzucając model KMNK. Następnie porównanano model SAR z wybranymi modelami regresji przetsrzennej opierając się o kryteria informacyjne (AIC, Schwarz, BIC, RHO, LM, WALD). W rezultacjie potwierdzono, że model SAR jest najlepeij wyspecyfikowanym, tym samym należy go ostatecznie wybrać.
Należy dodatkowo wspomnieć,że oszacowny model SAR charakteryzował sie słabym dopasowaniem- niski współczynnik determinacji oraz jedna zmienna wykazała brak istotności (na poziomie 0,05; ale jest istotna na poziomie 0,1), co sugeruję, że model należało by poddać daleszej weryfikacji oraz ewentualnej zmiany doboru zmiennych objaśniających.
źródła: https://databank.worldbank.org/source/health-nutrition-and-population-statistics#