Opis projektu

Emisja dwutlenku węgla (CO2) jest jednym z kluczowych czynników wpływających na zmiany klimatyczne. W miarę globalizacji planety i rozwoju gospodarek światowych, badanie emisji CO2 na poziomie krajów oraz ich przestrzennych zależności staje się niezwykle istotne. Celem naszego projektu jest ocena istotności wpływu zmiennych gospodarczo-społecznych na emisję CO2 w krajach Europu i Azji Centralnej oraz wykazanie zależności przestrzennych

Wybór zmiennych objaśniających był uzasadniony przeglądem literatury. W case study “Spatial Econometric Analysis of Carbon Dioxide Emission – European Case Study”, w którym wykonano modele przestrzenne badające wpływ PKB, transportu oraz populacji, wykazano że wzrost PKB ma bezpośredni wpływ na wzrost emisji CO2. W tym badaniu uwzględniono również wpływ liczby samochodów osobowych na emisję CO2, wykazano brak wyraźnego wpływu. Jednak powstało wiele badań i artykułów naukowych potwierdzających wpływ transportu na emisję CO2 (“Transport infrastructure and the spatial distribution of CO2 emissions”; “Spatial heterogeneity of factors influencing transportation CO2 emissions in Chinese cities: based on geographically weighted regression model”) i dlatego też postanowiliśmy uwzględnić zmienne dotyczące transportu w naszej analizie. Inne publikacje tj. “Urbanization and industrialization impact of CO2 emissions in China” wykazały wpływ rozwoju przemysłu i urbanizacji na wysokość emisji CO2 w Chinach.

Zmienne które początkowo uznaliśmy za potencjalnie istotne można podzielić na dwie części, zmienne gospodarczo-ekonomiczne takie jak: Użycie chemikaliów w produkcji; zatrudnienie w przemyśle, rolnictwie i usługach; transport lotniczy; Udział usług transportowych w eksporcie; Udział usług transportowych w imporcie; PKB (wzrost i per capita); Eskport usług komercyjnych oraz na zmienne demograficzno-społeczne takie jak: Gęstość zaludnienia; ludność miejska; Ludność wiejska; Oczekiwana długość życia; Współczynniki umieralności

Opis i wizualizacja danych

W programie Geoda została utworzona macierz sąsiedztwa Królowej I rzędu Zgodnie z powyższym wykresem wygenerowanym w Geoda, można stwierdzić, że najczęściej występującą liczbą sąsiadów jest 4.

Wizualizacja badanego zjawiska i opis zmiennych

Emisja CO2 per capita

Emisje dwutlenku węgla stanowią największą część gazów cieplarnianych, które przyczyniają się do globalnego ocieplenia. Wzrost koncentracji CO2 w atmosferze jest głównym czynnikiem napędzającym zmiany klimatyczne, prowadzącym do wzrostu temperatury globalnej, topnienia lodowców, podnoszenia poziomu mórz oraz ekstremalnych zjawisk pogodowych.

Zmienną objaśnianą w naszej analizie jest Emisja CO2 (tony metryczne na osobę).

Emisja CO2 (tony metryczne na osobę) mierzy ilość dwutlenku węgla emitowaną do atmosfery na jednego mieszkańca danego kraju w ciągu roku. Jest to miara intensywności emisji w przeliczeniu na jednostkę populacji, co pozwala na porównanie emisji pomiędzy krajami o różnej liczbie ludności.

Dane dotyczące emisji dwutlenku węgla obejmują gazy pochodzące ze spalania paliw kopalnych i produkcji cementu. W naszym projekcie analizujemy wpływ innych czynników na wysokość emisji CO2.

Do krajów z najwiekszą emisją CO2 per Capita należa kraje Europy Śrdokowej w tym Polska i Niemcy. Do krajów z duża emisją należy również Rosja wraz z Kazachstanem. Co ciekawe Ukraina posiada niski wskaźnik.

Usługi Transportowe

Pierwszą zmienną objaśniającą jest zmienna IMPORT_TRA - Usługi transportowe (% importu usług komercyjnych) obejmują wszystkie usługi transportowe (morskie, lotnicze, lądowe, wewnętrzne drogi wodne, przestrzeń kosmiczną i rurociągi) świadczone przez rezydentów jednej gospodarki na rzecz rezydentów innej gospodarki i obejmujące przewóz pasażerów, przemieszczanie towarów (fracht), wynajem przewoźników z załogą oraz powiązane usługi pomocnicze i dodatkowe. Transport jest jednym z kluczowych sektorów odpowiedzialnych za emisje dwutlenku węgla.

Wzrost Przewozu Towarów: Import usług transportowych oznacza, że duża część handlu międzynarodowego odbywa się za pośrednictwem transportu, co generuje emisje CO2. Im większy udział transportu w imporcie usług, tym większe mogą być emisje związane z przewozem towarów.
Rodzaj Transportu: Różne środki transportu mają różne profile emisji:
- Transport Morski: Najbardziej ekonomiczny na duże odległości, ale emituje znaczną ilość CO2, zwłaszcza jeśli korzysta z ciężkiego oleju opałowego.
- Transport Lotniczy: Wysoce emisjogenny na jednostkę przewozu ze względu na wysokie zużycie paliwa.
- Transport Drogowy i Kolejowy: Transport drogowy jest bardzo emisjogenny, zwłaszcza jeśli wykorzystuje paliwa kopalne. Kolej może być mniej emisjogenna, zwłaszcza jeśli jest elektryfikowana.
- Rurociągi: Mniej emisjogenne w porównaniu do transportu drogowego, ale również generują emisje CO2, zwłaszcza przy przesyle gazu ziemnego.
Efektywność Transportu: Wysoka efektywność logistyczna i nowoczesne technologie transportowe mogą zmniejszać emisje CO2, nawet przy wysokim poziomie importu usług transportowych. Na przykład, większe i nowocześniejsze statki oraz samoloty są bardziej energooszczędne i emitują mniej CO2 na jednostkę transportowanego ładunku.

Do krajów z największym udziałem usług transpotowych w imporcie usług handlowych należą Ubzekistan oraz Obwód królewiecki. Natomiast Rosja charakteryzuję się niskim poziomiem tego wskaźnika.

Produkcja Chemikaliów

Drugą zmienną objaśniającą jest zmienna Chemicals - Produkcja chemikaliów i wyrobów chemicznych jako % wartości dodanej w przemyśle. Wartość dodana w przemyśle wytwórczym to suma produkcji globalnej brutto pomniejszona o wartość nakładów pośrednich wykorzystanych w produkcji.

Produkcja chemikaliów i wyrobów chemicznych jest zazwyczaj energetycznie intensywna i często wiąże się z dużymi emisjami dwutlenku węgla, głównie ze względu na:

Zużycie Energii: Procesy chemiczne wymagają dużych ilości energii, zarówno elektrycznej, jak i cieplnej, która jest często generowana z paliw kopalnych.
Procesy Produkcyjne: Wiele procesów chemicznych, zwłaszcza tych związanych z produkcją podstawowych chemikaliów, takich jak amoniak, metanol czy chlor, bezpośrednio generuje CO2 jako produkt uboczny.
Surowce: Produkcja chemikaliów często wykorzystuje surowce pochodzące z ropy naftowej i gazu ziemnego, co również wiąże się z emisjami CO2 zarówno w fazie wydobycia, jak i przetwarzania.

Kraje, których produkcja chemikaliów ma najwyższy udział w wartości dodanej w produkcji to przede wszystkim Hiszpania, Francja, kraje Beneluxu i kraje Skandynawskie. Polska, Czechy, Słowacja jak i Kraje Azji Centralnej tj. Kazakhstan cechują się niskim udziałem produkcji chemikaliów w wartości dodanej w produkcji.

Zależności przestrzenne

Testowanie zależności przestrzennej względem zmiennej emisje CO2

## 
##  Moran I test under randomisation
## 
## data:  dane$CO2  
## weights: Wqueen    
## 
## Moran I statistic standard deviate = 2.1681, p-value = 0.01507
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##        0.21506939       -0.02272727        0.01202921

## 
##  Moran I test under randomisation
## 
## data:  dane$CHEMICALS  
## weights: Wqueen    
## 
## Moran I statistic standard deviate = 1.5235, p-value = 0.06381
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##        0.13545282       -0.02272727        0.01077931

## 
##  Moran I test under randomisation
## 
## data:  dane$IMPORT_TRA  
## weights: Wqueen    
## 
## Moran I statistic standard deviate = 2.8082, p-value = 0.002491
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##        0.28299245       -0.02272727        0.01185196

##        Ii                E.Ii                Var.Ii               Z.Ii        
##  Min.   :-0.60697   Min.   :-2.344e-01   Min.   :0.0000668   Min.   :-1.7747  
##  1st Qu.:-0.08371   1st Qu.:-1.936e-02   1st Qu.:0.0225812   1st Qu.:-0.3686  
##  Median : 0.04887   Median :-9.049e-03   Median :0.0861228   Median : 0.5748  
##  Mean   : 0.21507   Mean   :-2.273e-02   Mean   :0.2813233   Mean   : 0.3251  
##  3rd Qu.: 0.38876   3rd Qu.:-1.870e-03   3rd Qu.:0.3131132   3rd Qu.: 0.9768  
##  Max.   : 1.88494   Max.   :-8.190e-06   Max.   :2.5664748   Max.   : 2.4619  
##  Pr(z != E(Ii))   
##  Min.   :0.01382  
##  1st Qu.:0.22874  
##  Median :0.44402  
##  Mean   :0.44035  
##  3rd Qu.:0.58931  
##  Max.   :0.93745

Na podstawie testu Morana wniosujemy, że zmienna CO2 jest przestrzennie zależna, ponieważ p-value wynoszące 0,015 daje podstawy do odrzucefnia H0 na rzecz hipotezy alterantywnej (Przyjęty poziom istotności 0.05). Sprawdzenie zmiennych objaśniających wykazało, że zmienne IMPORT_TRA jest przestrzennie zależna na poziomie alfa 0,05 (p-value = 0,002). Zmienna CHEMICALS ma poziom p-value na poziomie 0,06 zatem jest przestrzenie zależna dopiero dla poziomu alfa 0,1

Model KMNK bez interakcji przestrzennych

W projekcie powinien znaleźć się oszacowany model przyczynowo-skutkowy zawierający wybrane zmienne objaśniające. Dla tego modelu (jego reszt) i wybranej macierzy wag należy wyznaczyć testy ex-ante oraz dokonać ich interpretacji.

modelOLS = lm(log(CO2)~+log(IMPORT_TRA)+log(CHEMICALS), data=dane)
summary(modelOLS)

## 
## Call:
## lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data = dane)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.42173 -0.32155  0.01937  0.34376  1.06059 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)       2.1989     0.4304   5.109 7.47e-06 ***
## log(IMPORT_TRA)  -0.3142     0.1163  -2.702  0.00989 ** 
## log(CHEMICALS)    0.2208     0.1049   2.105  0.04129 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4991 on 42 degrees of freedom
## Multiple R-squared:  0.2223, Adjusted R-squared:  0.1853 
## F-statistic: 6.004 on 2 and 42 DF,  p-value: 0.00509

model = log(CO2)~log(IMPORT_TRA)+log(CHEMICALS)

Interpretacja ocenny parametrów

Zmienne objaśniające IMPORT_TRA i CHEMICALS są istotne na poziome istotności alfa=0.05. Kiedy log(IMPORT_TRA) i log(CHEMICALS) są równe zero, przewidywana wartość log(CO2) wynosi 2.1989. Przy jednostkowym wzroście log(IMPORT_TRA), przewidywana wartość log(CO2) zmniejsza się średnio o 0,3142%, przy założeniu, że log(CHEMICALS) pozostaje stałe. Przy jednostkowym wzroście log(CHEMICALS), przewidywana wartość log(CO2) zwiększa się średnio o 0,2208%, przy założeniu, że log(IMPORT_TRA) pozostaje stałe. Model wyjaśnia 22.23% zmienności log(CO2). Skorygowana wartość R-kwadrat uwzględnia liczbę zmiennych w modelu i wielkość próby. Wskazuje, że po skorygowaniu model wyjaśnia 18.53% zmienności log(CO2). Statystyka F testuje, czy model jako całość jest istotny statystycznie. Niska wartość p-value (< 0.05) wskazuje, że model jest istotny statystycznie, co oznacza, że przynajmniej jeden z predyktorów ma istotny wpływ na log(CO2). Model sugeruje, że import handlowy log(IMPORT_TRA) ma negatywny wpływ na emisję CO2, podczas gdy przemysł chemiczny log(CHEMICALS) ma pozytywny wpływ. Model jest statystycznie istotny, ale wyjaśnia jedynie część zmienności w danych (R2 wynosi 0.2223), co sugeruje, że inne zmienne mogą również mieć wpływ na emisję CO2.

Weyrfikacja modelu podstawowego

res = residuals(modelOLS)
#test na stałość wariancji 
bptest(modelOLS, studentize=FALSE)

## 
##  Breusch-Pagan test
## 
## data:  modelOLS
## BP = 2.5994, df = 2, p-value = 0.2726

white_test(modelOLS)

## White's test results
## 
## Null hypothesis: Homoskedasticity of the residuals
## Alternative hypothesis: Heteroskedasticity of the residuals
## Test Statistic: 0.85
## P-value: 0.654759

#test na normalność rozkladu reszt 
jarque.bera.test(res)

## 
##  Jarque Bera Test
## 
## data:  res
## X-squared = 1.257, df = 2, p-value = 0.5334

shapiro.test(res)

## 
##  Shapiro-Wilk normality test
## 
## data:  res
## W = 0.98433, p-value = 0.7942

Inerpretacja weryfikacji modelu

Na podstawie testu breuscha-pagana uznajemy brak podstaw do odrzucenia H0, ponieważ p-value = 0.2726 jest większe od przyjętego poziomu istotności alfa= 0.05. Test white’a również pomaga nam przyjąć hipotezę zerową ponieważ p-value = 0,655 jestwiększe od alfy = 0.05. Zatem model cechuje się stałością wariancji. Test Shapiro-Wilk wykazuję normalność rozkłądu reszt (p-value = 0.7942 > alfa=0.05). Potwierdza to również test Jarque-Bery, gdzie p-value ma wartość równą 0.5334 (brak podstaw do odrzucenia H0). Wszystkie założenia KMNK zostały spełnione.

Testowanie zależności przestrzennej w resztach modelu KMNK (weryfikacja ex-ante)

## 
##  Global Moran I for regression residuals
## 
## data:  
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## weights: Wqueen
## 
## Moran I statistic standard deviate = 1.7177, p-value = 0.04292
## alternative hypothesis: greater
## sample estimates:
## Observed Moran I      Expectation         Variance 
##       0.15546378      -0.03109963       0.01179617

## Please update scripts to use lm.RStests in place of lm.LMtests

## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## test weights: listw
## 
## RSerr = 1.7841, df = 1, p-value = 0.1816
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## test weights: listw
## 
## RSlag = 3.2938, df = 1, p-value = 0.06954
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## test weights: listw
## 
## adjRSerr = 0.58679, df = 1, p-value = 0.4437
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## test weights: listw
## 
## adjRSlag = 2.0964, df = 1, p-value = 0.1476
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = log(CO2) ~ +log(IMPORT_TRA) + log(CHEMICALS), data
## = dane)
## test weights: listw
## 
## SARMA = 3.8806, df = 2, p-value = 0.1437

W celu zbadania występowania zależności przestrzennych w modelu KMNK wykorzystano Test I Morana oraz Test Lagranga. Pierwszy przyjmuję Hipoteze zerową o braku występowania zależności przestrzennych, hipoteza alternatywna nie posiada precyzyjnego sformułowania w literaturze.

Wartość statystyki Morana I wyznaczonej dla reszt modelu szacowanego za pomocą metody najmniejszych kwadratów (1.7177) oraz wartość p (0.04292), która jest wyznaczona dla tej statystyki wskazują, że należy odrzucić hipotezę zerową o braku zależności przestrzennych na korzyść hipotezy alternatywnej dla przyjętego poziomu istotności α=0,05. (0.04292<α) Zatem można spodziewać się, że zależność przestrzenna w resztach modelu występuje.

W celu daleszej weryfikacji zależności przestrzennych w modelu przeprowadzono test mnożnika Lagrange’a dla autokorelacji przestrzennej LMsem i dla autoregresji przestrzennej LMsar.

W obu testach warość statystyki Rao’s score wyniosły odpowiednio 1.7841 (RSerr) i 3.2938 (RSlag). Wartość p dla statysyk były równe 0.1816 (RSerr) i 0.06954 (RSlag). Na tej podstawie stwierdzamy brak podstaw do odrzcenia hipotezy zerowej dla Testu autokorelacji przestrzennej LMsem (0.1816>α=0.10). Zatem wykazano brak autokorelacji przestrzennej w resztach modelu KMNK (λ = 0). Inaczej wskazuje to, że oszacowanie modelu SEM (model autokorelacji przestrzennej) dla omawianego zjawiska jest nieuzasadnione.

Natomiast wyniki drugiego testu (LMsar) wskazują na zasadność odrzucenia HO, która mówiła o braku występowania autoregresji przestrzennej (ρ = 0) na rzecz hipotezy alternatywnej (p-value=0.06954<α=0.10). Tym samym wykazano występowanie autoregresji przestrzennej w resztach modelu KMNK. W rezultacie mamy podstawy założyć, że zmienna objaśniana - Emisja CO2 per capita zostanie najlepiej wyjaśniona przy zastosowaniu modelu SAR (model autoregresji przestrzennej).

Model SAR

Ocena parametrów i istotność zmiennych

Weryfikacja ex-ante przeprowadzona powyżej wskazała na konieczność wykorzystania modelu SAR do oszacowania relacji opisanej:

Emisja CO2 = f (produkcja chemikaliów, transport w imporcie).

Model SAR oszacowano metodą największej wiarygodności.

Na poziomie istotniści α=0,05, zmienna Transport w usługach importowych (IMPORT_TRA) jest istotna, ponieważ wartość p dla tej zmiennej wynosi 0.022569, co jest mniejsze od założonego poziomu istotności. Druga zmienna - przemysł chemikaliów (CHEMICALS) w przedziale istotności α=0,05 jest nieistotna, gdyż wartość p równa 0.079114 jest większa od α. Natomiast przyjmując mniej restrykcyjne założenia, gdzie α=0,10, zmienna CHEMICALS jest istotna - P-value<α=0,10.

Wyznaczona wartość współczynnika pseudo R-kwadrat w modelu SAR jest niski i wynosi 0.3294728. Sugeruję to, że model słabo dopasowuje się do danych i nie wyjaśnia dobrze wariancji w zmiennej zależnej. Jednak jest tylko jedna z kilku miar, które posłużą do zweryfikowania modelu, jego poziomu dopasowania oraz w porównaniu do modeli alternatywnych.

W rozważaniach przyjęcia modelu SAR (inaczej modelu opóżnień przestrzennych) nie można pominąć parametru autoregresji 𝜌- parametr związany z opóźnioną przestrzennie zmienną objaśnianą (Wy) czyli w tym przypadku ze zmienną Rho. Dla oszacowanego modelu Rho = 0.39637 . Parametr ten jest statystycznie istotny ponieważ wartość p dla tego parametru wynosi 0.005267 i jest ona mniejsza od poziomu istotności α=0.05.

## 
## Call:lagsarlm(formula = model, data = dane, listw = Wqueen)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -1.179509 -0.294562 -0.011559  0.290425  0.918979 
## 
## Type: lag 
## Coefficients: (asymptotic standard errors) 
##                  Estimate Std. Error z value Pr(>|z|)
## (Intercept)      1.426288   0.491826  2.9000 0.003732
## log(IMPORT_TRA) -0.248319   0.108880 -2.2807 0.022569
## log(CHEMICALS)   0.166856   0.095029  1.7558 0.079114
## 
## Rho: 0.39637, LR test value: 4.4776, p-value: 0.034341
## Asymptotic standard error: 0.14206
##     z-value: 2.7902, p-value: 0.005267
## Wald statistic: 7.7854, p-value: 0.005267
## 
## Log likelihood: -28.78652 for lag model
## ML residual variance (sigma squared): 0.20045, (sigma: 0.44771)
## Number of observations: 45 
## Number of parameters estimated: 5 
## AIC: 67.573, (AIC for lm: 70.051)
## LM test for residual autocorrelation
## test value: 0.5844, p-value: 0.44459

Pseudo R-kwadrat

## [1] 0.3294728

Efekty bezpośrednie, pośrednie i całkowite

efekty <- impacts(SAR, listw = Wqueen)
efekty

## Impact measures (lag, exact):
##                     Direct   Indirect      Total
## log(IMPORT_TRA) -0.2615158 -0.1498609 -0.4113767
## log(CHEMICALS)   0.1757231  0.1006977  0.2764208

Oszacowano efekty bezpośrednie, pośrednie oraz całkowite w modelu SAR.

Bezpośrednie efekt IMPORT_TRA wynosi -0.26, co oznacza, że wzrost o 1% transportu w imporcie w danym państwie powodował spadek emisje CO2 tym samym państwie średnio o 0,26 pp. (efekt uśredniony po regionach) (zmiana w %, ponieważ zmienne są w logarytmach). Efekt bezpośredni produkcji chemikaliów wpływał dodatnio i powiemy, że wzrost produkcji chemikaliów w danym państwie o 1% powodował wzrost emisji CO2 tym samym państwie średnio o 0,176 pp.

Efekty pośrednie wyniosły odpowiednio -0,15 oraz 0,10. Oznacza to, że wzrost transportu w imporcie o 1% w danym państwie powodował spadek emisji CO2 per capita śrendio 0,14 pp. w pozostałych państwach (uśredniony po regionach, w których może wystąpić impuls). Tym samym, wzrost produkcji chemikaliów o 1% w danym państwie powodował wzrost emisji CO2 per capita średnio o 0,10 pp. w pozostałych państwach.

Na podstawie oszacowanych efektów całkowitych można stiwerdzić, że wraz ze wzrostem transportu w imporcie o 1% w danym państwie, malała emisja CO2 per capita we wszystkich państwach łącznie średnio o 0,41 pp.(uśredniony po regionach, w których może wystąpić impuls). Natomiast dodatni wpływ zmiennej CHEMICALS sugeruje, że wzrost produkcji chemikaliów o 1% w danym państwie powodował wzrost emisji CO2 per capita średnio o 0,27 pp. w we wszystkich państwach łącznie.

Weryfikacja modelu SAR ex-post

Do weryfikacji poprawności specyfikacji oszacowanego modelu autoregresji przestrzennej (SAR) wykorzystano Test Walda, Test LR, Test LM.

Hipoteza zerowa dla testu LR stanowi, że różnica pomiędzy oszacowaniami MNW i MNK jest nieistotna, wybieramy model bez interakcji przestrzennych. W oszacownaym modelu statystyka LRsar wynosi 4.4776, a p-value dla dla tej statystyki stanowi 0.034341. Odrzucamy H0, na rzeczy hipotezy alternatywnej, ponieważ p-value mniejsze od poziomu istotności α=0.05. Na tej podstawie wnioskujemy, że różnica pomiędzy oszacowaniami MNW i MNK jest istotna, a zatem wybieramy model SAR.

Test Walda bazuje jedynie na wynikach estymacji MNW. Hipoteza zerowa stanowi, że wyniki oszacowań modelu SAR nieistotnie różnią się od zera, w rezultacie należy wybrać model bez interakcji przestrzennych. W przeporwadzonym teście Walda dla oszacowanego Mdelu MNW statystyka Walda wyniosła 7.7854,a odpowiadająca dla niej wartość p to 0.005267. W rezultacie odrzucamy Ho na rzecz H1 (0.005267<0.05). Stwierdza się, że wyniki oszacowań modelu SAR istotnie różnią się od zera, co uzasadnia wybór modelu SAR.

Test LM bazuję na resztach oszacowanego MNW modelu SAR. Hipoteza zerowa zakłada, że model jest prawidłowo wyspecyfikowany, tym samym w modelu SAR nie występuje autokorelacja przestrzenna. Dla powyższych oszacowań statystyka LM wynosi 0.5844, a odpowiednia dla niej wartość p równa się 0.44459. Stwierdzamy brak podstaw do odrzucenia hipotezy zerowanej na rzecz hipotezy alternatywnej, ponieważ p-value 0.44459.<α=0.05. Zatem jest to potwierdzenie, że w modelu SAR nie ma dodatkowej autokorelacji.

Wnioski

Model SAR został prawidłowo wyspecyfikowany, ponieważ został spełniony warunek Wald(ρ) ⩾ LR(SAR) ⩾ LM(SAR), gdzie 7.7854⩾ 4.4776 ⩾ 0.5844. Dodatkowo wszystkie przeprowadzone testy ex-post, potwierdzają zasadność rezygnacji z modelu KMNK na rzecz modelu, który uwzględnia zależnosci przestrzenne - model opóźnień przestrzennych (SAR). W obu testach ex-post (Wald, LR) hipotezę zerową odrzuca się na korzyść hipotezy alternatywnej, a w teście LM stwierdza się brak dodatkowej autokorelacji (brak podstaw do odrzucenia H0).

Porównanie modeli

Oszacowane modele zależności przestrzennych - Raporty dodatkowe

Poniżej znajdują się oszacowane modele, których statystyki i parametry zostały wykorzystane do zbiorczego porównania w tabeli 1. poniżej.

SEM - spatial error model

## 
## Call:errorsarlm(formula = model, data = dane, listw = Wqueen)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -1.3398104 -0.2882336 -0.0050728  0.3165262  0.9361538 
## 
## Type: error 
## Coefficients: (asymptotic standard errors) 
##                  Estimate Std. Error z value  Pr(>|z|)
## (Intercept)      2.131337   0.403896  5.2769 1.314e-07
## log(IMPORT_TRA) -0.265258   0.115558 -2.2954   0.02171
## log(CHEMICALS)   0.166540   0.096642  1.7233   0.08484
## 
## Lambda: 0.35732, LR test value: 2.6498, p-value: 0.10357
## Asymptotic standard error: 0.15825
##     z-value: 2.258, p-value: 0.023946
## Wald statistic: 5.0986, p-value: 0.023946
## 
## Log likelihood: -29.70046 for error model
## ML residual variance (sigma squared): 0.21081, (sigma: 0.45914)
## Number of observations: 45 
## Number of parameters estimated: 5 
## AIC: 69.401, (AIC for lm: 70.051)

SARMA

## 
## Call:sacsarlm(formula = model, data = dane, listw = Wqueen)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -1.192186 -0.289269 -0.010677  0.286691  0.904970 
## 
## Type: sac 
## Coefficients: (asymptotic standard errors) 
##                  Estimate Std. Error z value Pr(>|z|)
## (Intercept)      1.531085   0.870345  1.7592  0.07855
## log(IMPORT_TRA) -0.253842   0.124444 -2.0398  0.04137
## log(CHEMICALS)   0.164578   0.098257  1.6750  0.09394
## 
## Rho: 0.34445
## Asymptotic standard error: 0.38976
##     z-value: 0.88376, p-value: 0.37683
## Lambda: 0.12545
## Asymptotic standard error: 0.47924
##     z-value: 0.26176, p-value: 0.7935
## 
## LR test value: 4.6873, p-value: 0.095975
## 
## Log likelihood: -28.68167 for sac model
## ML residual variance (sigma squared): 0.20118, (sigma: 0.44853)
## Number of observations: 45 
## Number of parameters estimated: 6 
## AIC: 69.363, (AIC for lm: 70.051)

Spatial Durbin Model

## 
## Call:lagsarlm(formula = model, data = dane, listw = Wqueen, type = "mixed")
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -1.018851 -0.280756 -0.015438  0.309324  1.047394 
## 
## Type: mixed 
## Coefficients: (asymptotic standard errors) 
##                      Estimate Std. Error z value Pr(>|z|)
## (Intercept)          1.083925   0.927978  1.1681  0.24279
## log(IMPORT_TRA)     -0.192774   0.122961 -1.5678  0.11694
## log(CHEMICALS)       0.168072   0.099098  1.6960  0.08988
## lag.log(IMPORT_TRA) -0.034480   0.162237 -0.2125  0.83169
## lag.log(CHEMICALS)   0.219418   0.212759  1.0313  0.30240
## 
## Rho: 0.30036, LR test value: 1.911, p-value: 0.16685
## Asymptotic standard error: 0.16435
##     z-value: 1.8276, p-value: 0.067609
## Wald statistic: 3.3401, p-value: 0.067609
## 
## Log likelihood: -28.26483 for mixed model
## ML residual variance (sigma squared): 0.20018, (sigma: 0.44741)
## Number of observations: 45 
## Number of parameters estimated: 7 
## AIC: 70.53, (AIC for lm: 70.441)
## LM test for residual autocorrelation
## test value: 3.8544, p-value: 0.049615

Porównanie modeli

Poniżej sporządzona tabele 1, przedstawia ona kryteria informacyjne oraz statystyki testowe wybranych modelu, w celu weryfikacji oraz wyboru najlepszego modelu na ich podstawie.

Lepszy model to ten, który ma wyższą wartość logarytmu wiarygoności oraz niższe wartości kryteriów informacyjnych (AIC, BIC). Porównując model bez interakcji przestrzennych oraz modele SAR, SEM, SARMA i Durbina logarytm wiarygodności jest najwyższy dla modelu Durbina (-28.26483). Natomiast oba kryteria informacyjne – Akaike i Schwarza (BIC) są niższe dla modelu SAR – odpowiednio: 67.57305 oraz 67.57305. Model SAR jest modelem najkorzystniejszym. Dodatkowo porównano statystyki testowe testu Walda oraz testu LR.

W tabeli przedstawiono wyznaczone dla statystyk wartości p. Tylko w modelu SAR są podstawy do odrzucenia H0 na rzecz hipotezy alternatywnej, ponieważ p-value równe 0.034341 jest mniejsze od przyjętego poziomu α=0.05. Statyski testu Walda zarówno w modelu SAR jak i modelu SEM sugerują przyjęcie hipotezy alternatywnej. Odpowiednio p-value 0.005267 i 0.023946 są mniejsze od α=0.05. Jednak to dla modelu SAR wartość p-value dla statystyki Walda jest najmniejsza (0.005267<0.023946).

Tabela 1. Kryteria porównawcze (informacyjne) wybranych modeli
Model	AIC	BIC	Log.wiarygodnosci	Wald.p.value	LR.p.value
KMNK	70.05068	77.27733	-31.02534
SAR	67.57305	67.57305	-28.78652	0.005267	0.034341
SEM	69.40092	78.43423	-29.70046	0.023946	0.10357
SARMA	69.36334	80.20332	-28.68167		0.095975
DURBIN	70.52966	83.17630	-28.26483	0.067609	0.16685

PODSUMOWNAIE

Celem powyższych roważań było oszacowanie jak najlepiej dopasowanego modelu z uwzględnieiem zależności przestrzennych, który wyjaśnia kształtowanie się emisji dwutlenku węgla (CO2) per capita w krajach Unii Europejskiej oraz Azji Centralnej w 2018 r.

Zmienna objaśniana wykazała występowanie zależności przestrzennych co było przesłanką do oszaczowania modelu, który wyjaśnia zjawisko oraz uwzględnia zależności przestrzenne. Do modelu podstawowego dobrano zmienne objaśniające - produkcja przemysłu chemikaliów (jako udział w wartosci dodanej w przemyśle razem) (Chemicals) oraz usługi transportowe (jako % importu usług komercyjnych) W modelu podstawowym KMNK stwierdzono spełnienie założeń KMNK dot. homoskedastyczności, normalności rozkładu.

Reszty modelu klasycznego poddano weryfikacji ex-ante. Wykazano występowanie zależności przestrzennych w resztach modelu (test Morana I) oraz autoregresji przestrzennej (tets Lagrang’a) w resztach modelu KMNK. Na tej podstawie wstępnie wybrano model SAR, a następnie oszacowano go.

Weryfikacja ex-post modelu opóźnień przestrzennych potwierdziła, zasadność wyboru tego modelu jako lepszy i przyjęcię go, jednocześnie odrzucając model KMNK. Następnie porównanano model SAR z wybranymi modelami regresji przetsrzennej opierając się o kryteria informacyjne (AIC, Schwarz, BIC, RHO, LM, WALD). W rezultacjie potwierdzono, że model SAR jest najlepeij wyspecyfikowanym, tym samym należy go ostatecznie wybrać.

Należy dodatkowo wspomnieć,że oszacowny model SAR charakteryzował sie słabym dopasowaniem- niski współczynnik determinacji oraz jedna zmienna wykazała brak istotności (na poziomie 0,05; ale jest istotna na poziomie 0,1), co sugeruję, że model należało by poddać daleszej weryfikacji oraz ewentualnej zmiany doboru zmiennych objaśniających.

źródła: https://databank.worldbank.org/source/health-nutrition-and-population-statistics#

Modelowanie emisji CO2 per capita w krajach Europy i Azji Centralnej w 2018 roku

Agata Wiącek, Cezary Sawczuk, Karolina Wajc, Julia Bogusz

2024-06-09

Opis projektu

Opis i wizualizacja danych

Wizualizacja badanego zjawiska i opis zmiennych

Emisja CO2 per capita

Usługi Transportowe

Produkcja Chemikaliów

Zależności przestrzenne

Testowanie zależności przestrzennej względem zmiennej emisje CO2

Model KMNK bez interakcji przestrzennych

Interpretacja ocenny parametrów

Weyrfikacja modelu podstawowego

Testowanie zależności przestrzennej w resztach modelu KMNK (weryfikacja ex-ante)

Model SAR

Ocena parametrów i istotność zmiennych

Pseudo R-kwadrat

Efekty bezpośrednie, pośrednie i całkowite

Weryfikacja modelu SAR ex-post

Wnioski

Porównanie modeli

Oszacowane modele zależności przestrzennych - Raporty dodatkowe

SEM - spatial error model

SARMA

Spatial Durbin Model

Porównanie modeli

PODSUMOWNAIE