1. Uruchom Pol_NUTS3 w programie GeoDa (należy pamiętać, aby uruchamiać ten zestaw plików poprzez plik z rozszerzeniem .shp)
  2. Korzystając z GeoDa wyznacz następujące macierze wag: − macierz sąsiedztwa królowej I rzędu − macierz sąsiedztwa królowej II rzędu − macierz odległości euklidesowej
library(sp)
## Warning: pakiet 'sp' został zbudowany w wersji R 4.1.3
library(lmtest)
## Warning: pakiet 'lmtest' został zbudowany w wersji R 4.1.3
## Ładowanie wymaganego pakietu: zoo
## Warning: pakiet 'zoo' został zbudowany w wersji R 4.1.3
## 
## Dołączanie pakietu: 'zoo'
## Następujące obiekty zostały zakryte z 'package:base':
## 
##     as.Date, as.Date.numeric
library(spdep)
## Warning: pakiet 'spdep' został zbudowany w wersji R 4.1.3
## Ładowanie wymaganego pakietu: spData
## To access larger datasets in this package, install the spDataLarge
## package with: `install.packages('spDataLarge',
## repos='https://nowosad.github.io/drat/', type='source')`
## Ładowanie wymaganego pakietu: sf
## Warning: pakiet 'sf' został zbudowany w wersji R 4.1.3
## Linking to GEOS 3.10.2, GDAL 3.4.1, PROJ 7.2.1; sf_use_s2() is TRUE
library(sf)
library(tseries)
## Warning: pakiet 'tseries' został zbudowany w wersji R 4.1.3
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
library(tmaptools)
## Warning: pakiet 'tmaptools' został zbudowany w wersji R 4.1.3
library(lmtest)
library(whitestrap)
## Warning: pakiet 'whitestrap' został zbudowany w wersji R 4.1.3
## 
## Please cite as:
## Lopez, J. (2020), White's test and Bootstrapped White's test under the methodology of Jeong, J., Lee, K. (1999) package version 0.0.1
library(spatialreg)
## Warning: pakiet 'spatialreg' został zbudowany w wersji R 4.1.3
## Ładowanie wymaganego pakietu: Matrix
## Warning: pakiet 'Matrix' został zbudowany w wersji R 4.1.3
## 
## Dołączanie pakietu: 'spatialreg'
## Następujące obiekty zostały zakryte z 'package:spdep':
## 
##     get.ClusterOption, get.coresOption, get.mcOption,
##     get.VerboseOption, get.ZeroPolicyOption, set.ClusterOption,
##     set.coresOption, set.mcOption, set.VerboseOption,
##     set.ZeroPolicyOption

Dostep

data<- st_read("C:/Studia/Magisterka/II sem/Ekonometria przestrzenna/Labki/3 Lab/Pol_NUTS3/Pol_NUTS3.shp")
## Reading layer `Pol_NUTS3' from data source 
##   `C:\Studia\Magisterka\II sem\Ekonometria przestrzenna\Labki\3 Lab\Pol_NUTS3\Pol_NUTS3.shp' 
##   using driver `ESRI Shapefile'
## Simple feature collection with 66 features and 9 fields
## Geometry type: POLYGON
## Dimension:     XY
## Bounding box:  xmin: 1571260 ymin: 6268257 xmax: 2685070 ymax: 7321686
## CRS:           NA

Sąsiedzctwo I rzedu

q1 <- poly2nb(data, queen = TRUE)
Wq1 <- nb2listw(q1)

W tym przypadku nie stosujemy klasycznych testów

Jarque Bera Test

data: res X-squared = 2.2306, df = 2, p-value = 0.3278

Shapiro-Wilk normality test

data: res W = 0.97648, p-value = 0.2425 nie mamy niskiej wartości p-value aby odrzucić hippotezy serowej o normalnosci rozkladu

test White’a na heteroskedastycznosc: wniosek: pvalue > 0.05 czyli nie ma podstaw do odrzucenia hipotezy zerowej mamy homoskedastycznosc skladnika losowego

Breusch-Pagan test data: modelOLS BP = 0.11086, df = 1, p-value = 0.7392

White’s test results

Null hypothesis: Homoskedasticity of the residuals Alternative hypothesis: Heteroskedasticity of the residuals Test Statistic: 3.35 P-value: 0.187603

Dla modeli przestrzennych

modelOLS = lm(B_LPR_00~RPKBPC_00, data=data)
summary(modelOLS)
## 
## Call:
## lm(formula = B_LPR_00 ~ RPKBPC_00, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.2423 -2.4765 -0.4948  2.5557  8.3036 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 19.43008    1.11248  17.466  < 2e-16 ***
## RPKBPC_00   -0.39889    0.05734  -6.956 2.22e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.353 on 64 degrees of freedom
## Multiple R-squared:  0.4305, Adjusted R-squared:  0.4216 
## F-statistic: 48.39 on 1 and 64 DF,  p-value: 2.222e-09
res = residuals(modelOLS)
#
bptest(modelOLS, studentize=FALSE)
## 
##  Breusch-Pagan test
## 
## data:  modelOLS
## BP = 0.11086, df = 1, p-value = 0.7392
white_test(modelOLS)
## White's test results
## 
## Null hypothesis: Homoskedasticity of the residuals
## Alternative hypothesis: Heteroskedasticity of the residuals
## Test Statistic: 3.35
## P-value: 0.187603
#
jarque.bera.test(res)
## 
##  Jarque Bera Test
## 
## data:  res
## X-squared = 2.2306, df = 2, p-value = 0.3278
shapiro.test(res)
## 
##  Shapiro-Wilk normality test
## 
## data:  res
## W = 0.97648, p-value = 0.2425

Im większy kąt nachylenia tym jest większe prawdopodobienstwo, ze bedziemy obserwoawać zale znosci przestrzenn.

Głowny yest: ho brak zaleznosci, h1: istnieje, p-value = 0.0006477 wiec odrzucamy h0.

TEST 1 I 2 Testy mnożnika Lagrange pozwalaja wybrac jaka bedzie forma zaleznosci przestrzennej. Najpierw patrzymy na 2: model SEM, autokorelacja przyestrzenna, wiec tu dodatkowo zakladamy ze cos zostanie w sklasniku losowy. Lmerr (SEM), RMlag (model SAR autoregresja przestrzenna). Zastanawiamy się nad wartościami p, które wskazuja nam nad odrzuceniem HO.

Lagrange multiplier diagnostics for spatial dependence

data:
model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data) weights: Wq1

LMerr = 8.4154, df = 1, p-value = 0.003721 HO: MNK : Moran sie pomylil H1: Model SEM, test ten sprawdza czy na pewnon tego testu chcemy użyc, przyjmujemy J1

Lagrange multiplier diagnostics for spatial
dependence

data:
model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data) weights: Wq1

LMlag = 11.316, df = 1, p-value = 0.0007686 SAR - autoregresja H0: MNK H1: Model SAR, przyjmujemy H1 Wybieramy model, którego p-value jest istotne i najmniejsze czyli sugestia na model SAR.

TEST 3 I 4 W tym pierwszym przyjmujemy HO, ale w drugim ?? zalezy jaki poziom sobie przyjmiemy, ale tu odrzucamy HO na korzysc alternatywnej, one nie jest taka do konca, ze mozemy powiedziec, ze nie ma podstaw do jej odrzucenia. W teście MORANA odrzucamy H0 i po wynikach kolejnych 2 testów odrzucamy hipoteze o brak zaleznosci przestrzennych. Testami 3 i 4 konczymy droge dla modelu SEM i wskazujemy raczej na model SAR.

Lagrange multiplier diagnostics for spatial dependence

data:
model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data) weights: Wq1

RLMerr = 0.11154, df = 1, p-value = 0.7384 Model SEM

Lagrange multiplier diagnostics for spatial
dependence

data:
model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data) weights: Wq1

RLMlag = 3.0117, df = 1, p-value = 0.08266 Model SAR

TEST 5: DLA MODELU SARMA, model z zaleznoscia w skladniku losowym Lagrange multiplier diagnostics for spatial dependence

data:
model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data) weights: Wq1

SARMA = 11.427, df = 2, p-value = 0.003301

lm.morantest(modelOLS, listw=Wq1)
## 
##  Global Moran I for regression residuals
## 
## data:  
## model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data)
## weights: Wq1
## 
## Moran I statistic standard deviate = 3.217, p-value = 0.0006477
## alternative hypothesis: greater
## sample estimates:
## Observed Moran I      Expectation         Variance 
##      0.253698340     -0.017404545      0.007101845
moran.plot(res, listw=Wq1)

lm.LMtests(modelOLS, listw=Wq1, test="all")
## 
##  Lagrange multiplier diagnostics for spatial dependence
## 
## data:  
## model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data)
## weights: Wq1
## 
## LMerr = 8.4154, df = 1, p-value = 0.003721
## 
## 
##  Lagrange multiplier diagnostics for spatial dependence
## 
## data:  
## model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data)
## weights: Wq1
## 
## LMlag = 11.316, df = 1, p-value = 0.0007686
## 
## 
##  Lagrange multiplier diagnostics for spatial dependence
## 
## data:  
## model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data)
## weights: Wq1
## 
## RLMerr = 0.11154, df = 1, p-value = 0.7384
## 
## 
##  Lagrange multiplier diagnostics for spatial dependence
## 
## data:  
## model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data)
## weights: Wq1
## 
## RLMlag = 3.0117, df = 1, p-value = 0.08266
## 
## 
##  Lagrange multiplier diagnostics for spatial dependence
## 
## data:  
## model: lm(formula = B_LPR_00 ~ RPKBPC_00, data = data)
## weights: Wq1
## 
## SARMA = 11.427, df = 2, p-value = 0.003301

Paramert RO= O.48, Bład tej oceny to 0,12. P value wskazuje na istotnosc, RO jest statystycznie istotne. Jak mamy juz model z interakcjiami przestrzennymi

modelSAR = lagsarlm(B_LPR_00~RPKBPC_00, data=data, listw=Wq1)
summary(modelSAR)
## 
## Call:lagsarlm(formula = B_LPR_00 ~ RPKBPC_00, data = data, listw = Wq1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.8254 -1.9217 -0.1728  2.0106  8.1189 
## 
## Type: lag 
## Coefficients: (asymptotic standard errors) 
##              Estimate Std. Error z value  Pr(>|z|)
## (Intercept) 11.722571   1.950264  6.0108 1.847e-09
## RPKBPC_00   -0.312130   0.051088 -6.1096 9.986e-10
## 
## Rho: 0.48225, LR test value: 11.585, p-value: 0.00066495
## Asymptotic standard error: 0.11989
##     z-value: 4.0223, p-value: 5.7628e-05
## Wald statistic: 16.179, p-value: 5.7628e-05
## 
## Log likelihood: -166.6924 for lag model
## ML residual variance (sigma squared): 8.6235, (sigma: 2.9366)
## Number of observations: 66 
## Number of parameters estimated: 4 
## AIC: 341.38, (AIC for lm: 350.97)
## LM test for residual autocorrelation
## test value: 0.024028, p-value: 0.87681
modelSEM = errorsarlm(B_LPR_00~RPKBPC_00, data=data, listw=Wq1)
summary(modelSEM)
## 
## Call:errorsarlm(formula = B_LPR_00 ~ RPKBPC_00, data = data, listw = Wq1)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -6.062066 -1.885479 -0.058706  2.042104  8.461589 
## 
## Type: error 
## Coefficients: (asymptotic standard errors) 
##              Estimate Std. Error z value  Pr(>|z|)
## (Intercept) 17.888660   1.251681 14.2917 < 2.2e-16
## RPKBPC_00   -0.313383   0.053319 -5.8775 4.165e-09
## 
## Lambda: 0.47318, LR test value: 8.7615, p-value: 0.0030766
## Asymptotic standard error: 0.13186
##     z-value: 3.5884, p-value: 0.00033271
## Wald statistic: 12.877, p-value: 0.00033271
## 
## Log likelihood: -168.104 for error model
## ML residual variance (sigma squared): 9.0224, (sigma: 3.0037)
## Number of observations: 66 
## Number of parameters estimated: 4 
## AIC: 344.21, (AIC for lm: 350.97)

Parametry sa porownywalne i mniejsze niz model klasycawstzny, czesc tego zostala

cbind(OLS=c(NA, modelOLS$coef), SAR=coef(modelSAR), SEM=coef(modelSEM))
##                    OLS        SAR        SEM
##                     NA  0.4822509  0.4731832
## (Intercept) 19.4300820 11.7225708 17.8886597
## RPKBPC_00   -0.3988877 -0.3121304 -0.3133832