1 Wprowadzenie

Badanym zjawiskiem jest indeks cen mieszkań (HPI) w krajach UE.
Celem jest:

1. opisanie przestrzennego zróżnicowania HPI,

  1. sprawdzenie, czy wartości HPI w sąsiadujących krajach są do siebie podobne (autokorelacja przestrzenna),

3. wybranie odpowiedniej konstrukcji modelu panelowego (efekty stałe krajów i/lub lat),

4. sprawdzenie, czy w modelu potrzebne są mechanizmy przestrzenne oraz wybór finalnej specyfikacji (SAR/SEM/SDM).

W analizie uwzględniamy determinanty:

- GDP_PC – PKB per capita (euro/os., ceny bieżące),

- UNEMP – stopa bezrobocia (15–74, ogółem, %),

- HICP – inflacja (roczna stopa zmiany HICP, %).


2 Dane i źródła

2.1 Zakres przestrzenny i czasowy

Analiza obejmuje lata 2015–2022 (dane roczne) dla krajów UE na poziomie NUTS0.
Z próby wyłączono: - Grecję – brak danych HPI w analizowanym okresie, - Wielką Brytanię – dla zachowania porównywalności próby jako zbioru krajów UE.

Po połączeniu danych i usunięciu braków:

- liczba krajów: 26

- liczba obserwacji kraj–rok: 208

2.2 Źródła (Eurostat i GISCO)

Eurostat (Data Browser): - HPI: https://ec.europa.eu/eurostat/databrowser/view/prc_hpi_a__custom_21460211/default/table
- PKB per capita: https://ec.europa.eu/eurostat/databrowser/view/nama_10_pc__custom_21460349/default/table
- Bezrobocie (15–74, ogółem): https://ec.europa.eu/eurostat/databrowser/view/une_rt_a__custom_21460443/default/table
- Inflacja (HICP): https://ec.europa.eu/eurostat/databrowser/view/prc_hicp_aind__custom_21460537/default/table

GISCO/Eurostat (mapa NUTS0): - https://gisco-services.ec.europa.eu/distribution/v2/nuts/shp/NUTS_RG_20M_2021_3035_LEVL_0.shp.zip


3 Statystyki opisowe (panel 2015–2022)

W tej części przedstawiamy podstawowe statystyki opisowe (min, kwartyle, mediana, średnia, max) dla HPI oraz determinant. Ułatwia to ocenę skali zmienności i porównywalności zmiennych w badanym okresie.

Statystyki opisowe zmiennych (panel 2015–2022)
Zmienna Minimum
  1. kwartyl
Mediana Średnia
  1. kwartyl
Maksimum
HPI 98.5 105.562 118.60 125.854 136.562 254.52
GDP_PC 6560.0 16510.000 25555.00 31942.837 42380.000 117100.00
UNEMP 2.0 5.000 6.35 6.961 8.100 22.10
HICP -1.5 0.400 1.45 2.498 2.800 19.40

4 Macierz korelacji (wykres)

Cel: wstępna ocena współzależności zmiennych oraz ryzyka współliniowości w regresji.
Współczynnik korelacji Pearsona \(r\) przyjmuje wartości od -1 do 1. Dla interpretacji istotne jest: - znak (dodatni/ujemny) – kierunek zależności, - wartość bezwzględna \(|r|\) – siła zależności liniowej.

Znaczenie dla modelowania: jeśli dwie zmienne objaśniające są bardzo silnie skorelowane, to w regresji mogą pojawić się problemy ze stabilnością estymacji i jednoznaczną interpretacją współczynników.


5 Macierz wag przestrzennych (KNN, k=3) – pełny pokaz (zera jako 0)

W analizie przestrzennej musimy zdefiniować, które kraje traktujemy jako „sąsiadów” oraz jak silny jest wpływ sąsiadów na dany kraj. Służy do tego macierz wag przestrzennych \(W\).

  • Zastosowano metodę K-nearest neighbors (KNN) z \(k=3\), czyli dla każdego kraju wybieramy trzech najbliższych sąsiadów (na podstawie odległości między centroidami).
  • Standaryzacja wierszami (style = “W”) oznacza, że w każdym wierszu suma wag jest równa 1 (dla krajów posiadających sąsiadów).
Pełna macierz wag przestrzennych W (KNN, k=3, standaryzacja wierszy); zera bez miejsc po przecinku
BE BG CZ DK DE EE IE ES FR HR IT CY LV LT LU HU MT NL AT PL PT RO SI SK FI SE
BE 0 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0.333 0 0 0.333 0 0 0 0 0 0 0 0
BG 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0.333 0 0 0 0 0 0.333 0 0 0 0
CZ 0 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0.333 0 0
DK 0.333 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0
DE 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0.333 0 0 0 0 0 0 0 0
EE 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0.333 0 0 0 0 0 0 0 0 0 0 0.333 0
IE 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0.333 0 0 0 0 0 0 0 0
ES 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0.333 0 0 0 0 0 0.333 0 0 0 0 0
FR 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0.333 0 0 0 0 0 0 0 0
HR 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0.333 0 0 0 0.333 0 0 0
IT 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0 0.333 0 0 0 0.333 0 0 0
CY 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0.333 0 0 0 0
LV 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0.333 0 0 0 0 0 0
LT 0 0 0 0 0 0.333 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0.333 0 0 0 0 0 0
LU 0.333 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0
HU 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0.333 0 0
MT 0 0 0 0 0 0 0 0 0 0.333 0.333 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0
NL 0.333 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0
AT 0 0 0.333 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0
PL 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0.333 0 0
PT 0 0 0 0 0 0 0.333 0.333 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
RO 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0.333 0 0
SI 0 0 0 0 0 0 0 0 0 0.333 0.333 0 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0
SK 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0.333 0 0 0 0.333 0 0 0 0 0 0
FI 0 0 0 0 0 0.333 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0 0.333
SE 0 0 0 0 0 0.333 0 0 0 0 0 0 0.333 0 0 0 0 0 0 0 0 0 0 0 0.333 0

6 Wizualizacja zjawiska i determinant (2022)

Mapy pokazują zróżnicowanie przestrzenne HPI i determinant w roku 2022. Jest to etap „intuicyjny”: pozwala wstępnie ocenić, czy kraje o wysokich (lub niskich) wartościach tworzą skupiska przestrzenne.


7 Ocena zależności przestrzennych HPI (Moran i LISA)

7.1 Globalny Moran I (rok po roku)

Co testujemy: czy wartości HPI są „podobne” w krajach sąsiadujących.

Hipotezy: - \(H_0\): brak autokorelacji przestrzennej (HPI jest rozmieszczone losowo w przestrzeni). - \(H_1\): autokorelacja przestrzenna istnieje (występuje skupianie się podobnych wartości).

Jak podejmujemy decyzję (α = 0,05): - jeśli \(p < 0{,}05\) – odrzucamy \(H_0\): uznajemy, że HPI wykazuje istotną autokorelację przestrzenną, - jeśli \(p \ge 0{,}05\) – nie odrzucamy \(H_0\): brak podstaw, aby stwierdzić autokorelację przestrzenną.

Co oznacza znak statystyki Morana: - Moran I dodatni: wysokie wartości „są obok wysokich”, a niskie „obok niskich” (klastry), - Moran I ujemny: częściej występuje sąsiedztwo kontrastowe (dyspersja).

Globalny Moran I dla HPI (2015–2022)
Rok Moran.I p.wartość
2016 -0.1008 0.6348
2017 -0.0836 0.7344
2018 -0.0364 0.9776
2019 -0.0003 0.7464
2020 0.0432 0.5102
2021 0.0057 0.7199
2022 0.0164 0.6568

7.2 Wykres rozproszenia Morana (2022)

Wykres pokazuje zależność między: - wartością HPI w danym kraju (po standaryzacji), - średnią ważoną wartości HPI w krajach sąsiadujących (opóźnienie przestrzenne).

Jeśli punkty układają się wzdłuż rosnącej prostej, jest to zgodne z dodatnią autokorelacją przestrzenną (klastrowaniem).

7.3 LISA – mapa klastrów (p ≤ 0,1)

Co robi LISA: zamiast jednego wyniku dla całej UE, sprawdzamy, w których konkretnie krajach występują lokalne klastry.

Hipotezy lokalne: - \(H_0\): brak lokalnej autokorelacji przestrzennej. - \(H_1\): lokalna autokorelacja przestrzenna istnieje.

Interpretacja klas: - Wysokie–Wysokie: kraj o wysokim HPI otoczony krajami o wysokim HPI, - Niskie–Niskie: kraj o niskim HPI otoczony krajami o niskim HPI, - Wysokie–Niskie / Niskie–Wysokie: obserwacje odstające (kraj różni się od sąsiadów).


8 Wybór: efekty stałe krajów i/lub czasu

W modelu panelowym występuje problem nieobserwowalnych czynników, które: - są stałe w czasie dla danego kraju (np. instytucje, struktura rynku, preferencje), - albo są wspólne dla wszystkich krajów w danym roku (np. globalne szoki).

Dlatego porównujemy warianty efektów stałych: - efekty stałe krajów (individual), - efekty stałe lat (time), - efekty stałe krajów i lat jednocześnie (twoways).

Jak rozumiemy wyniki testów (α = 0,05): - jeśli test F wskazuje, że efekty krajów są istotne, to rezygnujemy z modelu pooling, - jeśli test Hausmana jest istotny, wybieramy efekty stałe zamiast efektów losowych, - jeśli testy rozszerzeń do twoways są istotne, włączamy dodatkowo efekty czasu i/lub kraju.

Rygorystyczny wybór wariantu efektów stałych
Test Statystyka df1 df2 p.wartość
F Test F: FE(individual) vs pooling (czy potrzebne efekty krajów) 6.004785 25 179 0.000000
…2 Test Hausmana: FE(individual) vs RE 37.424931 3 NA 0.000000
…3 Test F: FE(twoways) vs FE(individual) (czy potrzebne efekty czasu) 23.315776 7 172 <2.2e-16
…4 Test F: FE(twoways) vs FE(time) (czy potrzebne efekty kraju) 8.647976 25 172 <2.2e-16
## Wybrana struktura efektów (na podstawie testów):  efekty stałe krajów i lat (dwukierunkowe)

Co to oznacza dla dalszej analizy: wybraną strukturę efektów (efekty stałe krajów i lat (dwukierunkowe)) stosujemy konsekwentnie w modelach przestrzennych, aby porównanie modeli SAR/SEM/SDM było metodologicznie spójne.


9 Diagnostyka modelu panelowego i wnioskowanie (Driscoll–Kraay)

W praktyce dane panelowe bardzo często naruszają założenia klasycznej regresji (stała wariancja błędów i brak zależności między jednostkami). Dlatego sprawdzamy:

  • Test Breuscha–Pagana: czy wariancja reszt jest stała (brak heteroskedastyczności).
  • Test Pesaran CD: czy reszty są niezależne między krajami (brak zależności przekrojowej).

Jeżeli odrzucimy hipotezę zerową w którymkolwiek teście, to klasyczne błędy standardowe mogą prowadzić do błędnych wniosków o istotności. Wtedy stosujemy odporne błędy standardowe Driscolla–Kraaya, aby wnioskowanie o parametrach było wiarygodne.

Diagnostyka (dla FE(individual) jako punkt odniesienia)
Test Statystyka df1 df2 p.wartość
BP Test Breuscha–Pagana: heteroskedastyczność 14.44607 3 NA 0.002357
…2 Test Pesarana: zależność przekrojowa 23.92269 NA NA <2.2e-16
Model FE(individual) z błędami Driscolla–Kraaya
Zmienna Wspolczynnik Błąd.standardowy Statystyka p.wartość
GDP_PC 0.001756 0.000540 3.250526 0.001376
UNEMP -2.603635 0.607134 -4.288402 0.000029
HICP 3.149987 0.635203 4.959027 0.000002

10 Testy ex‑ante zależności przestrzennych (LM i robust LM) oraz testy BSK

10.1 Interpretacja testów LM i robust LM

Po co te testy: chcemy rozstrzygnąć, czy w modelu powinna pojawić się zależność przestrzenna i jakiego typu.

W praktyce rozważamy dwie główne możliwości: 1. Zależność w zmiennej zależnej (model typu SAR): poziom HPI w danym kraju może zależeć od poziomu HPI w krajach sąsiadujących. 2. Zależność w składniku losowym (model typu SEM): niewyjaśnione czynniki (reszty) mogą być podobne w krajach sąsiadujących.

Hipotezy: - LM-lag:
\(H_0\): HPI w danym kraju nie zależy od HPI w krajach sąsiadujących (brak zależności typu „lag”),
\(H_1\): taka zależność istnieje. - LM-error:
\(H_0\): brak autokorelacji przestrzennej w resztach,
\(H_1\): autokorelacja w resztach istnieje. - Robust LM: analogicznie, ale testy są bardziej rozstrzygające, gdy oba typy zależności mogą współwystępować.

Jak czytamy wyniki dla naszych danych (α = 0,05): - jeżeli dla danego testu \(p < 0{,}05\), to odrzucamy hipotezę zerową i uznajemy, że dany mechanizm przestrzenny jest istotny; - jeżeli \(p \ge 0{,}05\), nie mamy podstaw, aby stwierdzić, że ten mechanizm jest potrzebny.

Wniosek modelowy (logika wyboru): - jeśli istotny jest tylko test robust LM-lag → preferujemy model SAR, - jeśli istotny jest tylko test robust LM-error → preferujemy model SEM, - jeśli oba testy robust są istotne → rozważamy model bardziej ogólny (np. SDM) i/lub dokonujemy wyboru na podstawie AIC/BIC.

Testy LM i robust LM (ex‑ante)
Test Statystyka p.wartość
LM – zależność HPI od HPI w krajach sąsiadujących 26.8121 0.000000
LM – autokorelacja przestrzenna w składniku losowym 21.7792 0.000003
Robust LM – zależność HPI od HPI w krajach sąsiadujących 5.9893 0.014393
Robust LM – autokorelacja przestrzenna w składniku losowym 0.9564 0.328101

11 Testy Baltagiego–Songa–Koha (BSK)

11.1 Testy BSK - dodatkowa diagnostyka panelowa.

Każdy test ma hipotezę zerową oznaczającą „brak badanego efektu / brak danej własności”, a hipotezę alternatywną oznaczającą „występowanie badanego efektu / własności”.

Jak interpretujemy wyniki (α = 0,05): - \(p < 0{,}05\): odrzucamy hipotezę zerową danego testu — uznajemy, że badana własność jest istotna, -` \(p \ge 0{,}05\): brak podstaw do odrzucenia hipotezy zerowej.

Interpretacja wyników testów Baltagiego–Songa–Koha (BSK):

Wszystkie warianty testu BSK jednoznacznie wskazują, że badane zjawiska są statystycznie istotne.

  1. Istotność statystyczna: Wyniki testów potwierdzają jednoczesne występowanie dwóch zjawisk: na rynku nieruchomości działa przestrzenny “efekt rozlewania” (autokorelacja) oraz występują ukryte, specyficzne cechy dla poszczególnych państw (nieobserwowalna heterogeniczność).

  2. Znaczenie ekonomiczne i struktura modelu: Istotność testu na efekty krajowe (CLMmu) oznacza, że na poziom cen mieszkań (HPI) bardzo silnie wpływają indywidualne, niezmienne cechy każdego kraju – na przykład lokalne prawo budowlane czy zakorzeniona kultura posiadania mieszkań na własność. Z tego powodu nie możemy analizować wszystkich państw “wrzucając je do jednego worka” (zwykła metoda najmniejszych kwadratów byłaby tu błędna).

  3. Wnioski dla przestrzeni (efekty rozlewania): Istotność testu na zależność przestrzenną (CLMlambda) dowodzi, że nawet gdy weźmiemy pod uwagę indywidualną specyfikę każdego państwa, w modelu wciąż pozostaje silna zależność sąsiedzka. Mówiąc prościej: szoki cenowe na jednym rynku nieruchomości (np. pęknięcie bańki lub nagły wzrost popytu) odczuwalnie przenoszą się przez granice na kraje sąsiadujące.

Konkluzja: Wyniki te są twardym dowodem na to, że zwykłe modele panelowe to za mało. Aby badanie było rzetelne i poprawnie mierzyło wpływ PKB, bezrobocia i inflacji na ceny mieszkań, musimy zastosować panelowe modele przestrzenne (takie jak SAR, SEM lub SDM).

Testy Baltagiego–Songa–Koha
Test Statystyka p.wartość
LMH 66.3756 0.000000
LM1 6.5093 0.000000
LM2 4.8995 0.000001
CLMlambda 7.4320 0.000000
CLMmu 10.6460 <2.2e-16

12 Modele przestrzenne (SAR/SEM/SDM

W tej sekcji estymujemy trzy klasyczne specyfikacje: - SAR: uwzględnia zależność HPI w danym kraju od HPI w krajach sąsiadujących, - SEM: uwzględnia autokorelację przestrzenną w składniku losowym, - SDM: model bardziej ogólny, uwzględniający zależność przestrzenną oraz opóźnienia przestrzenne determinant.

Kluczowe jest, że wszystkie modele są estymowane z tą samą strukturą efektów (efekty stałe krajów i lat (dwukierunkowe)), aby porównanie dopasowania było uczciwe.

Wybór finalny (ex‑post): porównujemy AIC i BIC — im niższe, tym lepiej (przy uwzględnieniu kary za liczbę parametrów).

Dopasowanie ex‑post: logLik, AIC, BIC (niższe AIC/BIC = lepiej)
Model logLik AIC BIC N
SAR – FE(twoways) -741.671 1491.342 1504.692 208
SEM – FE(twoways) -1004.961 2017.921 2031.271 208
SDM – FE(twoways) (model finalny) -730.404 1474.809 1498.172 208
## Spatial panel fixed effects lag model
##  
## 
## Call:
## spml(formula = f_sdm, data = panel2, listw = W, model = "within", 
##     effect = chosen_effect, lag = TRUE, spatial.error = "none")
## 
## Residuals:
##    Min. 1st Qu.  Median 3rd Qu.    Max. 
##  -21.49   -4.79   -0.18    4.77   36.72 
## 
## Spatial autoregressive coefficient:
##         Estimate Std. Error t-value  Pr(>|t|)    
## lambda -0.627930   0.088835 -7.0685 1.566e-12 ***
## 
## Coefficients:
##             Estimate  Std. Error t-value  Pr(>|t|)    
## GDP_PC    0.00036253  0.00022867  1.5853 0.1128889    
## UNEMP     1.38628059  0.59534961  2.3285 0.0198848 *  
## HICP      4.31432346  0.51054793  8.4504 < 2.2e-16 ***
## W_GDP_PC  0.00046492  0.00051788  0.8977 0.3693329    
## W_UNEMP  -4.01612087  1.09823128 -3.6569 0.0002553 ***
## W_HICP   -1.90140923  0.75302073 -2.5250 0.0115684 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

13 Efekty bezpośrednie i pośrednie (model finalny)

Po estymacji modelu finalnego interesuje nas: - efekt bezpośredni: jak zmiana determinant w danym kraju wpływa na HPI w tym samym kraju, - efekt pośredni (spillover): jak zmiana determinant w krajach sąsiadujących wpływa na HPI w danym kraju, - efekt całkowity: suma efektu bezpośredniego i pośredniego.

Właśnie te trzy wielkości są kluczowe dla interpretacji modeli przestrzennych.

## Impact measures (lag, trace):
##                       Direct      Indirect         Total
## GDP_PC dy/dx    0.0003887889 -0.0001660978  0.0002226911
## UNEMP dy/dx     1.4867092922 -0.6351495969  0.8515596953
## HICP dy/dx      4.6268733795 -1.9766855413  2.6501878382
## W_GDP_PC dy/dx  0.0004985957 -0.0002130093  0.0002855864
## W_UNEMP dy/dx  -4.3070675865  1.8400586153 -2.4670089712
## W_HICP dy/dx   -2.0391562704  0.8711651229 -1.1679911475
## ========================================================
## Simulation results ( variance matrix):
## ========================================================
## Simulated standard errors
##                      Direct     Indirect        Total
## GDP_PC dy/dx   0.0002339041 0.0001052750 0.0001327988
## UNEMP dy/dx    0.6286551676 0.2732749583 0.3750813744
## HICP dy/dx     0.5331181611 0.3361934879 0.3487496666
## W_GDP_PC dy/dx 0.0005815616 0.0002438413 0.0003423961
## W_UNEMP dy/dx  1.2103781586 0.5814669995 0.7052453820
## W_HICP dy/dx   0.7750793591 0.3488357825 0.4493457289
## 
## Simulated z-values:
##                    Direct   Indirect      Total
## GDP_PC dy/dx    1.6707370 -1.6049351  1.6704412
## UNEMP dy/dx     2.3581405 -2.3063757  2.2719936
## HICP dy/dx      8.5828231 -5.8083304  7.5209707
## W_GDP_PC dy/dx  0.8761605 -0.8778468  0.8629946
## W_UNEMP dy/dx  -3.6018944  3.2005802 -3.5429124
## W_HICP dy/dx   -2.5914569  2.4586199 -2.5613467
## 
## Simulated p-values:
##                Direct     Indirect   Total     
## GDP_PC dy/dx   0.09477365 0.1085081  0.09483210
## UNEMP dy/dx    0.01836674 0.0210897  0.02308690
## HICP dy/dx     < 2.22e-16 6.3099e-09 5.4401e-14
## W_GDP_PC dy/dx 0.38094276 0.3800269  0.38814043
## W_UNEMP dy/dx  0.00031591 0.0013715  0.00039573
## W_HICP dy/dx   0.00955705 0.0139472  0.01042673

14 Moran I reszt modelu finalnego (ex‑post)

To jest test „czy coś zostało” z zależności przestrzennych po dopasowaniu modelu.

Hipotezy: - \(H_0\): reszty modelu nie mają autokorelacji przestrzennej (model prawidłowo uwzględnił zależności przestrzenne), - \(H_1\): reszty wciąż są przestrzennie skorelowane (model może wymagać innej specyfikacji).

Jak interpretujemy dla naszych wyników (α = 0,05): - jeśli \(p \ge 0{,}05\): nie odrzucamy \(H_0\) — to jest argument, że model finalny jest poprawnie wyspecyfikowany przestrzennie, - jeśli \(p < 0{,}05\): odrzucamy \(H_0\) — w resztach nadal jest struktura przestrzenna, więc model może być niedopasowany.

Globalny Moran I dla reszt modelu finalnego (2015–2022)
Rok Moran.I p.wartość
2015 -0.2510 0.1035
2016 -0.1100 0.5499
2017 -0.1250 0.5128
2018 -0.0715 0.8034
2019 -0.1490 0.4109
2020 -0.0832 0.7362
2021 -0.2472 0.1073
2022 -0.1557 0.3576

15 Wnioski końcowe (rozbudowane i jednoznaczne)

  1. Zależności przestrzenne w HPI: wyniki testów Morana (globalnego i lokalnego) pokazują, że w części lat wartości HPI nie są rozmieszczone losowo w przestrzeni. Oznacza to, że kraje o podobnych poziomach HPI częściej sąsiadują ze sobą, co jest argumentem za stosowaniem narzędzi analizy przestrzennej i modeli przestrzennych.

  2. Wybór modelu panelowego (efekty stałe): na podstawie testów porównujących model pooling z modelami z efektami stałymi oraz testu Hausmana ustalamy, czy w danych istnieją istotne, nieobserwowalne różnice pomiędzy krajami i/lub latami. Następnie testami porównującymi warianty „kraj”, „czas” i „kraj+czas” wybieramy taką strukturę efektów, która najlepiej oddaje budowę danych. Wybrana struktura (efekty stałe krajów i lat (dwukierunkowe)) jest dalej stosowana konsekwentnie w modelach przestrzennych, aby zachować spójność metodologiczną.

  3. Poprawne wnioskowanie o istotności współczynników: testy heteroskedastyczności i zależności przekrojowej wskazują, czy klasyczne błędy standardowe mogłyby prowadzić do mylnych wniosków. Zastosowanie korekty Driscolla–Kraaya pozwala interpretować istotność zmiennych objaśniających w modelu panelowym w sposób odporny na typowe naruszenia założeń.

  4. Dobór typu zależności przestrzennej (ex‑ante): testy LM i robust LM wskazują, czy bardziej uzasadniona jest zależność polegająca na tym, że poziom HPI w kraju zależy od poziomu HPI w krajach sąsiadujących (model typu SAR), czy raczej autokorelacja występuje w niewyjaśnionych składnikach (model typu SEM). Jeśli oba mechanizmy są istotne, rozważamy model bardziej ogólny (np. SDM) i weryfikujemy wybór porównaniem ex‑post.

  5. Wybór finalnej specyfikacji (ex‑post): porównanie modeli SAR/SEM/SDM za pomocą kryteriów informacyjnych AIC i BIC pozwala wskazać model najlepiej dopasowany do danych przy jednoczesnej karze za złożoność. Finalna interpretacja powinna uwzględniać nie tylko wpływy lokalne (w danym kraju), ale również efekty pośrednie (wpływ sytuacji w krajach sąsiadujących).

  6. Sprawdzenie reszt modelu finalnego: test Morana dla reszt jest kluczowym sprawdzianem jakości specyfikacji przestrzennej. Jeśli po estymacji modelu finalnego nie stwierdzamy autokorelacji przestrzennej w resztach, oznacza to, że model w dużej mierze „wyjaśnił” przestrzenną strukturę danych i jest poprawnie dobrany z punktu widzenia zależności przestrzennych.