1. Wprowadzenie i Uzasadnienie Wyboru Zjawiska

Zjawisko badane: Przestrzenne zróżnicowanie PKB per capita we włoskich prowincjach (NUTS-3).

Uzasadnienie: Poziom rozwoju gospodarczego, mierzony za pomocą PKB per capita, wykazuje silne zróżnicowanie przestrzenne. Włochy są klasycznym przykładem dualizmu gospodarczego: bogata, uprzemysłowiona Północ silnie kontrastuje z biedniejszym Południem. Zgodnie z Pierwszym Prawem Geografii Toblera (“wszystko jest powiązane ze wszystkim, ale bliskie obiekty są bardziej powiązane ze sobą niż odległe”), należy oczekiwać, że prowincje geograficznie bliskie będą charakteryzowały się zbliżonym poziomem bogactwa.

Hipoteza badawcza: PKB per capita we włoskich prowincjach wykazuje istotną, dodatnią autokorelację przestrzenną. Oznacza to, że wysoki poziom rozwoju danej prowincji stymuluje wzrost w regionach sąsiednich (i analogicznie dla obszarów uboższych). Ponadto zakłada się, że wpływ determinant takich jak: gęstość zaludnienia, zatrudnienie, kapitał ludzki (wyższe wykształcenie) oraz saldo migracji nie ogranicza się jedynie do rynku lokalnego, lecz generuje efekty rozlewania się (spillover) na ościenne jednostki.

Dane: Dane przekrojowe pobrane z bazy Eurostat dla 107 włoskich prowincji (poziom NUTS-3) za rok 2021 (po usunięciu jednostek z brakami danych).

Źródło: Eurostat, dane regionalne (nama_10r_3gdp, demo_r_d3dens, nama_10r_3empers, edat_lfse_04, demo_r_gind3).

Tło historyczne: Po zjednoczeniu Włoch w 1861 r. uprzemysłowiona Północ zyskała przewagę kosztem rolniczego Południa, co pogłębiło istniejące dysproporcje. Ta historyczna polaryzacja stała się zalążkiem tzw. „kwestii południowej” (questione meridionale), czyli trwałego dualizmu gospodarczego.

Teoria gospodarki dualnej (Lewis, 1954) Model Lewisa zakłada, że rozwój następuje poprzez przepływ nadwyżki siły roboczej z sektora rolniczego (tradycyjnego) do przemysłowego (nowoczesnego). We Włoszech Północ pełniła rolę bieguna przemysłowego, a Południe – rezerwuaru taniej siły roboczej. W praktyce jednak nie doszło do wyrównania poziomów rozwoju, co sugeruje, że działały także mechanizmy przeciwne.

Teoria kumulatywnej przyczynowości (Myrdal, 1957) Myrdal wykazał, że siły rynkowe częściej pogłębiają niż redukują nierówności regionalne. Efekty wsteczne (backwash) – odpływ kapitału i wykwalifikowanych pracowników z peryferii do centrum – dominują nad efektami rozprzestrzeniania (spread). Włoskie Południe od dekad traci talenty i inwestycje na rzecz Północy, co potwierdza tę tezę.

## indexed 0B in  0s, 0B/sindexed 2.15GB in  0s, 2.15GB/s

## indexed 0B in  0s, 0B/sindexed 2.15GB in  0s, 2.15GB/s

## indexed 0B in  0s, 0B/sindexed 2.15GB in  0s, 2.15GB/s

## indexed 0B in  0s, 0B/sindexed 2.15GB in  0s, 2.15GB/s

## indexed 0B in  0s, 0B/sindexed 2.15GB in  0s, 2.15GB/s

1.1 Statystyka Opisowa

Po wczytaniu surowego zbioru (107 włoskich prowincji NUTS-3) z bazy Eurostat, wykonano następujące operacje pre-processingu:

Selekcja zmiennych – wybrano zmienne kluczowe dla analizy przestrzennej PKB per capita: gęstość zaludnienia, zatrudnienie, wyższe wykształcenie oraz saldo migracji.
Filtracja danych – usunięto prowincje z brakującymi wartościami (zastosowano funkcję complete.cases).
Transformacje – w celu wygładzenia rozkładów i ograniczenia heteroskedastyczności obliczono logarytmy naturalne dla zmiennych: PKB per capita, gęstość zaludnienia i zatrudnienie.
Przygotowanie danych przestrzennych – utworzono macierz wag opartą na 4 najbliższych sąsiadach (k-NN) dla centroidów badanych prowincji, co pozwoliło uniknąć problemu “izolacji” wysp (np. Sycylii i Sardynii).

Zakresy zmiennych w analizowanych prowincjach Włoch (2021)
Liczba prowincji	PKB per capita (EUR)	Gęstość zaludnienia (os/km²)	Zatrudnienie (tys. osób)	Wyższe wykształcenie (%)	Saldo migracji (‰)
107	16500 – 61500	38 – 2564	1.1 – 2129	14.8 – 26.1	-21.8 – 7.3

Wnioski: PKB per capita waha się od 16,5 tys. EUR (południe) do 61,5 tys. EUR (północ), co potwierdza głęboki dualizm gospodarczy kraju. Równie duże rozpiętości występują dla gęstości zaludnienia (38–2564 os./km²) i zatrudnienia (1,1–2129 tys. osób). Wyższe wykształcenie osiąga od 14,8% do 26,1%, a saldo migracji netto od –21,8‰ (odpływ) do +7,3‰ (napływ). Wszystkie zmienne wskazują na silne zróżnicowanie przestrzenne, które uzasadnia zastosowanie ekonometrii przestrzennej.

Liczba prowincji zakwalifikowanych do ostatecznej analizy: 4198 Liczba zmiennych (kolumn): 10

1.2 Rozkład PKB per capita we włoskich prowincjach

::: interpretation-box Analiza rozwarstwienia gospodarczego we Włoszech (Top 20 vs Bottom 20):

Wykres słupkowy w sposób dobitny obrazuje skalę historycznego i strukturalnego dualizmu gospodarczego włoskich prowincji w 2021 roku. Zestawienie 20 najbogatszych (kolor zielony) i 20 najbiedniejszych (kolor czerwony) jednostek NUTS-3 ujawnia kilka kluczowych zjawisk:

Przepaść dochodowa (Extreme Disparity): Rozpiętość między biegunami bogactwa i biedy jest drastyczna. Najbogatsza prowincja w zestawieniu generuje PKB per capita przekraczające 60 000 EUR, podczas gdy najbiedniejsza jednostka na dole rankingu osiąga wynik zaledwie w okolicach 15 000 EUR. Oznacza to niemal czterokrotną różnicę w poziomie rozwoju gospodarczego na terytorium jednego państwa.
Dominacja “Stolicy Finansowej” (ITC4C): Prowincja ITC4C (Mediolan) stanowi absolutnego lidera, wyraźnie odstając nawet od reszty najbogatszej “dwudziestki”. Potwierdza to jej status jako głównego huba gospodarczego, skupiającego usługi wyższego rzędu, innowacje oraz siedziby międzynarodowych korporacji. Kolejne bogate prowincje (np. ITH10 - Bolzano) również wykazują bardzo wysokie PKB, co wynika m.in. z ich autonomii finansowej i silnej turystyki.
Pułapka niskiego dochodu (Homogeniczność biedy): Zwraca uwagę kształt “czerwonej” części wykresu. W przeciwieństwie do najbogatszych prowincji, gdzie widoczne są wyraźne różnice między liderami, 20 najbiedniejszych prowincji (zlokalizowanych na Południu – Mezzogiorno i wyspach) tworzy niezwykle spłaszczoną, homogeniczną grupę. Ich PKB per capita oscyluje w wąskim przedziale 15 000 – 20 000 EUR. Brak tam jakiegokolwiek wyraźnego “lidera wzrostu”, co sugeruje strukturalną stagnację całego makroregionu.

Wniosek do modelowania: Najwyższe słupki to terytorialnie zwarty blok Północy, a najniższe to odizolowane Południe. Ta wizualizacja stanowi argument empiryczny uzasadniający konieczność użycia ekonometrii przestrzennej.

Wnioski z macierzy korelacji Pearsona:

Analiza korelacji liniowej ujawnia kilka kluczowych, a zarazem nieoczywistych relacji w gospodarce włoskich prowincji:

PKB a wyższe wykształcenie (r = 0,56): To zdecydowanie najsilniejsza dodatnia zależność w zestawieniu. Udowadnia, że kapitał ludzki i innowacyjność są absolutnym fundamentem wzrostu gospodarczego. Prowincje o wyższym odsetku osób z dyplomem (często z dużymi ośrodkami akademickimi) osiągają zauważalnie wyższe PKB per capita.
PKB a saldo migracji (r = -0,31): Wyraźna korelacja ujemna. Oznacza to, że wyższe saldo migracji netto współwystępuje z niższym PKB per capita. W kontekście Włoch może to odzwierciedlać zjawisko napływu niewykwalifikowanych migrantów zarobkowych do określonych regionów, co w ujęciu statystycznym krótkoterminowo obciąża wskaźnik PKB przeliczany na jednego mieszkańca.
PKB a gęstość zaludnienia (r = 0,29) i zatrudnienie (r = 0,23): Korelacje dodatnie, ale zaskakująco słabe. W klasycznej ekonomii wyższe zatrudnienie powinno silniej stymulować PKB. Ten niski wynik sugeruje, że relacja ta nie ma charakteru prostej, lokalnej linii – wpływ rynków pracy jest znacznie bardziej złożony i wykracza poza granice pojedynczych prowincji.
Zatrudnienie a wykształcenie (r = 0,07): Brak istotnej statystycznie korelacji! To fascynujący dowód na strukturalne niedopasowanie włoskiego rynku pracy (mismatch). Obecność wykształconych kadr w danej prowincji wcale nie gwarantuje tam wysokiego poziomu zatrudnienia, co doskonale wpisuje się w problem drenażu mózgów i dojazdów do pracy w innych regionach.

2. Pobranie Danych Geograficznych i Przygotowanie Danych Przestrzennych

3. Wizualizacja Badanego Zjawiska

Mapa PKB per capita we włoskich prowincjach (2021)

Wnioski z wizualizacji

Obserwacje z mapy PKB per capita we włoskich prowincjach:

Zróżnicowanie geograficzne: PKB per capita wykazuje wyraźny podział przestrzenny – prowincje północne (Lombardia, Emilia-Romania, Wenecja Euganejska, Piemont) osiągają znacznie wyższe wartości niż prowincje południowe (Kampania, Kalabria, Sycylia, Apulia). Jest to klasyczny przykład dualizmu gospodarczego Włoch.
Efekt aglomeracji: Wyższe PKB koncentruje się wokół ośrodków przemysłowych i usługowych (Mediolan, Turyn, Bolonia, Rzym), co potwierdza teorię korzyści aglomeracji i dyfuzji przestrzennej.
Możliwe klastry przestrzenne: Obserwujemy potencjalne grupowanie – północ tworzy „hot spot” (wysokie PKB otoczone wysokim PKB), natomiast południe – „cold spot” (niskie PKB otoczone niskim PKB). Wyspy (Sycylia, Sardynia) odstają od tego wzorca.
Hipoteza autokorelacji: Wizualna analiza sugeruje istnienie dodatniej autokorelacji przestrzennej – sąsiadujące prowincje mają zbliżony poziom PKB per capita.
Rola kapitału ludzkiego i migracji: Prowincje z wyższym odsetkiem osób z wyższym wykształceniem oraz dodatnim saldem migracji (np. Lombardia, Lacjum) osiągają wyższe PKB, co wskazuje na znaczenie tych zmiennych jako determinant wzrostu.

Wstępny wniosek: Dane wskazują na istnienie zależności przestrzennych (klastrowanie bogactwa na Północy i ubóstwa na Południu), co uzasadnia zastosowanie modeli ekonometrii przestrzennej (testy Morana, modele SAR/SEM) do identyfikacji efektów sąsiedztwa i spillover.

4. Badanie Zależności Przestrzennych

4.1. Przygotowanie macierzy sąsiedztwa

Uzasadnienie wyboru macierzy wag opartej na k najbliższych sąsiadach (k-NN):

Analizujemy 107 włoskich prowincji (poziom NUTS-3), reprezentowanych przez punkty (centroidy). Klasyczna macierz sąsiedztwa oparta na granicach (queen/rook) jest przeznaczona dla obszarów z wyraźnymi granicami – w przypadku danych punktowych daje rezultaty niestabilne i wymaga usuwania wysp (np. Sycylia, Sardynia), co zniekształca analizę.

Macierz oparta na k najbliższych sąsiadach (k-NN) z parametrem k = 4 jest metodologicznie poprawna dla danych punktowych, ponieważ:

Każda prowincja ma dokładnie 4 sąsiadów (po standaryzacji wierszowej suma wag = 1) – brak problemu z wyspami i regionami peryferyjnymi.
Relacje są symetryczne, a wpływ sąsiedztwa jest jednakowo definiowany dla wszystkich jednostek.
Macierz k-NN jest stabilna numerycznie i powszechnie stosowana w ekonometrii przestrzennej dla danych punktowych (Anselin, 1988).
Standaryzacja wierszowa ułatwia interpretację parametrów ρ (model SAR) i λ (model SEM).

Alternatywnie moglibyśmy zastosować macierz odwrotności odległości, jednak w przypadku gęsto zaludnionego terytorium Włoch macierz k-NN lepiej oddaje lokalne powiązania sąsiedzkie i jest bardziej odporna na odstające odległości.

4.2. Test Morana - globalny test autokorelacji przestrzennej

Wyniki testu globalnego I Morana dla PKB per capita
	Statystyka	Wartość
Moran I statistic	I Morana	0.619400
Expectation	Oczekiwana wartość E(I)	-0.009900
Variance	Wariancja Var(I)	0.003919
	p-value	0.000000
Wniosek: ✅ ISTOTNA dodatnia autokorelacja przestrzenna (PKB klastruje się – bogata Północ otoczona bogatymi, biedne Południe otoczone biednymi)

4.3. Test lokalny LISA (Local Indicators of Spatial Association)

Na podstawie mapy klastrów LISA dla PKB per capita we Włoszech można stwierdzić:

Hot spoty (HH, kolor czerwony) koncentrują się w północnych prowincjach (Lombardia, Wenecja Euganejska, Emilia-Romania, częściowo Piemont i Lacjum). Oznacza to, że prowincje o wysokim PKB są otoczone regionami równie zamożnymi – efekt klastrowania bogactwa.
Cold spoty (LL, kolor niebieski) dominują na południu (Kalabria, Sycylia, Apulia, Basilicata) – niskie PKB sąsiaduje z niskim PKB, co odzwierciedla trwałe zacofanie gospodarcze tego obszaru.
Nieliczne obserwacje nietypowe (HL lub LH) występują sporadycznie – np. pojedyncze prowincje o wysokim PKB otoczone biedniejszymi lub odwrotnie. Brak ich widoczności na mapie sugeruje, że struktura przestrzenna jest silnie polaryzacyjna (dwubiegunowa).

Wniosek: Mapa potwierdza dualizm Północ–Południe oraz silną dodatnią autokorelację przestrzenną PKB. Model SAR (z efektami spillover) jest zatem właściwy.

#12 najsilniejszych klastrów LISA (najwyższe wartości I i istotność)

Lokalne statystyki I Morana (LISA) – 12 najsilniejszych obserwacji
Prowincja	PKB/capita	Ii	p-value	Klaster	Istotny
Bolzano-Bozen	49800	2.6806	0.0311	HH (Hot spot – wysoki PKB)	✅ Tak \|
Agrigento	16700	2.0342	0.0052	LL (Cold spot – niski PKB)	✅ Tak \|
Trapani	17400	1.9459	0.0046	LL (Cold spot – niski PKB)	✅ Tak \|
Trento	39400	1.9408	0.0033	HH (Hot spot – wysoki PKB)	✅ Tak \|
Enna	16500	1.8898	0.0002	LL (Cold spot – niski PKB)	✅ Tak \|
Caltanissetta	17600	1.8366	0.0008	LL (Cold spot – niski PKB)	✅ Tak \|
Vibo Valentia	17300	1.7649	0.0107	LL (Cold spot – niski PKB)	✅ Tak \|
Cosenza	16900	1.6920	0.0179	LL (Cold spot – niski PKB)	✅ Tak \|
Crotone	18600	1.6140	0.0032	LL (Cold spot – niski PKB)	✅ Tak \|
Palermo	20100	1.5690	0.0028	LL (Cold spot – niski PKB)	✅ Tak \|
Ragusa	19100	1.5069	0.0099	LL (Cold spot – niski PKB)	✅ Tak \|
Reggio di Calabria	18800	1.5036	0.0126	LL (Cold spot – niski PKB)	✅ Tak \|

Północne prowincje Bolzano i Trento to istotne hot spoty (wysoki PKB otoczony wysokim), natomiast wszystkie wymienione prowincje południowe (Sycylia, Kalabria) to istotne cold spoty (niski PKB otoczony niskim). Potwierdza to dualizm gospodarczy Włoch.

4.4. Wykres Rozproszenia Morana (Moran Scatterplot)

Analiza wykresu rozproszenia Morana dla PKB per capita:

Wykres wizualizuje globalną autokorelację przestrzenną badanego zjawiska. Wartość statystyki I Morana = 0,6194 (przy wysoce istotnym p-value < 0,0001) potwierdza silną, dodatnią zależność przestrzenną. Oznacza to, że wysokie wartości PKB w danej prowincji “przyciągają” wysokie wartości u sąsiadów i analogicznie w przypadku wartości niskich.

Zdecydowana większość punktów układa się wzdłuż linii trendu i koncentruje w dwóch głównych ćwiartkach: - I ćwiartka (High-High, kolor czerwony): Prowincje o wysokim PKB otoczone przez równie bogatych sąsiadów. Tworzą one potężny klaster wysokiego rozwoju, charakterystyczny dla uprzemysłowionej Północy Włoch. - III ćwiartka (Low-Low, kolor ciemnoniebieski): Prowincje o niskim PKB otoczone przez słabo rozwiniętych sąsiadów. Wizualizuje to przestrzenną “pułapkę niskiego dochodu”, typową dla zmagającego się ze stagnacją Południa.

Wniosek: Rozkład punktów stanowi bezsprzeczny, graficzny dowód na klastrowanie przestrzenne i strukturalny dualizm Włoch. Na szczególną uwagę zasługuje również skrajnie odstający punkt po prawej stronie wykresu – prowincja ITC4C (Mediolan). Jej lokalne PKB jest tak gigantyczne na tle reszty kraju, że znacząco rozciąga skalę osi X, potwierdzając jej status absolutnego hegemona gospodarczego. ————————————————————————

5. Przygotowanie Danych do Modelowania

Specyfikacja modelu przyczynowo-skutkowego:

\[\ln(\text{PKB per capita}_{i}) = \beta_0 + \beta_1 \ln(\text{gęstość zaludnienia}_{i}) + \beta_2 \ln(\text{zatrudnienie}_{i}) + \beta_3 \text{wyższe wykształcenie}_{i} + \beta_4 \text{saldo migracji}_{i} + \varepsilon_i\]

Transformacje logarytmiczne: - Zmienna objaśniana (PKB per capita) oraz zmienne ilościowe (gęstość zaludnienia, zatrudnienie) – logarytm naturalny. - Zmienne strukturalne (wyższe wykształcenie w %, saldo migracji w ‰) – w oryginalnej skali liniowej.

Zmienne dodane w analizie: - Gęstość zaludnienia (os/km²) – proxy dla korzyści aglomeracji i urbanizacji. - Zatrudnienie (tys. osób) – miara aktywności gospodarczej i wielkości rynku pracy. - Wyższe wykształcenie (%) – kapitał ludzki, innowacyjność. - Saldo migracji (na 1000 mieszkańców) – przepływy ludności, atrakcyjność regionu.

Liczba prowincji w modelowaniu: 102

6. Model OLS – Punkt Odniesienia

## === WYNIKI KLASYCZNEGO MODELU OLS ===

## 
## Call:
## lm(formula = formula_model, data = df_model)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.48243 -0.11853 -0.00031  0.13262  0.66511 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        8.756084   0.208317  42.032  < 2e-16 ***
## log_dens           0.063075   0.024622   2.562 0.011956 *  
## log_emp           -0.003861   0.022315  -0.173 0.862997    
## higher_edu         0.059305   0.007202   8.234 8.52e-13 ***
## migration_balance -0.019609   0.005637  -3.479 0.000756 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1951 on 97 degrees of freedom
## Multiple R-squared:  0.5196, Adjusted R-squared:  0.4997 
## F-statistic: 26.22 on 4 and 97 DF,  p-value: 9.507e-15

6.1. Testy Diagnostyczne Modelu OLS

Testy diagnostyczne modelu OLS
	Test	Statystyka	p_value
W	Shapiro-Wilk (normalność)	0.9794	0.1116
BP	Breuscha-Pagana (homoskedastyczność)	20.9083	0.0003
DW	Durbin-Watson (autokorelacja)	1.1543	0.0000

Interpretacja testów diagnostycznych modelu OLS:

Na podstawie uzyskanych wyników weryfikacji założeń klasycznej metody najmniejszych kwadratów (KMNK) stwierdzono:

Test Shapiro-Wilka (p = 0,1116): Ponieważ p-value > 0,05, brak jest podstaw do odrzucenia hipotezy zerowej. Oznacza to, że reszty modelu mają rozkład normalny – założenie spełnione.
Test Breuscha-Pagana (p = 0,0003): Wartość p < 0,05 nakazuje odrzucenie hipotezy o stałości wariancji. Występuje silna heteroskedastyczność – założenie naruszone. Różnice w wariancji błędów wynikają prawdopodobnie z ogromnych dysproporcji skali gospodarek między włoskimi prowincjami.
Test Durbina-Watsona (DW = 1,1543, p = 0,0000): Wysoce istotny wynik (p < 0,05) i statystyka DW znacznie poniżej 2 świadczą o występowaniu silnej, dodatniej autokorelacji składnika losowego – założenie naruszone.

Wnioski: Klasyczny model OLS okazał się całkowicie niewydolny. O ile spełnione jest założenie o normalności reszt, o tyle występowanie silnej heteroskedastyczności oraz potężnej autokorelacji składnika losowego dyskwalifikuje ten model. Naruszenie tych założeń oznacza, że estymatory OLS przestały być najefektywniejsze, a błędy standardowe są obciążone. Nielosowy charakter reszt (autokorelacja) to ewidentny dowód na to, że w danych ukryta jest struktura geograficzna, której OLS nie potrafi wychwycić.

Wyniki te stanowią twardy, formalny dowód na bezwzględną konieczność zastosowania modeli uwzględniających efekty sąsiedztwa

7. Testy ex-ante: Wybór Specyfikacji Przestrzennej (Testy LM)

7.1. Test Morana na Resztach OLS

##                                Miara   Wartość
## Moran I statistic           I Morana  0.439500
## Expectation       Oczekiwana wartość -0.009900
## Variance                   Wariancja  0.003988
##                              p-value  0.000000

Wniosek z testu Morana na resztach modelu OLS:

Test Morana na resztach modelu OLS dał rezultat: I = 0,4395 (p-value < 0,0001).

Wynik ten jest WYSOCE ISTOTNY STATYSTYCZNIE (p < 0,05) i wskazuje na bardzo silną, dodatnią autokorelację przestrzenną reszt. Oznacza to, że założenie klasycznej metody najmniejszych kwadratów o niezależności składnika losowego zostało naruszone. Błędy modelu nie są losowe – prowincje, dla których model OLS “przestrzelił” lub “niedoszacował” wartości PKB per capita, grupują się na mapie w wyraźne, sąsiadujące ze sobą klastry.

7.2. Testy LM (Mnożniki Lagrange’a)

Klasyczne i odporne testy LM – wybór specyfikacji przestrzennej
	Test	Statystyka	p_value	Werdykt
RSlag	LMlag (wskazuje na model SAR)	58.7627	0.0000	✅ Istotny \|
RSerr	LMerr (wskazuje na model SEM)	46.1433	0.0000	✅ Istotny \|
adjRSlag	RLMlag (Odporny SAR)	12.8134	0.0003	✅ Istotny \|
adjRSerr	RLMerr (Odporny SEM)	0.1941	0.6596	❌ Nieistotny \|

Procedura wyboru modelu (Anselin, 1988):

Jeśli tylko LMlag istotny → estymuj model SAR
Jeśli tylko LMerr istotny → estymuj model SEM
Jeśli oba istotne → porównaj RLMlag vs RLMerr:
- RLMlag > RLMerr → SAR
- RLMerr > RLMlag → SEM
Jeśli żaden nieistotny → brak podstaw do odrzucenia OLS

Wnioski z testów LM – wybór specyfikacji przestrzennej

Procedura Anselina:
Ponieważ oba testy (LMlag i LMerr) są istotne, porównujemy wartości odpornych testów LM (RLMlag vs RLMerr).
RLMlag = 12.8134 jest wyraźnie większe od RLMerr = 0.1941.

Zgodnie z regułą decyzyjną, wybieramy model, dla którego krzepka statystyka jest wyższa – RLMlag > RLMerr, zatem WSKAZANY MODEL: SAR (autoregresja przestrzenna zmiennej objaśnianej).

Wniosek końcowy:
Występuje istotna przestrzenna zależność w postaci efektów spillover – PKB per capita w prowincji zależy nie tylko od lokalnych determinant (gęstość zaludnienia, zatrudnienie, kapitał ludzki, migracje), ale także od poziomu PKB w prowincjach sąsiednich. Model SAR jest właściwą specyfikacją do dalszej analizy.

8. Modele Regresji Przestrzennej

8.1. Model SAR (Spatial Autoregressive / Spatial Lag Model)

\[Y = \rho W Y + X\beta + \varepsilon, \quad \varepsilon \sim \mathcal{N}(0, \sigma^2 I)\]

## 
## Call:lagsarlm(formula = formula_model, data = map_clean, listw = lw_clean, 
##     method = "eigen")
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -0.3727481 -0.1016695 -0.0038538  0.0830026  0.4847976 
## 
## Type: lag 
## Coefficients: (asymptotic standard errors) 
##                     Estimate Std. Error z value  Pr(>|z|)
## (Intercept)        2.8994796  0.6771723  4.2817 1.854e-05
## log_dens           0.0465003  0.0178381  2.6068 0.0091392
## log_emp            0.0305158  0.0161693  1.8873 0.0591242
## higher_edu         0.0262934  0.0066701  3.9420 8.081e-05
## migration_balance -0.0140494  0.0041920 -3.3515 0.0008039
## 
## Rho: 0.63864, LR test value: 49.226, p-value: 2.2812e-12
## Asymptotic standard error: 0.073234
##     z-value: 8.7205, p-value: < 2.22e-16
## Wald statistic: 76.046, p-value: < 2.22e-16
## 
## Log likelihood: 49.12057 for lag model
## ML residual variance (sigma squared): 0.019909, (sigma: 0.1411)
## Number of observations: 102 
## Number of parameters estimated: 7 
## AIC: -84.241, (AIC for lm: -37.015)
## LM test for residual autocorrelation
## test value: 1.2889, p-value: 0.25625

8.2. Model SEM (Spatial Error Model)

\[Y = X\beta + u, \quad u = \lambda W u + \varepsilon, \quad \varepsilon \sim \mathcal{N}(0, \sigma^2 I)\]

## 
## Call:errorsarlm(formula = formula_model, data = map_clean, listw = lw_clean, 
##     method = "eigen")
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -0.3170950 -0.1001380 -0.0030266  0.0780504  0.4333719 
## 
## Type: error 
## Coefficients: (asymptotic standard errors) 
##                     Estimate Std. Error z value  Pr(>|z|)
## (Intercept)        9.1798933  0.2407737 38.1266 < 2.2e-16
## log_dens           0.0366799  0.0178216  2.0582 0.0395742
## log_emp            0.0688143  0.0180353  3.8155 0.0001359
## higher_edu         0.0384269  0.0104820  3.6660 0.0002464
## migration_balance -0.0178006  0.0041865 -4.2520 2.119e-05
## 
## Lambda: 0.76328, LR test value: 50.529, p-value: 1.1744e-12
## Asymptotic standard error: 0.061792
##     z-value: 12.352, p-value: < 2.22e-16
## Wald statistic: 152.58, p-value: < 2.22e-16
## 
## Log likelihood: 49.77194 for error model
## ML residual variance (sigma squared): 0.018309, (sigma: 0.13531)
## Number of observations: 102 
## Number of parameters estimated: 7 
## AIC: -85.544, (AIC for lm: -37.015)

8.3. Model SDM (Spatial Durbin Model)

\[Y = \rho W Y + X\beta + WX\theta + \varepsilon\]

## 
## Call:lagsarlm(formula = formula_model, data = map_clean, listw = lw_clean, 
##     type = "Durbin", method = "eigen")
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.318393 -0.092016  0.004218  0.087113  0.350292 
## 
## Type: mixed 
## Coefficients: (asymptotic standard errors) 
##                         Estimate Std. Error z value  Pr(>|z|)
## (Intercept)            3.6290458  0.8153726  4.4508 8.556e-06
## log_dens               0.0333192  0.0173729  1.9179 0.0551266
## log_emp                0.0667754  0.0179648  3.7170 0.0002016
## higher_edu             0.0272991  0.0118431  2.3051 0.0211632
## migration_balance     -0.0181221  0.0041490 -4.3678 1.255e-05
## lag.log_dens           0.0016594  0.0401719  0.0413 0.9670517
## lag.log_emp           -0.1206081  0.0294457 -4.0960 4.204e-05
## lag.higher_edu        -0.0083754  0.0144019 -0.5815 0.5608708
## lag.migration_balance  0.0036988  0.0080772  0.4579 0.6470063
## 
## Rho: 0.60234, LR test value: 35.684, p-value: 2.3204e-09
## Asymptotic standard error: 0.086568
##     z-value: 6.9581, p-value: 3.4495e-12
## Wald statistic: 48.415, p-value: 3.4496e-12
## 
## Log likelihood: 57.6161 for mixed model
## ML residual variance (sigma squared): 0.01712, (sigma: 0.13084)
## Number of observations: 102 
## Number of parameters estimated: 11 
## AIC: -93.232, (AIC for lm: -59.548)
## LM test for residual autocorrelation
## test value: 7.7585, p-value: 0.0053461

9. Porównanie Modeli i Wybór Najlepszego

9.1. Kryteria Informacyjne (AIC, BIC)

Porównanie modeli – kryteria informacyjne (niższe = lepsze)
Model	LogLikelihood	AIC	BIC	Parametry	Delta_AIC
OLS	24.508	-37.02	-21.27	6	56.21
SAR	49.121	-84.24	-65.87	8	8.99
SEM	49.772	-85.54	-67.17	8	7.69
SDM	57.616	-93.23	-64.36	12	0.00

9.2. Parametry Przestrzenne

Parametry autoregresji przestrzennej
	Model	Parametr	Wartość	Błąd std.	Z-stat	p-value	Istotność
rho	SAR	ρ (rho)	0.6386	0.0732	8.7240	0	✅ p < 0.05 \|
lambda	SEM	λ (lambda)	0.7633	0.0618	12.3511	0	✅ p < 0.05 \|

Wnioski z porównania kryteriów informacyjnych oraz parametrów przestrzennych:

Zdecydowana przewaga modeli przestrzennych: Każdy z estymowanych modeli uwzględniających strukturę geograficzną (SAR, SEM, SDM) charakteryzuje się znacznie wyższą wartością funkcji logarytmu wiarygodności (LogLikelihood) oraz wyraźnie niższymi wartościami kryteriów informacyjnych AIC i BIC w porównaniu do klasycznego modelu OLS (\(AIC_{OLS} = -37,02\)). Dowodzi to, że pominięcie powiązań przestrzennych w przypadku włoskich prowincji prowadzi do poważnego błędu specyfikacji.
Dominacja modelu SDM: Wśród wariantów przestrzennych bezapelacyjnie wygrywa Przestrzenny Model Durbina (SDM), osiągając najniższe kryterium informacyjne (\(AIC_{SDM} = -93,23\)). Wartość parametru Delta_AIC wynosząca 0,00 potwierdza jego status jako specyfikacji optymalnej, co jest zgodne z wcześniejszymi wynikami testu stosunku wiarygodności (LR test).
Silna autokorelacja w modelach bazowych: Analiza parametrów przestrzennych w prostszych wariantach potwierdza potężne siły ciążenia. W modelu SAR parametr opóźnienia przestrzennego wynosi \(\rho = 0,6386\), co oznacza silne efekty spillover (rozlewania się). Z kolei w modelu SEM parametr błędu przestrzennego wynosi \(\lambda = 0,7633\). Oba parametry są wysoce istotne statystycznie (\(p < 0,05\), w praktyce bliskie zeru).

9.3. Testy Stosunku Wiarygodności (LR)

## ── LR test: OLS vs SAR ────────────────────────────────

## 
##  Likelihood ratio for spatial linear models
## 
## data:  
## Likelihood ratio = 49.226, df = 1, p-value = 2.281e-12
## sample estimates:
## Log likelihood of model_sar Log likelihood of model_ols 
##                    49.12057                    24.50764

## 
## ── LR test: OLS vs SEM ────────────────────────────────

## 
##  Likelihood ratio for spatial linear models
## 
## data:  
## Likelihood ratio = 50.529, df = 1, p-value = 1.174e-12
## sample estimates:
## Log likelihood of model_sem Log likelihood of model_ols 
##                    49.77194                    24.50764

## 
## ── LR test: SAR vs SDM ────────────────────────────────

## 
##  Likelihood ratio for spatial linear models
## 
## data:  
## Likelihood ratio = 16.991, df = 4, p-value = 0.001941
## sample estimates:
## Log likelihood of model_sdm Log likelihood of model_sar 
##                    57.61610                    49.12057

9.4. Schemat Wyboru Modelu

Kryterium informacyjne AIC i testy ex-post (LR): Rozbudowaliśmy analizę o Przestrzenny Model Durbina (SDM), który obok opóźnienia zmiennej objaśnianej uwzględnia również opóźnienia przestrzenne zmiennych objaśniających (macierz WX). Porównanie kryteriów informacyjnych AIC daje jednoznaczny obraz:
- OLS: AIC = –37,02
- SAR: AIC = –84,24
- SEM: AIC = –85,54
- SDM: AIC = –93,23
Model SDM osiąga zdecydowanie najniższe AIC, co oznacza najlepsze dopasowanie do danych. Ostatecznym potwierdzeniem tej przewagi jest przeprowadzony test stosunku wiarygodności (LR). Dla pary SAR vs SDM uzyskano wynik p-value = 0,0019. Ponieważ p < 0,05, statystyka jednoznacznie nakazuje odrzucenie modelu prostszego (SAR) na rzecz modelu Durbina.
Istotność parametrów przestrzennych: W zwycięskim modelu SDM parametr opóźnienia przestrzennego wynosi ρ = 0,6023 (p < 0,0001) i jest wysoce istotny statystycznie, udowadniając istnienie potężnego, ponadregionalnego efektu przyciągania gospodarczego.

WYBRANY MODEL: SDM (Spatial Durbin Model)

Interpretacja: Model SDM udowadnia, że PKB per capita w danej włoskiej prowincji zależy nie tylko od jej własnych, lokalnych determinant oraz poziomu bogactwa sąsiadów, ale także bezpośrednio od cech strukturalnych rynków ościennych (efekty dla macierzy WX). Oznacza to występowanie skomplikowanych, wielowymiarowych efektów rozlewania się (spillover) – m.in. rynek pracy i poziom wykształcenia na bogatej Północy potęgują wzrost sąsiadujących prowincji, podczas gdy odizolowane Południe nie doświadcza tych samych korzyści zewnętrznych.

10. Efekty Bezpośrednie, Pośrednie i Całkowite

## === EFEKTY DLA MODELU SDM ===

## Impact measures (mixed, exact):
##                              Direct    Indirect       Total
## log_dens dy/dx           0.03774897  0.05021286  0.08796184
## log_emp dy/dx            0.05038743 -0.18576237 -0.13537494
## higher_edu dy/dx         0.02894386  0.01864418  0.04758805
## migration_balance dy/dx -0.01959340 -0.01667754 -0.03627094
## ========================================================
## Simulation results ( variance matrix):
## ========================================================
## Simulated standard errors
##                              Direct   Indirect      Total
## log_dens dy/dx          0.019569047 0.09887454 0.10981931
## log_emp dy/dx           0.017863519 0.07176175 0.07847859
## higher_edu dy/dx        0.011190879 0.02014654 0.01776389
## migration_balance dy/dx 0.004614487 0.01975772 0.02205510
## 
## Simulated z-values:
##                            Direct   Indirect      Total
## log_dens dy/dx           1.936233  0.4563524  0.7558949
## log_emp dy/dx            2.691308 -2.6616215 -1.8212151
## higher_edu dy/dx         2.560066  0.9037168  2.6377198
## migration_balance dy/dx -4.245387 -0.9057886 -1.6996796
## 
## Simulated p-values:
##                         Direct     Indirect  Total    
## log_dens dy/dx          0.0528392  0.6481366 0.4497122
## log_emp dy/dx           0.0071172  0.0077765 0.0685742
## higher_edu dy/dx        0.0104652  0.3661456 0.0083466
## migration_balance dy/dx 2.1822e-05 0.3650478 0.0891912

Interpretacja Efektów w Modelach Przestrzennych

Efekty w Przestrzennym Modelu Durbina (SDM)

Interpretacja ekonomiczna (Impact measures):

Efekty bezpośrednie (Direct): Opisują wpływ zmiany zmiennej w danej prowincji na jej własne PKB per capita.
- Zmienne zlogarytmowane (elastyczność): Wzrost gęstości zaludnienia o 1% przekłada się na wzrost lokalnego PKB o ok. 0,038%, a wzrost zatrudnienia o 1% podnosi PKB o ok. 0,050%.
- Zmienne w poziomach (półelastyczność): Wzrost odsetka osób z wyższym wykształceniem o 1 punkt procentowy stymuluje PKB aż o 2,89%. Z kolei dodatnie saldo migracji obciąża wskaźnik – wzrost salda o 1‰ powoduje spadek PKB per capita o ok. 1,96%.
Efekty pośrednie / spillover (Indirect): Opisują oddziaływanie rynków ościennych na dany region. W modelu SDM jedynym istotnym statystycznie efektem pośrednim jest zatrudnienie, które wykazuje silny wpływ ujemny (-0,1858). Wzrost zatrudnienia u sąsiadów o 1% skutkuje spadkiem lokalnego PKB per capita o ok. 0,186%.
- Uzasadnienie teoretyczne: Zjawisko to idealnie odzwierciedla teorię kumulatywnej przyczynowości (Myrdal, 1957). Występuje tu klasyczny efekt wsteczny (backwash effect) – rynki pracy w bogatszych centrach gospodarczych działają jak magnes, nieustannie odsysając kapitał oraz najbardziej wykwalifikowanych pracowników z prowincji peryferyjnych. Zjawisko to koresponduje również z teorią gospodarki dualnej (Lewis, 1954), w świetle której słabsze obszary sprowadzone zostały do roli rezerwuaru siły roboczej dla nowoczesnych biegunów przemysłowych.
Efekt całkowity (Total): Łączny wpływ dla całego makroregionu. Z uwagi na dominację efektu wstecznego (odpływu do sąsiadów) nad korzyściami lokalnymi, sumaryczny wpływ zatrudnienia na system okazuje się ujemny. Wzrost ogólnego zatrudnienia w systemie o 1% obniża średnie PKB per capita o ok. 0,135%.

Wnioski: Włoska gospodarka regionalna funkcjonuje jako system silnie konkurencyjny, a nie kooperacyjny. Historyczna polaryzacja, zapoczątkowana po zjednoczeniu Włoch w 1861 roku (tzw. kwestia południowa / questione meridionale), wykształciła mechanizmy drenażu zasobów, które dominują nad procesami naturalnego rozprzestrzeniania się wzrostu (spread effects). Północ utrzymuje i powiększa swoją przewagę kosztem mniejszych prowincji, co wyjaśnia, dlaczego ewolucyjne wyrównanie poziomów rozwoju wciąż nie nastąpiło.

11. Diagnostyka Reszt

11.1. Porównanie Dopasowania

Wizualna ocena i porównanie jakości dopasowania modeli:

Poniższe wykresy rozrzutu obrazują relację pomiędzy faktycznymi wartościami logarytmu PKB per capita we włoskich prowincjach a wartościami teoretycznymi (dopasowanymi), wygenerowanymi przez cztery alternatywne specyfikacje modelowe: OLS, SAR, SDM oraz SEM. Przekątna linia przerywana (\(y = x\)) wyznacza poziom idealnej predykcji – im punkty leżą bliżej niej, tym mniejszy jest błąd losowy i tym lepsze dopasowanie modelu do danych empirycznych.

Niewydolność klasycznego modelu OLS: Chmura punktów dla modelu OLS wykazuje największe rozproszenie i wyraźne asymetryczne odchylenia od linii idealnego dopasowania. Model ten ma tendencję do wypłaszczania trendu: systematycznie przeszacowuje wartości dla uboższych prowincji (skupisko punktów wyraźnie powyżej linii po lewej stronie wykresu) oraz niedoszacowuje wyniki dla regionów najbogatszych. Wynika to bezpośrednio z ignorowania struktury geograficznej i pominięcia faktu, że bogate prowincje silnie stymulują się nawzajem, tworząc klastry wzrostu gospodarczego.
Poprawa dopasowania w modelach SAR i SEM: Wprowadzenie przestrzennej macierzy wag (zarówno w postaci opóźnienia przestrzennego zmiennej zależnej w modelu SAR, jak i struktury autokorelacji składnika losowego w modelu SEM) skutkuje wyraźną kondensacją punktów wokół przekątnej. Chmura rozproszenia ulega zwężeniu, co świadczy o istotnym zmniejszeniu wariancji resztowej i skuteczniejszym wychwytywaniu specyfiki regionalnej Włoch.
Optymalna zbieżność w Przestrzennym Modelu Durbina (SDM): Wizualna analiza wykresu potwierdza, że model SDM charakteryzuje się najwyższą precyzją dopasowania. Punkty empiryczne najściślej przylegają do linii referencyjnej na całej jej długości. Model ten najlepiej radzi sobie z eliminacją błędów systematycznych zarówno w obszarze wartości minimalnych (najbiedniejsze prowincje Południa), jak i maksimów (wysoko rozwinięte prowincje Północy). Łączne uwzględnienie efektów rozlewania się zmiennej objaśnianej oraz zmiennych objaśniających pozwala modelowi SDM najpełniej odzwierciedlić głęboki dualizm gospodarczy badanych jednostek.

11.2. Mapa Reszt Modelu

Analiza reszt (automatyczna):

Prowincje z największymi resztami modelu SDM
	Prowincja	Reszta_OLS	Reszta_SDM
36	Bolzano-Bozen	0.6651	0.3503
11	Milano	0.4368	0.3390
62	Prato	-0.4766	-0.3184
48	Trieste	0.1395	0.2918
78	Latina	-0.4287	-0.2837
88	Valle d’Aosta/Vallée d’Aoste	0.4631	0.2831
99	Pavia	-0.0413	-0.2486
75	Viterbo	-0.4193	-0.2378
40	Belluno	0.2864	0.2303
94	Como	-0.0545	-0.2135

Interpretacja reszt Przestrzennego Modelu Durbina (SDM):

Analiza reszt z modelu przestrzennego pozwala zidentyfikować prowincje o specyficznym profilu gospodarczym, którego nie potrafią w pełni opisać standardowe zmienne makroekonomiczne i efekty sąsiedztwa ujęte w modelu SDM.

Dodatnie reszty (niedoszacowanie PKB): Występują tam, gdzie rzeczywiste PKB jest wyższe niż przewiduje model. Liderami są tu silnie uprzemysłowione i turystyczne prowincje alpejskie: Bolzano-Bozen (0,350) oraz Valle d’Aosta (0,283), a także główny hub finansowy kraju – Mediolan (0,339). Model SDM nie docenia potęgi tych regionów. Ich sukces opiera się na specyficznych czynnikach, których nie mamy w danych: autonomii podatkowej (w przypadku regionów alpejskich), dochodach z zaawansowanej turystyki zimowej oraz potężnej koncentracji międzynarodowego kapitału korporacyjnego (Mediolan).
Ujemne reszty (przeszacowanie PKB): Występują w prowincjach, gdzie rzeczywiste PKB jest niższe od przewidywań modelu. Wyróżniają się tu m.in. Prato (–0,318), Latina (–0,284) czy Pavia (–0,249). Są to często prowincje bezpośrednio sąsiadujące z wielkimi metropoliami (np. Prato przy Florencji, Pavia przy Mediolanie, Latina niedaleko Rzymu). Wynik ten może potwierdzać zidentyfikowany wcześniej efekt wysysania (backwash) – model zakłada, że prowincje te powinny korzystać na bliskości bogatego sąsiada, podczas gdy w rzeczywistości są przez niego drenowane z zasobów ludzkich i inwestycji.

Porównanie OLS vs SDM: Analiza tabeli wartości skrajnych bezlitośnie obnaża słabość modelu klasycznego. W przypadku Bolzano błąd modelu OLS wynosił aż 0,665, podczas gdy model SDM zredukował go niemal o połowę (do 0,350). Podobną gigantyczną poprawę (z 0,436 na 0,339) widać na przykładzie Mediolanu.

Wzorzec przestrzenny na mapie: Mapa reszt dla modelu SDM charakteryzuje się znacznie łagodniejszą paletą barw niż w przypadku OLS, co wizualnie potwierdza wysoką jakość dopasowania. Silne odchylenia (głęboka czerwień i granat) nie tworzą już rozległych, połączonych klastrów, lecz mają charakter punktowy (tzw. wyspy). Oznacza to, że model SDM skutecznie “odessał” autokorelację przestrzenną z systemu, a pozostałe błędy wynikają wyłącznie z lokalnej, niesystemowej specyfiki poszczególnych miast.

12. Podsumowanie i Wnioski

12.1. Tabela Zbiorcza Wyników

Zbiorcze podsumowanie wyników analizy przestrzennej (PKB per capita we Włoszech)
Kryterium	Wartość
I Morana (PKB per capita)	0.6194
p-value (Moran dla PKB)	0.0000
I Morana (reszty OLS)	0.4395
p-value (reszty OLS)	0.0000
LMlag (RSlag) – p-value	0.0000
LMerr (RSerr) – p-value	0.0000
AIC – OLS	-37.0200
AIC – SAR	-84.2400
AIC – SEM	-85.5400
AIC – SDM	-93.2300
ρ (SAR)	0.6386
λ (SEM)	0.7633
ρ (SDM)	0.6023

12.2. Wnioski Ekonomiczne

WNIOSKI EKONOMICZNE – ANALIZA PKB PER CAPITA WE WŁOSKICH PROWINCJACH

Autokorelacja przestrzenna PKB: Statystyka I Morana dla PKB per capita wyniosła 0,6194 (p-value < 0,0001). Wynik jest wysoce istotny – bogactwo klastruje się przestrzennie. Bogate prowincje Północy tworzą zwarty blok rozbudowanej gospodarki, podczas gdy ubogie prowincje Południa są otoczone przez równie słabych sąsiadów.
Autokorelacja w resztach OLS: Test Morana na resztach modelu OLS dał I = 0.439500. Klasyczny model OLS narusza podstawowe założenie o niezależności reszt, nie chwytając istotnych struktur przestrzennych, co bezwzględnie wymagało zastosowania ekonometrii przestrzennej.
Wybór ostatecznej specyfikacji (SDM): Choć procedura Anselina wskazała początkowo na model SAR, rozbudowa modelu do postaci Przestrzennego Modelu Durbina (SDM) okazała się kluczowa. Model SDM (AIC = –93,23) zdeklasował dopasowaniem model SAR (AIC = –84,24), co zostało potwierdzone testem stosunku wiarygodności LR (p = 0,0019). Ostatecznie wybrano model SDM.
Siła przyciągania przestrzennego: Parametr opóźnienia przestrzennego w modelu SDM wynosi ρ = 0,6023 (p < 0,0001). Dowodzi to istnienia potężnego, ponadregionalnego magnesu gospodarczego – kondycja sąsiadów w ponad 60% determinuje szanse rozwojowe danej prowincji.
Wielokierunkowe efekty przestrzenne (Spillovers i Backwash): Model SDM pozwolił na odkrycie dualnej natury włoskiej gospodarki:
- Spillover (pozytywne rozlewanie): Kapitał ludzki (wykształcenie) wykazuje silne oddziaływanie bezpośrednie (0,0289) i buduje łączny potencjał systemu.
- Backwash (efekt drenażu/wysysania): Zatrudnienie wykazuje potężny, ujemny efekt pośredni (-0,1858). Oznacza to, że silny rynek pracy u sąsiada wysysa kapitał i pracowników z Twojej prowincji, obniżając Twój PKB per capita.
Implikacje polityczne: Analiza dowodzi, że włoska gospodarka to arena silnej konkurencji regionalnej. Tradycyjna “polityka spójności” polegająca na pompowaniu pieniędzy w pojedyncze prowincje Południa jest nieskuteczna, ponieważ wykreowane tam zasoby są natychmiast wysysane przez silniejsze rynki pracy na Północy i w metropoliach (np. w Rzymie). Skuteczna polityka musi mieć charakter makroregionalny i skupiać się na zatrzymaniu drenażu mózgów.

12.3. Ograniczenia Badania i Kierunki Przyszłych Analiz

Główne ograniczenia analizy PKB we włoskich prowincjach:

Przekrój poprzeczny: Analiza dotyczy tylko roku 2021. Brak wymiaru czasowego uniemożliwia zbadanie np. wpływu pandemii COVID-19 czy długofalowych trendów drenażu siły roboczej.
Rozdzielczość danych: Agregacja na poziomie NUTS-3 ukrywa potężne zróżnicowanie wewnątrz prowincji (różnice między stolicą prowincji a jej terenami wiejskimi/górskimi).
Pominięte zmienne: Mimo wysokiej jakości modelu SDM, reszty w teście LM wciąż wykazują śladową autokorelację. Świadczy to o braku kluczowych zmiennych w zbiorze Eurostatu, takich jak: jakość infrastruktury drogowej/kolejowej, wskaźniki korupcji administracyjnej, nakłady na B+R oraz faktyczne przepływy handlowe.
Endogeniczność: Migracje i wykształcenie mogą być nie tylko determinantą (przyczyną), ale i skutkiem wysokiego PKB. Zastosowanie modelu SDM łagodzi, ale nie eliminuje całkowicie tego problemu.

Wnioski dla przyszłych badań: Kolejnym, naturalnym krokiem badawczym powinno być zbudowanie Panelowego Modelu Durbina (Dynamic Spatial Panel Data) obejmującego dekadę 2010–2020. Taka struktura pozwoliłaby zbadać faktyczną, historyczną prędkość wysysania kapitału ludzkiego z Południa na Północ, a także zweryfikować, czy efekty przestrzenne są asymetryczne (tj. czy wstrząs w Mediolanie odbija się na Sycylii równie mocno, co szok na Sycylii w Mediolanie).

Projekt z Ekonometrii Przestrzennej – AG II S, semestr II
Prowadzący: dr Aleksandra Kordalska
Data: 16.06.2026

Analiza dualizmu we Włoszech - przestrzenne zroznicowanie PKB per capita

Projekt z Ekonometrii Przestrzennej - AG II S, semestr II

Zespol: Agnieszka Ancypo, Sylwia Bech, Dawid Genert