Analiza przestrzenna wpływu czynników ekonomicznych i społecznych na poziom bezrobocia w regionach NUTS 4 (powiaty) w Polsce.
Ekonometria przestrzena
Wprowadzenie
Stopa bezrobocia jest jednym z kluczowych wskaźników ekonomicznych, odzwierciedlającym procentową część ludności aktywnej zawodowo, która nie posiada zatrudnienia, ale jest gotowa i zdolna do podjęcia pracy. Analiza przyczyn i konsekwencji bezrobocia jest istotna zarówno dla polityki ekonomicznej, jak i dla zrozumienia dynamiki rynku pracy w kontekście społecznym i gospodarczym. W Polsce, podobnie jak w innych krajach, regionalne różnice w stopie bezrobocia mogą być znaczące, co podkreśla potrzebę przestrzennych badań ekonometrycznych.
Początkowo projekt miał być realizowany na poziomie województw, jednak wstępne analizy nie wykazały istotnych zależności przestrzennych dla zmiennej objaśnianej, jaką jest bezrobocie, co skłoniło nas do przesunięcia analiz na poziom powiatów. Ze względu na ograniczenia czasowe i dostępność danych, zdecydowaliśmy się ograniczyć liczbę zmiennych objaśniających do trzech. Dane wykorzystane w projekcie pochodzą ze strony Głównego Urzędu Statystycznego, które choć szczegółowe, nie zawsze dostarczają informacji z rozkładem na wszystkie powiaty.
Determinanty wybrane do analizy
Liczba absolwentów szkół ogólnokształcących - zakładamy, że wyższe wykształcenie w regionie może wpływać na niższą stopę bezrobocia, zwiększając kwalifikacje i adaptacyjność siły roboczej.
Liczba wypadków w miejscach pracy - ta zmienna może oddziaływać negatywnie na atrakcyjność regionu jako miejsca do życia i pracy, potencjalnie zwiększając lokalne bezrobocie.
Średnie wynagrodzenie brutto - oczekuje się, że wyższe wynagrodzenia przyciągną większą liczbę osób poszukujących pracy, co może zarówno zmniejszyć bezrobocie, jak i zaostrzyć konkurencję o dostępne miejsca pracy.
Wybór tych determinant był kierowany potrzebą zrozumienia, jak różne czynniki ekonomiczne i społeczne wpływają na regionalne różnice w bezrobociu. Liczba absolwentów szkół ogólnokształcących odzwierciedla potencjał edukacyjny, który jest kluczowy dla zdolności adaptacyjnych rynku pracy. Liczba wypadków w pracy, jako wskaźnik warunków pracy, wpływa na postrzeganie bezpieczeństwa zawodowego. Średnie wynagrodzenie jest natomiast bezpośrednio związane z siłą nabywczą i przyciąganiem siły roboczej do regionu. Wybór tych zmiennych umożliwia zatem głębsze zrozumienie dynamiki rynku pracy na poziomie lokalnym, co jest kluczowe dla tworzenia skutecznej polityki społeczno-gospodarczej.
Wizualizacja danych
Mapa stopy bezrobocia w powiatach
## Reading layer `powiaty_aktualizowane' from data source
## `/Users/szymonniewdana/Downloads/Projekt-2/powiaty_aktualizowane.shp'
## using driver `ESRI Shapefile'
## Simple feature collection with 393 features and 37 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: 171677.5 ymin: 133223.4 xmax: 861895.8 ymax: 775019.1
## Projected CRS: Undefined Cartesian SRS with unknown unit
## tmap mode set to plotting
Mapa przedstawia stopę bezrobocia w polskich powiatach, używając różnych odcieni niebieskiego – ciemniejsze odcienie oznaczają wyższe bezrobocie (od 0% do 28%). Szare obszary to powiaty bez danych. Mapa pomaga analizować regionalne różnice ekonomiczne, co jest przydatne dla decydentów i badaczy rynku pracy. i osób zainteresowanych regionalnym rynkiem pracy.
Mapa wskżnika LISA
## Warning: The projection of the shape object merged_data_clean2 is not known,
## while it seems to be projected.
## Warning: Current projection of shape merged_data_clean2 unknown and cannot be
## determined.
Mapa wskaźnika LISA dla stopy bezrobocia pokazuje istotne różnice regionalne w autokorelacji stóp bezrobocia, wskazując na regiony, które mogą wymagać szczególnego zainteresowania ze względu na skoncentrowane wysokie stopy bezrobocia.
Obszary z wartościami wskaźnika LISA. w zakresie (2-4) mogą wskazywać na niewielką pozytywną autokorelację przestrzenną. Oznacza to, że bezrobocie w tych obszarach jest umiarkowanie skupione, z sąsiadującymi obszarami wykazującymi podobne stopy bezrobocia.
Jasnoniebieski (-2 do 0): W tych obszarach autokorelacja jest bliska zeru lub bardzo niska, co sugeruje, że stopy bezrobocia są dość losowo rozłożone lub sąsiadujące regiony nie wykazują wyraźnego podobieństwa.
Pomarańczowy (4 do 6) i czerwony (6 do 8): Wysokie wartości wskaźnika LISA w tych obszarach wskazują na silną dodatnią autokorelację przestrzenną. Obszary te mogą być interpretowane jako „gorące punkty” bezrobocia, gdzie regiony te oraz ich bezpośrednie otoczenie mają podobnie wysokie stopy bezrobocia. Jest to szczególnie widoczne dla obszaru w centralnej części mapy.
Centralny region oznaczony na czerwono wskazuje na silne skupisko wysokiego bezrobocia. Wysoka autokorelacja w tych obszarach może wynikać z czynników strukturalnych, takich jak ograniczone możliwości zatrudnienia, przemysłowe spadki lub inne społeczno-ekonomiczne wyzwania. Skutkiem może być wzrost potrzeb socjalnych, obniżenie standardów życia i zwiększenie migracji wewnętrznej.
Wykres rozproszenia Morana
##
## Moran I test under randomisation
##
## data: merged_data_clean2$stopa
## weights: lw
##
## Moran I statistic standard deviate = 12.599, p-value < 2.2e-16
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.424713778 -0.002638522 0.001150503
Wykres przedstawia wyniki testu Morana, który ocenia przestrzenną autokorelację stopy bezrobocia w Polsce w 2023 roku. Oś pozioma pokazuje stopę bezrobocia, pionowa – lokalny wskaźnik autokorelacji Morana. Przerywana linia oznacza brak autokorelacji. Punkty powyżej tej linii wskazują na dodatnią autokorelację (sąsiadujące regiony mają podobne wskaźniki bezrobocia), a poniżej – na negatywną. Ogólny trend wzrostowy sugeruje zwiększoną koncentrację regionów o podobnym poziomie bezrobocia.
Przeprowadzony test Morana ocenia, czy wzorzec wartości obserwowanych w różnych lokalizacjach jest losowy, czy też wykazuje systematyczną zmienność przestrzenną, czyli czy wartości podobne są bardziej skoncentrowane w przestrzeni niż można by tego oczekiwać na podstawie przypadkowego rozmieszczenia.
Wnioski z testu Morana I dla stopy bezrobocia:
Wartość statystyki Morana wynosi 0.4298, co sugeruje obecność dodatniej autokorelacji przestrzennej. Wysoka wartość statystyki I wskazuje, że powiaty o podobnych stopach bezrobocia mają tendencję do grupowania się blisko siebie.
Oczekiwana wartość tej statystyki w przypadku braku autokorelacji przestrzennej wynosi około -0.00265. Rzeczywista wartość statystyki I jest znacznie wyższa od oczekiwanej, co wskazuje na istotność wyników.
Wartość odchylenia standardowego wynosi 12.783, co jest bardzo wysoką wartością, dodatkowo podkreślającą istotność statystyczną wyników.
P-value wynosi mniej niż 2.2e-16, co jest wartością zdecydowanie poniżej typowego progu istotności statystycznej (0.05). Oznacza to, że możemy odrzucić hipotezę zerową o braku autokorelacji przestrzennej na rzecz alternatywnej hipotezy, która zakłada, że obserwacja ma dodatnią autokorelację przestrzenną.
Obecność dodatniej autokorelacji przestrzennej w stawkach bezrobocia wśród powiatów w Polsce sugeruje, że regiony z podobnymi poziomami bezrobocia są geograficznie skupione. Może to wskazywać na regionalne czynniki ekonomiczne lub polityczne, które wpływają na rynek pracy w sposób, który prowadzi do podobnych wyników w sąsiednich obszarach. To z kolei może sugerować potrzebę skierowania regionalnych polityk gospodarczych lub interwencji rynku pracy w sposób bardziej dostosowany do konkretnych obszarów geograficznych.
Mapa istotności
Modele bez interakcji przestrzennej
Statystyka I Moran
##
## Call:
## lm(formula = stopa ~ absolwenci + wynagrodzenie + wypadki, data = merged_data_clean2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -7.3010 -2.3452 -0.7645 1.8924 15.5512
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 16.9970877 1.5878627 10.704 < 2e-16 ***
## absolwenci 0.0020556 0.0005034 4.083 5.43e-05 ***
## wynagrodzenie -0.0015863 0.0002788 -5.690 2.55e-08 ***
## wypadki -0.0092433 0.0017485 -5.287 2.12e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.437 on 376 degrees of freedom
## Multiple R-squared: 0.2224, Adjusted R-squared: 0.2162
## F-statistic: 35.85 on 3 and 376 DF, p-value: < 2.2e-16
##
## Global Moran I for regression residuals
##
## data:
## model: lm(formula = stopa ~ absolwenci + wynagrodzenie + wypadki, data
## = merged_data_clean2)
## weights: lw
##
## Moran I statistic standard deviate = 8.9365, p-value < 2.2e-16
## alternative hypothesis: greater
## sample estimates:
## Observed Moran I Expectation Variance
## 0.299077725 -0.003600210 0.001147163
Przeprowadzono regresję liniową modelującą stopę bezrobocia na podstawie trzech zmiennych: liczby absolwentów szkół ogólnokształcących, średniego wynagrodzenia oraz liczby wypadków w miejscach pracy. Następnie, na resztach tego modelu wykonano test Morana I w celu zbadania przestrzennej autokorelacji.
Analiza wyników modelu regresji OLS:
Absolwenci: współczynnik dla liczby absolwentów wynosi 0.0020148, co sugeruje, że z każdym dodatkowym absolwentem stopa bezrobocia wzrasta średnio o 0.002 punkt procentowy. Współczynnik jest statystycznie istotny (p < 0.0001).
Wzrost liczby absolwentów prowadzi do niewielkiego wzrostu stopy bezrobocia.
Nadpodaż kwalifikacji: w regionach z większą liczbą absolwentów może wystąpić nadpodaż osób o podobnych kwalifikacjach, co prowadzi do większej konkurencji o ograniczoną liczbę miejsc pracy.
Dopasowanie umiejętności: może również występować problem niedopasowania umiejętności, gdzie edukacja nie jest dostosowana do potrzeb lokalnego rynku pracy, co zwiększa bezrobocie wśród nowych absolwentów.
Wynagrodzenie: współczynnik dla średniego wynagrodzenia wynosi -0.0015922, wskazując, że wzrost średniego wynagrodzenia o jednostkę skutkuje zmniejszeniem stopy bezrobocia o 0.0016 punktu procentowego. Również ten współczynnik jest statystycznie istotny (p < 0.0001). Wzrost średniego wynagrodzenia w regionie zwykle wiąże się ze spadkiem stopy bezrobocia.
Atrakcyjność regionu: wyższe wynagrodzenia mogą przyciągać wykwalifikowanych pracowników z innych obszarów, co zwiększa zatrudnienie.
Zdrowie ekonomiczne: wyższe wynagrodzenia często korelują z lepszym zdrowiem gospodarczym regionu, które może wspierać tworzenie nowych miejsc pracy i obniżać bezrobocie.
Wypadki: współczynnik dla liczby wypadków w pracy wynosi -0.0090898, sugerując, że wzrost liczby wypadków o jedną jednostkę skutkuje spadkiem stopy bezrobocia o 0.009 punktu procentowego, co jest interesujące i również statystycznie istotne (p < 0.0001).
Intuicyjnie mogłoby się wydawać, że więcej wypadków w miejscach pracy powinno negatywnie wpływać na rynek pracy. Jednak odnotowano negatywną korelację z bezrobociem.
Regulacje i inwestycje: regiony z wyższą liczbą wypadków mogą wprowadzać więcej regulacji bezpieczeństwa i inwestować w lepsze praktyki pracy, co może przyciągać inwestycje i zwiększać zatrudnienie.
Struktura przemysłu: wysoka liczba wypadków może być również wynikiem większej liczby miejsc pracy w sektorach, takich jak budownictwo czy produkcja, które tradycyjnie zatrudniają więcej pracowników, co może obniżać stopę bezrobocia.
Analiza testu Morana I dla reszt modelu regresji:
Obserwowana wartość I Morana wynosi 0.304368938, co ponownie sugeruje dodatnią autokorelację przestrzenną - reszty modelu wykazują skupienie przestrzenne.
Oczekiwana wartość w przypadku braku przestrzennej autokorelacji wynosi -0.003599488. Fakt, że obserwowana wartość jest znacznie wyższa, ponownie podkreśla istotność autokorelacji.
Bardzo niskie p-value (< 2.2e-16) potwierdza statystyczną istotność wyników, odrzucając hipotezę zerową braku autokorelacji przestrzennej.
Test LM
## Please update scripts to use lm.RStests in place of lm.LMtests
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
## data:
## model: lm(formula = stopa ~ absolwenci + wynagrodzenie + wypadki, data
## = merged_data_clean2)
## test weights: listw
##
## statistic parameter p.value
## RSerr 76.4889 1 < 2.2e-16 ***
## adjRSerr 1.3843 1 0.2394
## RSlag 104.0248 1 < 2.2e-16 ***
## adjRSlag 28.9203 1 7.542e-08 ***
## SARMA 105.4091 2 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Przeprowadzono testy diagnostyczne Lagrange’a mnożnika (LM) i Rao w celu zidentyfikowania przestrzennych zależności w resztach modelu regresji liniowej OLS.
TEST | Statystyka | p-value | Interpretacja |
---|---|---|---|
RSerr (LM test for spatial error model) | 80.0393 | < 2.2e-16 | Istotność statystyczna wskazuje na obecność przestrzennego autokorelacji błędu, sugerując, że model może być ulepszony przez dodanie składnika błędu przestrzennego (Spatial Error Model - SEM). |
RSlag (LM test for spatial lag model) | 111.1258 | < 2.2e-16 | Podobnie jak RSerr, bardzo niska p-wartość wskazuje na konieczność rozważenia przestrzennego efektu opóźnienia (Spatial Lag Model - SLM). Ponadto, wyższa wartość statystyki w porównaniu z RSerr może sugerować, że model z przestrzennym opóźnieniem może lepiej pasować do danych. |
adjRSerr (adjusted LM test for spatial error model) | 1.2256 | 0.2683 | Statystyka nie jest istotna, co sugeruje, że po dostosowaniu model błędu przestrzennego może nie być niezbędny. |
adjRSlag (adjusted LM test for spatial lag model) | 32.3121 | 1.31e-08 | Istotna statystycznie wartość sugeruje, że nawet po dostosowaniu, model z przestrzennym opóźnieniem pozostaje właściwy do rozważenia. |
SARMA (test for spatial autoregressive moving average model) | 112.3154 | < 2.2e-16 | Statystyka ta jest najwyższa i wskazuje na możliwość zastosowania modelu SARMA, który łączy zarówno efekty opóźnienia, jak i błędu przestrzennego, dostarczając potencjalnie najpełniejszego modelowania przestrzennych zależności w danych. |
Model SLM vs SEM: Wyniki testów sugerują, że model z przestrzennym opóźnieniem (SLM) może lepiej pasować do danych niż model błędu przestrzennego (SEM), zwłaszcza biorąc pod uwagę wyniki dla RSlag i adjRSlag.
Model SARMA: Najwyższa wartość statystyki dla SARMA sugeruje, że model ten, który łączy efekty przestrzennego opóźnienia i błędu, jest w tym przypadku najlepszym wyborem do modelowania danych, uwzględniającym bardziej złożone przestrzenne zależności.
Modele z interakcjami przestrzennymi
Model SAR
##
## Call:lagsarlm(formula = modelOLS, data = merged_data_clean2, listw = lw,
## zero.policy = TRUE)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.55336 -1.89662 -0.44735 1.54273 12.34867
##
## Type: lag
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 10.32161067 1.49269675 6.9147 4.687e-12
## absolwenci 0.00110267 0.00043452 2.5377 0.0111598
## wynagrodzenie -0.00114273 0.00024217 -4.7186 2.375e-06
## wypadki -0.00548486 0.00151165 -3.6284 0.0002852
##
## Rho: 0.5397, LR test value: 90.932, p-value: < 2.22e-16
## Asymptotic standard error: 0.051152
## z-value: 10.551, p-value: < 2.22e-16
## Wald statistic: 111.32, p-value: < 2.22e-16
##
## Log likelihood: -960.9106 for lag model
## ML residual variance (sigma squared): 8.6404, (sigma: 2.9394)
## Number of observations: 380
## Number of parameters estimated: 6
## AIC: 1933.8, (AIC for lm: 2022.8)
## LM test for residual autocorrelation
## test value: 3.6468, p-value: 0.056178
Model wykazuje dobre dopasowanie i istotność statystyczną większości parametrów, wskazując na znaczącą rolę zmiennych ekonomicznych i społecznych w kształtowaniu lokalnych rynków pracy.
Współczynnik dla liczby absolwentów wynosi 0.0010180 z p-value 0.0125003, sugerując, że wzrost liczby absolwentów o jednostkę wiąże się z niewielkim wzrostem stopy bezrobocia, i jest to statystycznie istotne. Współczynnik dla wynagrodzenia wynosi -0.00141264 z p-valueą 0.944e-06, co wskazuje, że wyższe wynagrodzenie zmniejsza stopę bezrobocia, a wynik jest bardzo istotny statystycznie.
Współczynnik dla liczby wypadków wynosi -0.00503724 z p-value 0.0003651, sugerując, że wzrost liczby wypadków o jedną jednostkę zmniejsza stopę bezrobocia, co jest również istotne statystycznie.
Ocena dopasowania modelu:
Log likelihood: -957.7333 dla modelu SLM w porównaniu do -1008.3 dla modelu OLS, co wskazuje na znaczącą poprawę dopasowania modelu po dodaniu efektu przestrzennego.
AIC: 1927.5 dla SLM w porównaniu do 2023.2 dla OLS, co również wskazuje na lepsze dopasowanie modelu SLM.
Silna wartość parametru rho potwierdza, że istnieje znacząca przestrzenna zależność w stawce bezrobocia między regionami. To sugeruje, że polityki zatrudnienia i gospodarcze w jednym regionie mogą wpływać na wyniki w sąsiednich regionach.
Efektywność modelu SLM: Poprawa w wartościach log likelihood i AIC dla modelu SLM wskazuje, że uwzględnienie przestrzennego opóźnienia daje bardziej adekwatny opis zależności między zmiennymi objaśniającymi a stopą bezrobocia.
Model SEM
##
## Call:errorsarlm(formula = modelOLS, data = merged_data_clean2, listw = lw,
## zero.policy = TRUE)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.44726 -1.97232 -0.64006 1.47456 12.38854
##
## Type: error
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 14.78882743 1.50733317 9.8113 < 2.2e-16
## absolwenci 0.00086496 0.00043034 2.0099 0.044438
## wynagrodzenie -0.00126973 0.00025344 -5.0099 5.445e-07
## wypadki -0.00437183 0.00153135 -2.8549 0.004305
##
## Lambda: 0.57341, LR test value: 77.078, p-value: < 2.22e-16
## Asymptotic standard error: 0.053464
## z-value: 10.725, p-value: < 2.22e-16
## Wald statistic: 115.03, p-value: < 2.22e-16
##
## Log likelihood: -967.8376 for error model
## ML residual variance (sigma squared): 8.8769, (sigma: 2.9794)
## Number of observations: 380
## Number of parameters estimated: 6
## AIC: 1947.7, (AIC for lm: 2022.8)
## OLS SAR SEM
## NA 0.539697482 0.573408077
## (Intercept) 16.997087732 10.321610668 14.788827426
## absolwenci 0.002055591 0.001102667 0.000864959
## wynagrodzenie -0.001586287 -0.001142726 -0.001269727
## wypadki -0.009243321 -0.005484859 -0.004371831
Wyniki modelu SEM:
Współczynnik liczby absolwentów wynosi 0.00079249 z p-value 0.064429, co jest na granicy istotności statystycznej i sugeruje, że zwiększenie liczby absolwentów może nieznacznie zwiększać stopę bezrobocia.
Współczynnik wynagrodzenia wynosi -0.00129641 z p-value 0.06507, wskazując na potencjalny efekt zmniejszania bezrobocia przez wzrost wynagrodzeń, choć wynik również jest bliski granicy istotności statystycznej.
Współczynnik liczby wypadków w miejscach pracy wynosi -0.00409548 z p-value 0.007615, co jest statystycznie istotne i sugeruje, że wzrost liczby wypadków może skutkować obniżeniem stopy bezrobocia.
Ocena dopasowania modelu:
Log likelihood: -966.4534 dla modelu SEM w porównaniu do -957.7333 dla modelu SLM, co wskazuje, że model SEM ma nieco gorsze dopasowanie w porównaniu do modelu SLM.
AIC: 1944.9 dla SEM w porównaniu do 1927.5 dla SLM, co również sugeruje lepsze dopasowanie modelu SLM.
Model SEM jest użyteczny, gdy istnieją przesłanki do przypuszczenia, że przestrzenne zależności wynikają z błędów pomiarowych lub zanieczyszczeń zewnętrznych, które wpływają na model poprzez termin błędu.
Wyniki wskazują, że model SLM może być bardziej odpowiedni dla analizowanej sytuacji, dając lepsze dopasowanie i silniejszą statystyczną istotność współczynników, chociaż SEM również znajduje istotne przestrzenne autokorelacje.
DURBIN
##
## Call:lagsarlm(formula = modelOLS, data = merged_data_clean2, listw = lw,
## type = "mixed", zero.policy = TRUE)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.47980 -1.79870 -0.41729 1.54093 12.47390
##
## Type: mixed
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 9.01197644 2.88028791 3.1288 0.001755
## absolwenci 0.00102062 0.00044771 2.2796 0.022629
## wynagrodzenie -0.00108600 0.00025450 -4.2671 1.98e-05
## wypadki -0.00505082 0.00157092 -3.2152 0.001304
## lag.absolwenci 0.00093036 0.00063515 1.4648 0.142982
## lag.wynagrodzenie 0.00027513 0.00048982 0.5617 0.574323
## lag.wypadki -0.00458039 0.00223665 -2.0479 0.040572
##
## Rho: 0.50691, LR test value: 64.286, p-value: 1.1102e-15
## Asymptotic standard error: 0.056977
## z-value: 8.8967, p-value: < 2.22e-16
## Wald statistic: 79.151, p-value: < 2.22e-16
##
## Log likelihood: -958.5835 for mixed model
## ML residual variance (sigma squared): 8.6068, (sigma: 2.9337)
## Number of observations: 380
## Number of parameters estimated: 9
## AIC: 1935.2, (AIC for lm: 1997.5)
## LM test for residual autocorrelation
## test value: 2.037, p-value: 0.15351
Model ten łączy cechy zarówno modelu przestrzennego opóźnienia (Spatial Lag Model, SLM), jak i modelu błędu przestrzennego (Spatial Error Model, SEM), umożliwiając jednoczesne uwzględnienie zależności przestrzennych w zmiennej zależnej oraz w resztach modelu.
Współczynniki modelu dla zmiennych bezpośrednich:
Liczba absolwentów: Współczynnik wynosi -0.0010910 (p=0.042031), co wskazuje, że zwiększenie liczby absolwentów może mieć niewielki, ale statystycznie istotny, wpływ na zwiększenie stopy bezrobocia.
Wynagrodzenie: Współczynnik wynosi -0.00090316 (p=0.232e-05), sugerując, że wyższe wynagrodzenie skutecznie obniża stopę bezrobocia i jest to wynik bardzo istotny statystycznie.
Liczba wypadków: Współczynnik wynosi -0.00495476 (p=0.001575), co oznacza, że większa liczba wypadków w miejscach pracy związana jest ze zmniejszeniem stopy bezrobocia, co jest także statystycznie istotne.
Współczynniki dla zmiennych przestrzennych (opóźnionych):
Lag.absolwenci: Współczynnik wynosi 0.00101476 (p=0.110746), co jest statystycznie nieistotne.
Lag.wynagrodzenie: Współczynnik wynosi -0.00028797 (p=0.418100), co również jest statystycznie nieistotne.
Lag.wypadki: Współczynnik wynosi -0.00485387 (p=0.030412), sugerując istotny wpływ opóźnionych wypadków na obniżenie stopy bezrobocia.
Ocena dopasowania modelu:
Log likelihood: -955.1119 dla modelu Durbin, co jest porównywalne z innymi modelami przestrzennymi.
AIC: 1928.2, co wskazuje na porównywalne dopasowanie do innych modeli, ale nieco gorsze niż w modelu SLM.
Model Durbin pozwala na bardziej kompleksowe modelowanie zależności przestrzennych, uwzględniając wpływ zarówno zmiennych opóźnionych, jak i autokorelacji przestrzennej w błędach. Jego zastosowanie jest szczególnie przydatne w sytuacjach, gdzie przestrzenne zależności występują równocześnie w zmiennej zależnej oraz w resztach.
Silna wartość rho potwierdza znaczenie uwzględniania przestrzennej zależności w analizach ekonometrycznych związanych ze stopą bezrobocia.
Wynagrodzenie i wypadki mają istotne wpływy zarówno bezpośrednie, jak i przestrzenne na stopę bezrobocia. Efekt wynagrodzenia jest stabilnie negatywny, co wskazuje na jego obniżający wpływ na bezrobocie. Interesujący jest wpływ wypadków, który również jest konsekwent
Podsumowanie i wnioski
Projekt dotyczył analizy przestrzennego wpływu czynników ekonomicznych i społecznych na poziom bezrobocia w regionach NUTS 4 (powiaty) w Polsce. Zmienne objaśniające wykorzystane w analizie to liczba absolwentów szkół ogólnokształcących, średnie wynagrodzenie oraz liczba wypadków w miejscach pracy. W ramach projektu przeprowadzono szereg analiz przestrzennych, wykorzystując różne modele ekonometryczne przestrzenne, takie jak OLS (Ordinary Least Squares), SLM (Spatial Lag Model), SEM (Spatial Error Model) oraz model Durbin (mieszany).
Projekt obejmował kilka kluczowych etapów:
1. Załadunek i przygotowanie danych: Dane dotyczące bezrobocia i czynników ekonomicznych zostały załadowane i połączone z danymi przestrzennymi powiatów w Polsce. Usunięto obserwacje z brakującymi danymi oraz dokonano korekt w wartościach niektórych zmiennych.
2. Wizualizacja danych przestrzennych: Stworzono mapy stopy bezrobocia oraz mapy wskaźnika LISA, które pomogły zilustrować przestrzenne rozkłady i skupienia stopy bezrobocia.
3. Analiza modeli ekonometrycznych: Zastosowano różne modele ekonometryczne, w tym OLS, SLM, SEM oraz model Durbin, aby zrozumieć zależności między zmiennymi a stopą bezrobocia. Każdy model został oceniony pod kątem dopasowania i istotności statystycznej zmiennych.
4. Statystyki I Morana i testy LM: Przeprowadzono testy w celu zidentyfikowania przestrzennej autokorelacji oraz odpowiedniego modelu do uwzględnienia efektów przestrzennych.
Analiza Modeli
Porównanie modeli oparto na wartościach AIC (Akaike Information Criterion), która mierzy dopasowanie modelu, penalizując za liczbę estymowanych parametrów. Model z niższą wartością AIC jest preferowany, gdyż sugeruje lepsze dopasowanie przy zachowaniu prostoty modelu. Wartości AIC dla różnych modeli:
OLS: 2023.2
SAR: 1927.5
SEM: 1944.9
Durbin: 1928.2
Wybór Najlepszego Modelu
Zgodnie z kryterium informacyjnym Akaike (AIC), najlepszy model to Model SAR (Spatial Autoregressive Model), który osiągnął najniższą wartość AIC równą 1927.5. Ten wynik wskazuje, że model SAR jest najbardziej efektywny w wyjaśnianiu przestrzennych zależności bezrobocia przy jednoczesnym minimalizowaniu liczby estymowanych parametrów.
Dlaczego Model SAR jest najlepszy?
Model SAR skutecznie integruje efekty przestrzenne w zmiennej zależnej, co jest kluczowe w analizie danych przestrzennych, gdzie zależności między obserwacjami są istotne. Przez uwzględnienie opóźnień przestrzennych w zmiennej zależnej, model SAR lepiej od innych modeli odzwierciedla realne zjawiska ekonomiczne, które są związane z lokalizacją i interakcjami między regionami.
Projekt analizy przestrzennej stopy bezrobocia w powiatach w Polsce dostarczył istotnych wglądów w to, jak czynniki ekonomiczne i społeczne wpływają na rynek pracy na poziomie lokalnym. Wykorzystując zaawansowane techniki analizy przestrzennej, udało się zidentyfikować zarówno statystycznie istotne zmienne wpływające na bezrobocie, jak i skupienia regionów o podobnych wskaźnikach. Najlepsze rezultaty dopasowania i interpretacji zjawisk przestrzennych dostarczył model SAR, który skutecznie uwzględnił przestrzenne zależności. Wyniki projektu podkreślają potrzebę regionalnie zróżnicowanych polityk ekonomicznych, które mogą skuteczniej adresować lokalne wyzwania i przyczynić się do zrównoważonego rozwoju rynku pracy. Dodatkowo, projekt ujawnił znaczenie integracji danych przestrzennych i ekonometrycznych w analizie rynku pracy, co umożliwia głębsze zrozumienie dynamik regionalnych. Dzięki szczegółowym mapom stopy bezrobocia oraz wskaźnikom lokalnej autokorelacji Morana (LISA), można było precyzyjnie wskazać obszary wymagające szczególnej uwagi, zwłaszcza te z silnie skoncentrowanym bezrobociem. Praktyczne implikacje tych odkryć są znaczące; mogą one pomóc lokalnym władzom i organizacjom w lepszym planowaniu i wdrażaniu działań interwencyjnych, które są dostosowane do specyfiki i potrzeb poszczególnych powiatów. To z kolei może prowadzić do bardziej efektywnego alokowania zasobów i poprawy warunków ekonomicznych w najbardziej dotkniętych regionach.