1 analisi svolte

  1. partecipazione al voto confrontando regionali 2020 e 2024.  Sono due elezioni dello stesso “tipo”, in generale si può ritenere che le motivazioni alla partecipazione siano le medesime.

    • l’obiettivo è valutare gli elementi che influenzano i diversi pattern di voto nelle due occasioni (voto-voto, voto-astensione, astensione-voto e astensione-astensione)
    • due analisi:
      1. Regressione Logistica Multinomiale: come covariate ho usato alcune caratteristiche socio-demografiche, la percezione del territorio e la classificazione Urbano-Rurale della regione ER
      2. Bayesian Multilevel Multivariate Logistic Regression (BMMLR): in questo caso uso come effetto casuale territoriale i SLL, come covariate, oltre a quelle del modello precedente, inserisco anche variabili a livello di SLL (indice di vecchiaia, di dipendenza, reddito medio)
  2. partecipazione al voto nelle 5 tornate elettorali (politiche 2018, regionali 2020, politiche 2022, europee 2024 e regionali 2024)
    si ipotizza che le motivazioni a voto/astensione siano uguali, anche se europee e regionali possono rientrare nella categoria delle “second-order election”

    • obiettivo: determinati dell’astensione usando una struttura panel dei dati
    • analisi:
      1. Modello Logit a Equazioni di Stima Generalizzate (GEE Generalized Estimating Equations): variabile dipendente voto=0/astensione=1 sulle 5 tornate per ciascun intervistato, covariate: quelle del precedente modello a.; rispondono alla domanda: In media, nella popolazione, quali fattori aumentano l’astensione?
      2. Longitudinal Bayesian Multilevel Multivariate Logistic Regression (LBMMLR): usando una random intercept a livello di unità modella l’eterogeneità individuale, risponde alla domanda: Alcune persone sono più propense ad astenersi di altre?.

In queste prime analisi ho considerato come covariate le caratteristiche socio-demografiche:

  • età (age)
  • condizione professionale (condprf)
  • percezione della condizione economica (Q26)
  • percezione del tipo di territorio Urbano-Rurale (Q29)
  • percezione del tipo di territorio Centrale-Periferico (Q30)
  • codifica regionale del tipo di territorio A:aree urbane e periurbane,…,D=aree problemi di sviluppo (codAreaRurale)
  • codice Sisitema Locale del Lavoro per analisi multilevel (SLL.2021)


2 confronto regionali 2020 - 2024

La variabile dipendente: variazione dei comportamenti

Ho considerato le due elezioni regionali 2020 e 2024 e definito la variabile var2024 con le seguenti modalità:
VV: votante in entrambe le elezioni
AV: astenuto nel 2020 e votante nel 2024
VA: votante nel 2020 e astenuto nel 2024
AA: astenuto in entrambe le elezioni

Problema di classificazione del voto nel 2020

Al momento dell’indagine, nel 2024, chi ha dichiarato di avere 22 anni avrebbe potuto avere 18 anni nel 2020 e quindi poter votare.
Ci sono 13 casi con età=22 al momento dell’indagine:

rispondenti con 22 anni nel 2024 per partecipazione al voto nelle diverse tornate elettorali

Respondent_Serial

resp_age

pol18

reg20

pol22

eur24

reg24

manc

359

21

no

no

si

si

si

0

372

21

no

no

no

no

no

0

400

21

no

no

si

si

si

0

459

21

no

no

si

nr

no

1

502

21

no

no

no

si

no

0

519

21

no

no

si

si

si

0

1122

21

si

no

no

no

no

0

1734

21

no

no

no

no

no

0

1742

21

no

no

si

si

si

0

1935

21

no

si

no

no

si

0

1937

21

no

no

si

si

si

0

2035

21

si

si

si

si

si

0


Alcuni dichiarano di avere votato alle regionali del 26 gennaio 2020, altri indicano no; non sappiamo però se quel no è una vera astensione o se non abbia votato perchè non aveva 18 anni.

In generale ho comunque adottato la regola per cui: età.2024 < (2024 - anno.elezione) -> ne

Ho considerato ne (non maggiorenne) nel 2020 tutti quelli che hanno 21 anni o meno al momento dell’indagine:
reg20=ne se resp_age < 22

Problema simile per il voto alle politiche del 2018 (4 marzo 2018) e del 2020 (25 settembre 2022):
pol18=ne se resp_age < 24
pol22=ne se resp_age < 20

Nel caso del confronto tra regionali 2020 e 2024 abbiamo:

regionali 2024

reg2020

si

no

Sum

Freq.

si

419

257

676

no

23

206

229

nr

11

59

70

ne

13

16

29

Sum

466

538

1004

Row %

si

62.0

38.0

100.0

no

10.0

90.0

100.0

nr

15.7

84.3

100.0

ne

44.8

55.2

100.0

Sum

46.4

53.6

100.0

col %

si

89.9

47.8

67.3

no

4.9

38.3

22.8

nr

2.4

11.0

7.0

ne

2.8

3.0

2.9

Sum

100.0

100.0

100.0


Flusso dei Voti tra elezioni regionali 2020 e 2024

Flusso dei Voti tra elezioni regionali 2020 e 2024


Dall’analisi sono stati esclusi i casi per cui non è disponibile il dato 2020 (‘ne’ e ‘nr’).


Voto/Astenzione regionale 2020 - 2024

var2024

Freq

%

VV

419

46.3

AV

23

2.5

VA

257

28.4

AA

206

22.8

Total

905

100.0


2.1 modello multinomiale

library(nnet)
levels(df.ast.SLL.v$codAreaRurale) <- LETTERS[1:4]
mod_multinom <- multinom(var2024 ~ condprf + 
                           resp_gender + resp_age + TitSudio + 
                           Q26 + 
                           Q30 + Q29 + codAreaRurale, 
                         data = df.ast.SLL.v, 
                         weights = weight,
                         trace = FALSE)

term

AV

VA

AA

condprf: altro auton.

-12.20*** [-12.20,-12.20]

1.13. [ -0.09, 2.35]

2.05** [ 0.54, 3.56]

condprf: dirigente/quadro

0.33 [ -2.01, 2.68]

0.69 [ -0.68, 2.07]

-0.30 [ -2.49, 1.90]

condprf: impiegato

-0.59 [ -2.63, 1.45]

1.00. [ 0.00, 1.99]

0.48 [ -0.92, 1.87]

condprf: insegnante

2.44* [ 0.08, 4.80]

1.06 [ -0.59, 2.70]

1.27 [ -0.71, 3.26]

condprf: operaio

-0.96 [ -3.36, 1.44]

1.22* [ 0.17, 2.26]

1.52* [ 0.11, 2.93]

condprf: disoccupati

-1.00 [ -4.13, 2.13]

1.41* [ 0.18, 2.64]

2.44** [ 0.93, 3.95]

condprf: studente

0.44 [ -2.08, 2.95]

0.15 [ -1.76, 2.06]

1.08 [ -0.63, 2.80]

condprf: casalinga

0.92 [ -1.75, 3.59]

1.39* [ 0.27, 2.52]

2.03** [ 0.53, 3.54]

condprf: pensionato

-0.67 [ -3.49, 2.15]

0.67 [ -0.36, 1.69]

1.35. [ -0.09, 2.78]

resp_gender: Donna

-0.66 [ -1.73, 0.41]

0.21 [ -0.15, 0.56]

0.01 [ -0.38, 0.40]

resp_age

-0.09*** [ -0.14, -0.04]

0.00 [ -0.01, 0.02]

-0.05*** [ -0.07, -0.03]

TitSudio: Medio

-0.52 [ -1.90, 0.85]

0.69*** [ 0.28, 1.11]

-0.24 [ -0.69, 0.21]

TitSudio: Alto

-1.17 [ -2.78, 0.43]

0.07 [ -0.50, 0.63]

-0.85* [ -1.51, -0.19]

Q26: con tranquillità

0.28 [ -1.92, 2.48]

-0.43 [ -1.55, 0.69]

0.29 [ -1.10, 1.68]

Q26: avverto difficoltà

-0.20 [ -2.59, 2.20]

0.22 [ -0.90, 1.34]

0.92 [ -0.46, 2.31]

Q26: arrivo a fine mese con molte difficoltà

0.78 [ -1.85, 3.41]

0.88 [ -0.30, 2.06]

0.81 [ -0.65, 2.28]

Q26: mi sento povero e non arrivo mai a fine mese

1.23 [ -1.99, 4.45]

1.07 [ -0.27, 2.40]

1.18 [ -0.43, 2.78]

Q26: preferisco non rispondere

0.08 [ -4.49, 4.65]

2.19* [ 0.45, 3.92]

2.11* [ 0.09, 4.14]

Q30: Intermedio

0.55 [ -0.65, 1.75]

0.08 [ -0.39, 0.54]

0.03 [ -0.49, 0.55]

Q30: Periferico

-0.34 [ -2.15, 1.47]

0.56* [ 0.00, 1.11]

0.16 [ -0.46, 0.77]

Q29: Suburbano

-0.92 [ -2.34, 0.50]

-0.21 [ -0.68, 0.26]

0.16 [ -0.35, 0.68]

Q29: Rurale

-0.74 [ -2.62, 1.13]

-0.47 [ -1.06, 0.11]

0.08 [ -0.55, 0.71]

codAreaRurale: B

-0.47 [ -1.89, 0.96]

0.04 [ -0.40, 0.48]

-0.15 [ -0.63, 0.33]

codAreaRurale: C

0.65 [ -0.57, 1.87]

0.13 [ -0.32, 0.59]

-0.31 [ -0.82, 0.20]

codAreaRurale: D

0.17 [ -2.12, 2.45]

-0.30 [ -1.12, 0.51]

-0.67 [ -1.54, 0.21]



Il gruppo di riferimento è sempre VV (voto 2020 - voto 2024).

  1. Profilo AA (Astenuti Cronici 2020 & 2024)

    Condizione Professionale: I disoccupati hanno il coefficiente più alto (2.44), seguiti dalle casalinghe (2.03). Questo indica che la lontananza dal mercato del lavoro attivo è il principale motore dell’astensione persistente.

    Istruzione: L’alto titolo di studio è un potentissimo “scudo” contro l’astensione (−0.85).

    Economia (Q26): Chi si sente povero (1.17) o ha difficoltà (0.81 e 0.92) ha una probabilità significativamente maggiore di non partecipare mai, confermando che l’astensione cronica in Italia ha una forte base censuaria.

  2. Profilo VA (L’Abbandono: Voto 2020 → Astensione 2024)

    Geografia (Q30): Chi vive in periferia (0.56) ha una propensione maggiore ad abbandonare il voto.

    Economia: Anche qui, le difficoltà economiche pesano. Chi arriva a fine mese con molte difficoltà (0.88) ha smesso di votare più frequentemente rispetto a chi sta bene.

    Professione: Le casalinghe (1.39) e gli operai (1.22) mostrano i tassi di abbandono più alti. Questo suggerisce che il voto del 2020 (regionali) era riuscito a mobilitare categorie che nel 2024 sono tornate a rifugiarsi nel non-voto.

  3. Profilo AV (Il Ritorno: Astensione 2020 → Voto 2024)

    Insegnanti: Spiccano con un coefficiente di 2.44. Sono la categoria che più di ogni altra è “rientrata” attivamente al voto.

    Età: L’effetto è negativo e costante (−0.08 per ogni anno in più). Significa che i nuovi votanti sono i giovani. Più si invecchia, più è difficile che un astenuto decida di tornare alle urne (cristallizzazione del comportamento).

    Genere: Le donne (−0.66) hanno meno probabilità degli uomini di passare dall’astensione al voto. In altre parole, la mobilitazione di “ritorno” è stata più maschile che femminile.


2.2 modello multilivello BMMLR

library(brms)
my_priors <- c(
  # Prior per i coefficienti di ogni categoria di risposta
  set_prior("normal(0, 5)", class = "b", dpar = "muAA"),
  set_prior("normal(0, 5)", class = "b", dpar = "muAV"),
  set_prior("normal(0, 5)", class = "b", dpar = "muVA"),
  # Prior per le deviazioni standard degli effetti casuali (SLL)
  set_prior("student_t(3, 0, 2.5)", class = "sd", dpar = "muAA", group = "SLL.2021"),
  set_prior("student_t(3, 0, 2.5)", class = "sd", dpar = "muAV", group = "SLL.2021"),
  set_prior("student_t(3, 0, 2.5)", class = "sd", dpar = "muVA", group = "SLL.2021")
)
mod_multinom_multilevel <- brm(
  formula = var2024 | weights(weight) ~ condprf + Q26 + Q29+ Q30 +
    resp_gender+resp_age+TitSudio + # ETACLASSI
    scale(Indice.di.Vecchiaia)+
    scale(Indice.di.Dipendenza.Totale) +
    scale(Reddito.IRPEF.resid) +
    scale(Add.resid.2020) +
    scale(VA.add.2020)+
    scale(Add.tecno.2020)+
    (1 | SLL.2021),
  data = df.ast.SLL.v,
  family = categorical(),
  prior = my_priors,
  chains = 4, 
  iter = 2000, 
  cores = 4, 
  silent = 2,
  control = list(adapt_delta = 0.95)
)
# save(mod_multinom_multilevel,file = "elab/mod_multinom_multilevel.RData")
Transizioni Elettorali 2020-20241
Modello Multilivello Bayesiano Categoriale1
Variabile
AV: Astenuto → Votante
VA: Votante → Astenuto
AA: Astenuto sempre
Coeff. IC 95% Coeff. IC 95% Coeff. IC 95%
Intercetta 1.42 [-2.86, 5.36] -2.04* [-3.95, -0.17] -0.10 [-2.39, 2.04]
Altro autonomo -3.99 [-11.03, 0.81] 1.10 [-0.15, 2.34] 1.93* [0.53, 3.48]
Dirigente/Quadro 0.56 [-1.84, 3.06] 0.60 [-0.86, 2.03] -0.81 [-3.38, 1.40]
Impiegato -0.46 [-2.42, 1.70] 0.95 [-0.04, 1.97] 0.29 [-0.94, 1.72]
Insegnante 2.54* [0.07, 5.10] 1.23 [-0.49, 2.92] 0.72 [-1.32, 2.72]
Operaio -1.06 [-3.52, 1.35] 1.23* [0.19, 2.32] 1.30* [0.02, 2.83]
Disoccupato -1.20 [-5.07, 2.04] 1.25* [0.08, 2.51] 2.44* [1.01, 4.06]
Studente 0.72 [-1.70, 3.38] -0.11 [-2.24, 1.73] 0.91 [-0.74, 2.64]
Casalinga 0.84 [-2.01, 3.60] 1.46* [0.34, 2.62] 1.77* [0.38, 3.30]
Pensionato -0.72 [-3.78, 2.06] 0.63 [-0.38, 1.67] 1.18 [-0.12, 2.68]
Con tranquillità 0.38 [-1.73, 2.74] -0.54 [-1.64, 0.66] 0.44 [-0.87, 1.93]
Avverto difficoltà -0.34 [-2.70, 2.25] 0.28 [-0.82, 1.47] 1.07 [-0.22, 2.54]
Molte difficoltà 0.82 [-1.78, 3.60] 0.86 [-0.34, 2.10] 1.04 [-0.37, 2.62]
Mi sento povero 0.91 [-2.44, 4.10] 1.22 [-0.12, 2.59] 1.26 [-0.27, 2.85]
Preferisco non rispondere -1.04 [-6.91, 3.27] 2.31* [0.61, 4.26] 2.38* [0.36, 4.48]
Suburbano -0.94 [-2.45, 0.45] -0.29 [-0.78, 0.17] 0.06 [-0.46, 0.59]
Rurale -0.91 [-3.00, 0.95] -0.50 [-1.08, 0.08] -0.17 [-0.79, 0.44]
Intermedio 0.61 [-0.67, 1.95] 0.09 [-0.41, 0.59] 0.05 [-0.50, 0.62]
Periferico -0.44 [-2.49, 1.40] 0.61* [0.03, 1.21] 0.23 [-0.43, 0.88]
Donna -0.69 [-1.90, 0.43] 0.22 [-0.17, 0.61] 0.01 [-0.41, 0.44]
Età -0.09* [-0.15, -0.04] 0.00 [-0.02, 0.02] -0.05* [-0.07, -0.03]
Titolo Medio -0.60 [-2.03, 0.94] 0.81* [0.35, 1.27] -0.19 [-0.67, 0.28]
Titolo Alto -1.12 [-2.82, 0.66] 0.02 [-0.60, 0.63] -0.87* [-1.57, -0.17]
Indice Vecchiaia -0.65 [-2.59, 1.31] 1.25* [0.17, 2.49] -0.09 [-1.00, 0.65]
Indice Dipendenza Totale -0.39 [-2.79, 1.43] -1.33* [-2.60, -0.34] -0.42 [-1.15, 0.33]
Reddito IRPEF 0.57 [-2.06, 3.25] -0.11 [-1.76, 1.39] 0.54 [-0.49, 1.82]
Addetti residenti 2020 -1.01 [-3.63, 0.92] -0.16 [-1.30, 0.74] -0.45 [-1.32, 0.29]
VA addetti 2020 -0.32 [-1.81, 1.34] 0.58 [-0.28, 1.59] -0.38 [-1.10, 0.19]
Addetti tecnologici 2020 -0.48 [-2.54, 1.54] 0.08 [-1.00, 1.19] -0.42 [-1.31, 0.30]
N = 940 osservazioni; 33 SLL; 4000 draws post-warmup
1 * = intervallo di credibilità al 95% non include lo zero


std.Dev per gruppo e ICC

.

Estimate

ICC

AV

1.2767622

0.3313262

VA

1.1820008

0.2980857

AA

0.6052502

0.1001937



  1. Il fattore generazionale (resp_age)
    Il dato sull’età è estremamente significativo in due profili su tre:

    • Il recupero del voto (muAV): Il coefficiente è negativo e netto (-0.09). Significa che per ogni anno in più di età, la probabilità che un astenuto torni al voto diminuisce drasticamente. La mobilitazione “di ritorno” è un fenomeno quasi esclusivamente giovanile.

    • L’astensione cronica (muAA): Anche qui il valore è negativo (-0.05). Gli anziani che non votano oggi tendono a essere persone che non votavano già in passato; tuttavia, l’astensione persistente è più probabile tra le coorti più giovani, segnale di un progressivo distacco democratico nelle nuove generazioni.

  2. Marginalità sociale e professionale

    • Disoccupati e Casalinghe: Restano le categorie con la più alta probabilità di astensione cronica (muAA: 2.44 e 1.77).

    • Operai: Nel profilo muAA, l’intervallo di confidenza [0.02, 2.83] è ora interamente positivo. Questo significa che, a parità di altre condizioni, un operaio ha una probabilità statisticamente superiore di essere un astenuto cronico rispetto agli occupati nel settore terziario/uffici.

    • Insegnanti: Si confermano come l’unica categoria professionale con una spinta fortissima al rientro al voto (2.54 in muAV).

  3. La dimensione economica (Q26)
    Nonostante l’inserimento di variabili di reddito IRPEF territoriale, la percezione soggettiva della povertà resta un predittore più forte:

    • Chi “si sente povero” ha coefficienti positivi in tutti i profili di astensione. In particolare, la categoria “Preferisco non rispondere” (muVA: 2.31) suggerisce che il rifiuto di parlare della propria condizione economica si accompagna spesso al rifiuto del modulo di voto.
  4. L’impatto del territorio

    1. Effetto della ruralità (Q29 e Q30)
      Il modello indica una distinzione tra centro e zone periferiche:

      • Q30 Periferico (muVA: 0.61): Chi vive in aree classificate come periferiche ha una probabilità significativamente più alta di aver abbandonato il voto tra il 2020 e il 2024. La perifericità geografica si traduce in marginalità politica.

      • Q29 Suburbano e Rurale (muAV: −0.94 e −0.91): Nelle zone non urbane è molto più difficile “recuperare” gli astenuti. Il rientro al voto è un fenomeno prevalentemente cittadino.

    2. La variabilità tra territori (SD mu_Intercept)
      Consente di valutare quanto cambia la probabilità di voto spostandoci da un SLL all’altro:

      • muAV (Il recupero del voto, sd=1.28): È il valore più alto. Significa che la probabilità di tornare a votare dipende fortemente da dove si vive. Esistono “SLL dinamici” dove la mobilitazione è stata efficace e “SLL stagnanti” dove chi non ha votato nel 2020 è rimasto a casa anche nel 2024.

      • muVA (L’abbandono del voto, sd=1.18): Anche la disillusione è territoriale. Alcuni contesti locali sembrano aver spinto gli elettori attivi del 2020 a rinunciare al voto nel 2024.

      • muAA (L’astensione cronica, sd=0.61): È il valore più basso. Questo suggerisce che l’astensione persistente è un fenomeno sociale e individuale molto più che territoriale: le ragioni per cui non si vota mai sono le stesse in tutta la regione.

    3. L’effetto “Contesto” (Variabili Scalate)

      • Indice di Vecchiaia territoriale (muVA: 1.25): Questo è un dato cruciale. Indica che vivere in un SLL con una popolazione anziana aumenta la probabilità che anche gli altri cittadini smettano di votare. È un effetto di “clima sociale”: nei territori meno vitali demograficamente, la partecipazione tende a scivolare verso l’astensione.

      • Indice di Dipendenza Totale (muVA: −1.33): Al contrario, i territori con un alto carico di dipendenza (più giovani e anziani rispetto alla popolazione attiva) mostrano una maggiore resistenza all’astensione. Spesso questi sono territori con reti familiari più forti che fungono da incentivo alla partecipazione.

      • Reddito IRPEF residuo (muAV: 0.57): Nei territori dove il reddito medio è più alto (al netto delle variabili individuali), la probabilità di recuperare elettori astenuti è maggiore. La ricchezza del territorio funge da “molla” per la partecipazione.



3 analisi dati panel

I dati sono stati ristrutturati in formato “long” dove per ogni id rispondente è presente un record per ognuna delle elezioni di cui ha riportato se ha votato o meno (variabile voto_bin: 0=voto, 1=astensione).

Una volta ricostruita la forma “long” sono stati esclusi i casi in cui ci sono “ne” (non ancora maggiorenne) e “nr” (non ricordo)

estratto dataset in analisi

id

voto_bin

voto_lag

time

tipo.elez

anno

age

condprf

8

0

1

pol

2018

40

operaio

8

0

0

2

reg

2020

42

operaio

8

0

0

3

pol

2022

44

operaio

8

0

0

4

eur

2024

46

operaio

8

0

0

5

reg

2024

46

operaio

58

1

2

reg

2020

38

casalinga

58

0

1

3

pol

2022

40

casalinga

58

0

0

4

eur

2024

42

casalinga

58

1

0

5

reg

2024

42

casalinga

246

1

1

pol

2018

50

disoccupati

246

1

1

3

pol

2022

54

disoccupati

246

1

1

4

eur

2024

56

disoccupati

246

0

1

5

reg

2024

56

disoccupati


Relativamente alle covariate, l’unica che varia per id è l’età, che ho aggiornato per tornata elettorale tenendo conto dell’età dichiarata nel 2024. Le altre sono state considerate costanti, anche se nel periodo 2018-2024 può essere cambiata la condizione professionale, la condizione economica o possono avere cambiato residenza.


Flusso dei Voti tra le elezioni dal 2018 al 2024 per partecipazione al voto alle regionali del 2024

Flusso dei Voti tra le elezioni dal 2018 al 2024 per partecipazione al voto alle regionali del 2024


Flusso dei Voti tra le elezioni dal 2018 al 2024 per tipologia di partecipazione

Flusso dei Voti tra le elezioni dal 2018 al 2024 per tipologia di partecipazione


3.1 modello GEE Generalized Estimating Equations

model_gee <- geeglm(
  voto_bin ~ time + age + condprf + Q26 + Q29 + Q30 + TitStudio + codAreaRurale,
  data = zdf_long,
  id = id,
  weights = weight,
  family = binomial(link = "logit"),
  corstr = "exchangeable"
)

Riguardo alla struttura di correlazione ho adottato “exchangeable” (si assume che tutte le osservazioni dello stesso soggetto abbiano la stessa correlazione); le altre opzioni (“independence”, “ar1”, “unstructured” ) forniscono valori di QIC (Quasi Information Criterion) superiori.


term

Estimate

Std.err

OR

OR_lower

OR_upper

p.value

signif

(Intercept)

-1.120

0.619

0.326

0.097

1.098

0.070

.

time

0.420

0.034

1.522

1.424

1.626

<0.001

***

age

-0.040

0.007

0.961

0.949

0.973

<0.001

***

condprf: altro auton.

1.809

0.441

6.103

2.570

14.496

<0.001

***

condprf: dirigente/quadro

0.399

0.541

1.490

0.516

4.302

0.461

condprf: impiegato

0.642

0.378

1.900

0.906

3.986

0.089

.

condprf: insegnante

0.043

0.655

1.044

0.289

3.772

0.948

condprf: operaio

1.144

0.393

3.140

1.454

6.784

0.004

**

condprf: disoccupati

1.696

0.445

5.454

2.282

13.036

<0.001

***

condprf: studente

0.292

0.502

1.340

0.501

3.580

0.560

condprf: casalinga

1.697

0.439

5.457

2.308

12.907

<0.001

***

condprf: pensionato

1.290

0.408

3.633

1.632

8.091

0.002

**

Q26: con tranquillità

-0.111

0.417

0.895

0.395

2.024

0.789

Q26: avverto difficoltà

0.209

0.415

1.232

0.546

2.780

0.616

Q26: arrivo a fine mese con molte difficoltà

0.309

0.435

1.361

0.581

3.193

0.478

Q26: mi sento povero e non arrivo mai a fine mese

0.887

0.529

2.429

0.861

6.848

0.093

.

Q26: preferisco non rispondere

0.713

0.527

2.041

0.727

5.732

0.176

Q29: Suburbano

-0.010

0.187

0.990

0.686

1.430

0.959

Q29: Rurale

0.019

0.223

1.019

0.658

1.578

0.933

Q30: Intermedio

-0.049

0.187

0.952

0.659

1.374

0.793

Q30: Periferico

0.214

0.215

1.239

0.813

1.886

0.319

TitStudio: Medio

-0.360

0.171

0.698

0.499

0.975

0.035

*

TitStudio: Alto

-0.772

0.242

0.462

0.287

0.743

0.001

**

codAreaRurale: B

-0.086

0.179

0.918

0.646

1.303

0.631

codAreaRurale: C

-0.195

0.193

0.823

0.563

1.202

0.313

codAreaRurale: D

-0.830

0.379

0.436

0.208

0.916

0.028

*

Correlazione intra-cluster (α)

0.639

0.156

<0.001

Parametro di scala (φ)

1.119

0.234

<0.001

Number of clusters

1004

Maximum cluster size

5


Questo modello fornisce una prospettiva “population-averaged”, ovvero descrive come varia la probabilità media di astensione nella popolazione al variare delle caratteristiche socio-demografiche, tenendo conto della correlazione interna dovuta alle misure ripetute sugli stessi individui (id).

Principali risultati:

  1. Dinamica Temporale e Generazionale

    • Tempo (time: 0.42, p<2e−16): ha un effetto positivo estremamente significativo. Con il passare delle ondate, la probabilità media di astenersi nella popolazione aumenta.

    • Età (age: -0.04, p<0.001): L’effetto è negativo e significativo. L’aumento dell’età è un fattore protettivo contro l’astensione: le coorti più anziane mostrano una partecipazione al voto sistematicamente più alta rispetto ai giovani.

  2. Condizione Professionale e Sociale (I veri driver)
    il modello mostra i risultati più netti, identificando categorie con una propensione all’astensione molto elevata rispetto alla categoria di riferimento:

    • Esclusione e Marginalità: I disoccupati (1.70) e le casalinghe (1.70) presentano i coefficienti positivi più alti. Questo suggerisce che il distacco dal mercato del lavoro si riflette in un forte distacco dal processo democratico.

    • Anche gli operai (1.14) e i lavoratori autonomi (1.81) mostrano un’astensione significativamente più alta della media.

    • Istruzione: il titolo di studio è un predittore importante. Sia il titolo Medio (-0.36) che quello Alto (-0.77) riducono significativamente l’astensione. Chi ha un’istruzione elevata ha quasi il doppio della probabilità di partecipare rispetto a chi ha titoli bassi.

  3. Fattori Economici e Territoriali

    • Disagio Economico (Q26): Solo la categoria estrema (“mi sento povero”, 0.89) sfiora la significatività statistica (p=0.09). Questo suggerisce che, una volta controllata la condizione professionale e l’istruzione, la percezione soggettiva della povertà aggiunge poco potere spiegativo, a meno che non sia cronica.

    • Geografia (Q29, Q30, codAreaRurale): Il territorio conta poco. Suburbano, Rurale o Periferico non mostrano differenze significative. L’unica eccezione è l’Area Rurale D “aree problemi di sviluppo” (-0.83), che mostra una partecipazione sorprendentemente più alta, suggerendo forse dinamiche comunitarie locali forti in aree specifiche.

  4. Struttura di Correlazione e Diagnostica

    • Alpha (0.64): Indica una correlazione intra-cluster moderatamente alta. Significa che la scelta di un individuo di votare o meno al tempo t è fortemente legata a quanto fatto al tempo t−1. Esiste una forte “inerzia comportamentale” nell’elettore.

    • Clusters: Hai 1004 individui seguiti per un massimo di 5 ondate. La solidità dei Wald test indica che i coefficienti sono stabili nonostante la natura binaria dei dati.


3.2 modello LBMMLR

In questo caso ho usato una Regressione Logistica Multivariata Multilivello Bayesiana a Effetti Casuali per Dati Panel per analizzare la propensione individuale all’astensione ed individuarle le principali determinanti.

In particolare ho usato due specidicazioni del modello:

  • Modello a Intercetta Casuale (Random Intercept) in cui si assume che ogni individuo possieda una propensione di base all’astensione, ma che l’effetto del tempo e degli altri predittori sia costante tra i soggetti.

  • Modello a Pendenze Casuali (Random Slope) che si basa sull’ipotesi che l’astensionismo non colpisca la popolazione in modo uniforme, ma segua traiettorie soggettive.

In entrambi i modelli, per controllare l’eventuale eterogeneità territoriale, è stata inserita un’ulteriore intercetta casuale a livello di Sistema Locale del Lavoro (SLL.2021). Questo permette di depurare gli effetti dei predittori socio-economici individuali da possibili distorsioni derivanti dal contesto geografico.

Per garantire la stabilità delle stime e prevenire fenomeni di overfitting o instabilità numerica, sono stati adottati prior debolmente informativi.

prior_1_b <- c(
  # Per i coefficienti fissi (b)
  set_prior("normal(0, 1.5)", class = "b"), 
  # Per l'intercetta
  set_prior("student_t(3, 0, 2.5)", class = "Intercept"),
  # Per le deviazioni standard (sd)
  set_prior("exponential(1)", class = "sd")
)
# Modello a Intercetta Casuale
model_brm_1_b <- brm(
  voto_bin | weights(weight) ~ time + age + condprf + Q26 + Q29 + Q30 +
    TitStudio + codAreaRurale + (1 | id) + (1 | SLL.2021),
  data = zdf_long,
  family = bernoulli(link = "logit"),
  prior = prior_1_b,
  iter = 2000,warmup = 500,
  chains = 4,cores = 4,seed = 123,
  backend = "cmdstanr",
  control = list(adapt_delta = 0.95),
  silent = 2,refresh = 0
)
# Modello a Pendenze Casuali
model_brm_2_b <- brm(
  voto_bin | weights(weight) ~ time + age + condprf + Q26 + Q29 + Q30 +
    TitStudio + codAreaRurale + (1 + time | id) + (1 | SLL.2021),
  data = zdf_long,
  family = bernoulli(link = "logit"),
  prior = prior_1_b,
  iter = 2000,warmup = 500,
  chains = 4,cores = 4,seed = 123,
  backend = "cmdstanr",
  control = list(adapt_delta = 0.95),
  silent = 2,refresh = 0
)
save(model_brm_1_b,file = "model_brm_1_b.RData")
save(model_brm_2_b,file = "model_brm_2_b.RData")


Parameter

M1 [95% CrI]

M2 [95% CrI]

Intercept

-1.39 [-3.25, 0.53]

-5.34 [-7.95, -2.74]

*

time

0.95 [0.86, 1.06]

*

1.67 [1.40, 1.97]

*

age

-0.09 [-0.11, -0.06]

*

-0.08 [-0.11, -0.05]

*

condprf: altroauton.

1.51 [0.19, 2.79]

*

1.63 [0.25, 2.98]

*

condprf: dirigenteDquadro

-0.46 [-2.03, 1.04]

-0.54 [-2.20, 1.08]

condprf: impiegato

-0.29 [-1.26, 0.67]

-0.32 [-1.37, 0.70]

condprf: insegnante

0.33 [-1.39, 2.02]

0.01 [-1.79, 1.84]

condprf: operaio

0.46 [-0.61, 1.49]

0.61 [-0.49, 1.68]

condprf: disoccupati

2.00 [0.77, 3.22]

*

2.11 [0.76, 3.46]

*

condprf: studente

-0.71 [-2.15, 0.73]

-0.83 [-2.37, 0.69]

condprf: casalinga

1.75 [0.51, 2.99]

*

1.75 [0.41, 3.10]

*

condprf: pensionato

0.72 [-0.44, 1.87]

0.44 [-0.78, 1.64]

Q26: contranquillità

-0.51 [-1.62, 0.61]

-0.86 [-2.07, 0.34]

Q26: avvertodifficoltà

-0.03 [-1.15, 1.12]

-0.05 [-1.25, 1.15]

Q26: arrivoafinemeseconmoltedifficoltà

0.54 [-0.67, 1.76]

0.64 [-0.69, 2.01]

Q26: misentopoveroenonarrivomaiafinemese

0.87 [-0.54, 2.33]

0.85 [-0.73, 2.46]

Q26: preferiscononrispondere

0.61 [-1.09, 2.25]

1.25 [-0.61, 3.08]

Q29: Suburbano

-0.03 [-0.71, 0.69]

0.01 [-0.79, 0.80]

Q29: Rurale

0.01 [-0.83, 0.84]

0.00 [-0.98, 1.01]

Q30: Intermedio

0.12 [-0.59, 0.82]

0.04 [-0.72, 0.86]

Q30: Periferico

0.49 [-0.33, 1.32]

0.67 [-0.23, 1.63]

TitStudio: Medio

-0.44 [-1.11, 0.22]

-0.28 [-1.00, 0.48]

TitStudio: Alto

-1.67 [-2.54, -0.80]

*

-1.84 [-2.83, -0.91]

*

codAreaRurale: B

-0.44 [-1.15, 0.35]

-0.41 [-1.28, 0.49]

codAreaRurale: C

-0.50 [-1.23, 0.22]

-0.60 [-1.44, 0.22]

codAreaRurale: D

-0.91 [-2.17, 0.36]

-0.98 [-2.37, 0.38]

id.sd(Intercept)

3.38 [3.01, 3.75]

8.36 [7.02, 9.89]

id.sd(time)

1.50 [1.24, 1.80]

id.cor(Intercept,time)

-0.90 [-0.94, -0.85]

SLL.2021.sd(Intercept)

0.33 [0.02, 0.87]

0.40 [0.02, 1.05]


I due modelli identificano gli stessi driver strutturali, tuttavia il Modello 2 (Random Slope) rivela una dinamica temporale molto più aggressiva e personalizzata.

  1. Effetti Strutturali
    In entrambi i modelli i principali caratteri che spiegano l’astensione rimangono sostanzialmente gli stessi (l’intervallo di credibilità non tocca lo zero, segnato con *):

    • Istruzione Alta: Si conferma il principale fattore di protezione (\(\beta_{M2}\)=−1.84). Chi ha un titolo di studio elevato ha una probabilità di astenersi drasticamente inferiore.

    • Vulnerabilità Lavorativa: Disoccupati (\(\beta_{M2}\)=2.11) e Casalinghe (\(\beta_{M2}\)=1.75) mostrano i livelli di distacco più alti. È interessante notare anche il coefficiente dei Lavoratori Autonomi (\(\beta_{M2}\)=1.63), che suggerisce una forma di disimpegno legata forse a una diversa percezione del legame con lo Stato.

    • L’età ha un effetto costante e protettivo (β=−0.08): per ogni anno in più, la propensione all’astensione cala leggermente ma costantemente.

  2. La Dinamica Temporale
    La differenza sostanziale tra i due modelli risiede nella variabile Time:

    • In M1, l’effetto del tempo è stimato a 0.95.

    • In M2, l’effetto balza a 1.67. Questo può essere dovuto al fatto che il Modello 2, permettendo a ogni individuo di avere la propria “velocità” di allontanamento dal voto (sd(time) = 1.50), riesce a isolare un trend di crescita molto più netto. L’astensione non è solo alta, sta accelerando in modo consistente per una parte significativa del campione.

  3. Correlazione Intercetta-Tempo

    • Il dato più interessante di M2 è la correlazione tra intercetta e pendenza (-0.90).
      Questa correlazione così alta indica che gli individui che partono con la probabilità di astensione più bassa (gli elettori storicamente più fedeli) sono quelli che mostrano le pendenze più ripide.
  4. Spazio e Territorio (SLL e Aree Rurali)
    Si deve osservare che le variabili territoriali (SLL e codAreaRurale) rimangano deboli o non significative.

    • La varianza spiegata dagli SLL (0.40) è minima rispetto alla varianza individuale (8.36).

    • L’astensione sembra quindi essere un fenomeno biografico e sociale, non geografico. Non conta tanto dove vivi, ma chi sei (istruzione) e cosa fai (condizione professionale).