In questo articolo avevamo cercato di verificare se le misure restrittive attuate dal governo italiano avessero ottenuto effetti sull’indice di trasmissione Rt, considerandolo un indice descrittivo efficace del contagio. Oggi cercheremo di rispondere alla seconda domanda

  • Rt ĆØ un affidabile indicatore descrittivo o predittivo dei contagi?
  • Premetto subito che ĆØ impossibile stabilirlo: un’eventuale verifica non ĆØ meno aleatoria del calcolo dell’indice stesso. Perciò costruirò un percorso di verifica che ĆØ solo probabile, ferma restando l’impossibilitĆ  di una verifica diretta.

    Per verificare l’efficacia dobbiamo costruire un modello teorico di base, in cui inserire l’indice Rt calcolato e controllare la differenza coi dati reali. Queste differenze vanno, poi, sottoposte a un test di normalitĆ  se verificate le condizioni di normalitĆ  possiamo supporre che, effettivamente, l’indice descriva il contagio in maniera adeguata, supponendo altrimenti qualora il test di normalitĆ  desse esito negativo.

    Ripartiamo dai valori del tasso di riproduzione, questa volta la fonte dei dati sarĆ  la raccolta Our World In Data dell’universitĆ  di Oxford.

    Il modello di base

    Come modello di base possiamo partire dal classico modello di diffusione epidemiologica di Kermack e McKendrick.

    Se \(S(t)\) ĆØ il numero di suscettibili (coloro che, a contatto con un malato possono infettarsi) al tempo t, \(I(t)\) il numero degli infettivi (coloro che, una volta ammalatisi, possono contagiare i suscettibili) e \(R(t)\) i rimossi (coloro che, avendo avuto la malattia, al tempo t non ce l’hanno più, perchĆ© guariti o perchĆ© deceduti), mentre \(N(t)\) ĆØ la popolazione totale, intesa come somma di suscettibili, infettivi e rimossi \(N(t) = S(t) + I(t) + R(t)\), ipotizzando che, prima del CoViD19 la dinamica vitale fosse nulla, possiamo scrivere che tali variabili varieranno secondo le seguenti leggi

    \[\begin{align*} \frac{dS}{dt} & = -\beta S(t)I(t) \\ \frac{dI}{dt} & = \beta S(t)I(t) - \gamma I(t) \\ \frac{dR}{dt} & = \gamma I(t) \end{align*}\]

    ottenendo un sistema differenziale ordinario accoppiato.

    Stima del numero di infettivi

    Quindi, non è possibile conoscere nessuna delle tre variabili del sistema differenziale bensì solo stimarle. Il numero di infettivi, la variabile più importante, nonché quella che definisce il fenomento, non è conosciuto. La possibilità di stimarlo ci viene offerta dal tasso di positività (la percentuale di positivi rilevati coi tamponi) i. Sappiamo che i è uno stimatore non corretto di \(\frac{I(t)}{N(t)}\), perché i tamponi giornalieri non sono campioni casuali bensì fortemente deformati pregiudizialmente. In ogni caso, si tratta del miglior stimatore disponibile del numero degli infettivi.

    PoichĆ© i dati relativi forniti da Our World in Data sono forniti filtrati mediante una media mobile a 7 periodi, la serie storica ĆØ incompleta lungo tutto l’arco temporale studiato. Per poter svolgere i calcoli necessari alla verifica, si deve completare la serie storica del tasso di psitivitĆ : giacchĆ© la curva degli infettivi - come il tasso di positivitĆ , del resto - segue una curva le cui code sono approssimabili come esponenziali nel tempo, ho ricostruito in questo modo la sequenza temporale iniziale del tasso.

    In questo modo, il numero degli infettivi, nel tempo, presenta una forma di questo tipo.

    l’indice di riproduzione ĆØdefinito, partendo dal modello di Kermack e McKendrick, come

    \[ R_t = \frac{\beta}{\gamma} S \]

    Introducendo tale definizione nella seconda equazione del modello di Kermack e McKendrick, si ottiene

    \[ \frac{1}{I}\frac{dI}{dt} = \gamma (R_t - 1) \]

    Si, tratta, perciò, di applicare un’analisi di regressione al tasso di crescita del numero di infettivi rispetto all’indice di riproduzione.

    Appare abbastanza chiaramente che il precedente non sia un buon modello descrittivo. Cionondimeno, provvederemo a effettuare un’analisi grafica deiresidui del modello analizzato.

    Anche il grafico dei quantili, ci permette di esprimere forti dubbi sulla robustezza del modello.

    Infine, calcolando il test di Shapiro-Wilk, si ha la ragionevole convinzione che i residui non siano distribuiti normalmente attorno a 0.

    ## [1] "p-value =  3.51828553433556e-23"

    A fronte di tutto ciò, nutro forti dubbi sul fatto che Rt sia un indicatore preciso e affidabile della descrizione del contagio.