Analisi su primi dati di decessi ISTAT: incidenza spazio-temporale del ‘fattore COVID’

09/04/2020

La recente pubblicazione dei dati relativi ai decessi da parte di ISTAT (Istituto Nazionale di Statistica) ha acceso un dibattito riguardo alla mortalità effettiva legata ai casi di COVID-19, che coinvolge diversi organi di informazione. Questo dibattito fa seguito a una serie di articoli scientifici riguardanti la stima dei contagiati asintomatici, paucisintomatici, o con sintomatologia marcata ma non suffragata da test (si veda ad es. [1]).

Data la natura dei dati pubblicati, è necessario prestare particolare attenzione alla loro analisi per poter estrarre informazioni che parlino dei fenomeni sottostanti che li hanno generati. In questo breve articolo vogliamo offrire una lettura originale, che aiuti a fare chiarezza.

Il primo aprile 2020 ISTAT ha reso disponibili alcuni dataset [2] relativi all’andamento dei decessi giornalieri per sesso e fascia d’età dal gennaio 2015 al 21 marzo 2020, rilevati in 1084 comuni (su 7904 comuni italiani). I 1084 comuni sono stati scelti da ISTAT in quanto presentano “… un numero di decessi che, nel periodo 1° gennaio 21 marzo 2020, è risultato superiore o uguale a 10 unità e che nel mese di marzo del 2020 hanno presentato, rispetto alla corrispondente media del quinquennio 2015-2019, un incremento della mortalità pari ad almeno il 20%” (nota esplicativa ISTAT [3]). 

Il lavoro presentato è basato sui dati disaggregati originali; ciononostante i risultati sono stati aggregati in fase di presentazione per provincia o città metropolitana (nel seguito considerate nel novero delle province per brevità di esposizione) poiché la distribuzione dei 1084 comuni contiene molti piccoli comuni, con numerosità ridotte. Si sottolinea inoltre che le serie storiche di molti comuni non giungono fino al termine del periodo di tempo considerato, ma sono troncate ad una data anteriore al 21 marzo: soltanto 806 comuni presentano la serie completa.

Il primo passo è stato quello di calcolare i decessi attesi per l’anno 2020 in base all’andamento storico, cioè i decessi attesi in assenza di sostanziali variazioni nella mortalità come quelle introdotte da COVID-19. Una semplice media aritmetica relativa agli anni precedenti può essere un primo indicatore, ma non considera la variazione della popolazione nel tempo, sia in termini di numerosità che di composizione. 

Per il calcolo dei decessi attesi è stato effettuata una proiezione in due passaggi. Il primo consiste in una proiezione stagionale utilizzando i dati sui decessi degli anni precedenti (dal 2015 al 2019) e i dati sulla popolazione nei vari comuni per sesso e fasce d’età, con i relativi indici di mortalità; il secondo in una correzione per l’anno 2020 per ciascun comune con più di 10 decessi attesi in 25 giorni, effettuata considerando i primi 50 giorni del 2020 come un trend normale di decessi senza COVID-19. Il risultato è quindi conservativo nel caso le morti causate dal virus fossero già presenti nei primi 50 giorni del 2020. Quest’ultima correzione permette di compensare le eventuali variazioni della popolazione 2020, di cui non sono ancora disponibili dati pubblici, rispetto agli anni passati, e quindi anche di valutare correttamente l’incremento dei decessi.

Nel filmato [7] si mostra una misura dello scostamento (zscore) tra il numero di decessi osservati e quelli attesi nelle varie province italiane. La colorazione più scura indica uno scostamento del numero di decessi osservati rispetto a quelli attesi maggiore. Lo scostamento è rapportato alla variabilità del fenomeno riscontrata in passato, per cercare di rendere equiparabili dati che provengono da campionamenti differenti (ad esempio province rappresentate prevalentemente nel dataset ISTAT da piccoli paesi con popolazione ridotta rispetto a province con grandi città). Si sottolinea che una fluttuazione tra i valori più bassi, ovvero tra i colori meno accesi, si può riferire alla variabilità naturale del numero di decessi. Al contrario, i colori più accesi sottolineano l’esistenza di una variazione anomala.

Le province colorate in grigio non hanno nessun comune rappresentato nel dataset ISTAT.

L’analisi mostra l’evoluzione nel tempo dello scostamento tra decessi osservati e decessi attesi. Si nota come questi ultimi siano cresciuti molto oltre i livelli attesi prima nel Lodigiano (esplodono a partire dal 2 marzo), poi nelle province di Bergamo (dal 9 marzo) e di Brescia (dal 13 marzo), e in seguito nelle altre province confinanti, come mostrato in Figura 1. Nella stessa figura è possibile vedere come il trend di aumento sia cominciato prima di queste date. Al 21 marzo l’analisi mostra una diffusione significativa nell’eccesso di decessi estesa a quasi tutta la Lombardia e alle province di Piacenza e Parma; inoltre sembra esserci un trend crescente nella provincia di Pesaro Urbino e in parte dell’Emilia-Romagna e del Piemonte. Essendo un lavoro basato su variazioni significative del numero di decessi, c’è un ritardo tra il dato rilevato e la diffusione del virus nella popolazione. 

Figura 1

 

In Tabella 1 si riporta la differenza tra decessi attesi e reali per tutti i 1084 comuni; per i comuni per cui la serie storica è troncata prima del 21 marzo sono stati comunque utilizzati tutti i dati disponibili.

Tabella 1

Dati per tutti i 1084 comuni del dataset ISTAT (1 gennaio – 21 marzo 2020)
Decessi attesi30.997
Decessi reali40.244
Incremento+30%

In Tabella 2 si riporta la differenza tra decessi attesi e reali per il solo mese di marzo, fino all’ultimo dato del 21, per i soli comuni che presentano la serie storica completa. 

Tabella 2

Dati sugli 806 comuni con serie storica completa fino al 21 marzo (1 – 21 marzo 2020)
Decessi attesi7.166
Decessi reali14.468
Incremento+102%

Questa analisi include implicitamente tutte le cause di decesso e non permette di attribuire l’eccesso al solo COVID-19 o ai suoi effetti indiretti, quali la morte di pazienti affetti da altre patologie che non abbiano ricevuto assistenza adeguata [4]. Si nota comunque che nei comuni a più alto incremento di decessi c’è una prevalenza di morti nella popolazione maschile, in accordo con quanto riportato in letteratura per COVID-19 [5,6].

La particolare composizione del dataset, relativo a comuni con alta variazione di morti rispetto al passato, non permette di estendere questi risultati all’intera popolazione nazionale, ciononostante i fenomeni presentati si sono manifestati nei comuni considerati e devono essere valutati con la dovuta attenzione.  Ad esempio, nel caso di un periodo di incubazione intorno ai 10 giorni e di decorso della malattia intorno ai 10 giorni (dati a titolo di esempio, soggetti a verifica), si potrebbe dedurre che il contagio fosse già molto diffuso nella provincia di Bergamo ancor prima dei primi casi segnalati a Codogno. 

Ormai a 19 giorni dall’ultimo dato registrato (21/3), il nostro auspicio è che si possa estendere il dataset a tempi più recenti e ad una completa copertura territoriale. Riteniamo che per chi dovrà prendere decisioni per la cosiddetta Fase 2 di ripresa delle attività, una conoscenza certa su quanto avvenuto nei primi mesi dell’anno sia indispensabile, anche per confermare che i risultati dei tamponi rispecchino con sufficiente accuratezza l’andamento dell’epidemia nel paese. Inoltre una maggiore copertura del territorio aiuterebbe a tracciare le direzioni di diffusione del contagio direttamente dai dati, a complemento dei risultati ottenuti con altri metodi. 

Joint work O. Crivaro, P. Ferrandi, M. Tantardini (Moxoff Spa), G. Aletti (UniMi)

Bibliografia

[1] S. Flaxman et al. Estimating the number of infections and the impact of non-pharmaceutical interventions on COVID-19 in 11 European countries. Imperial College Report 13, 2020 

[2] Dati mortalità pubblicati da ISTAT:  https://www.istat.it/it/archivio/240401

[3] Nota esplicativa Istat: https://www.istat.it/it/files//2020/03/Decessi_2020_Nota.pdf 

[4] S. Landi Infarto, I malati evitano l’ospedale per paura del virus, ma uno su tre poi arriva tardi, intervista a G. Merlino direttore sanitario del Centro Cardiologico Monzino I.R.C.C.S., Corriere della sera, edizione Milano, pubblicato online 24 marzo 2020.

[5] A. Remuzzi et G. Remuzzi, COVID-19 and Italy: what next? The Lancet Online First, Published online March 12, 2020

[6] G. Grasselli et al. Baseline Characteristics and Outcomes of 1591 Patients Infected With SARS-CoV-2 Admitted to ICUs of the Lombardy Region, Italy, JAMA, 2020

https://jamanetwork.com/journals/jama/fullarticle/2764365

[7] Incidenza spazio-temporale del ‘fattore COVID’ sui decessi https://youtu.be/itep0fJE810