L’insostenibile leggerezza dei dati

L’insostenibile leggerezza dei dati

27 Novembre 2020 0 Di Vittorio Zenardi

La questione è proprio in questi termini: la realtà è qualcosa che esiste o è più semplicemente un punto di vista? La scienza moderna, attraverso la teoria quantistica, prevede che una particella subatomica possa essere descritta attraverso l’insieme degli stati che è in grado di assumere e presume che, in mancanza di un’osservazione diretta, gli stati possano sovrapporsi e verificarsi contemporaneamente

L’insostenibile leggerezza dei dati

di Alessandro Capezzuoli, funzionario ISTAT e responsabile osservatorio dati professioni e competenze Aidr

Cos’è la realtà? Il dizionario definisce la realtà come la qualità e la condizione di ciò che è reale, che esiste in sé e per sé o effettivamente e concretamente. Questo potrebbe significare che per descrivere interamente e precipuamente un fenomeno sia sufficiente osservarlo e accertarne l’esistenza sulla base della propria esperienza, senza bisogno di mettere in discussione l’interpretazione che ne viene data. Il problema è che, in molti casi, la descrizione della realtà non è reale, è un’opinione, e dipende dall’osservatore, dal suo senso critico e dalla sua capacità di analisi. In questo scenario, ognuno costruisce la propria realtà, facendo ricorso alla consapevolezza e alle conoscenze possedute. A chi verrebbe in mente di sostenere che la matematica è un’opinione? Se scrivessi che, sulla base della mia esperienza, per due punti passano tre rette, diverrei poco credibile e probabilmente molti lettori abbandonerebbero la lettura, reputandomi un incompetente: giustamente, peraltro. La questione è proprio in questi termini: la realtà è qualcosa che esiste o è più semplicemente un punto di vista? La scienza moderna, attraverso la teoria quantistica, prevede che una particella subatomica possa essere descritta attraverso l’insieme degli stati che è in grado di assumere e presume che, in mancanza di un’osservazione diretta, gli stati possano sovrapporsi e verificarsi contemporaneamente. Applicando per assurdo questa teoria al mondo reale, si può azzardare un parallelismo: se un uomo è in grado di correre e dormire, potenzialmente può correre e a dormire contemporaneamente… a meno che un osservatore non “misuri” e registri lo stato in cui si trovi l’uomo in un certo momento. Se questo approccio, valido per la descrizione dei fenomeni subatomici, fosse applicabile alla vita reale, sarebbe necessario mettere in dubbio il concetto di realtà e chiedersi: gli oggetti che conosciamo sono reali o assumono quello stato soltanto nel momento in cui li osserviamo? Il sole, ad esempio, si trova esattamente in un certo punto o è là soltanto quando viene osservato? Rispetto a questa domanda, mi sento di rassicurare i lettori: il cosiddetto “realismo locale”, ovvero il principio di azione e reazione applicato alla realtà quotidiana, è in disaccordo con il teorema di Bell, quindi le ipotesi controintuitive della meccanica quantistica non trovano riscontro nella quotidianità. Come si fa, quindi, a descrivere la realtà che viviamo e a renderne oggettiva la descrizione? Esistono realtà locali che possono essere descritte attraverso leggi rigorose, per esempio la caduta di un grave, e realtà locali più sfumate, la cui descrizione può essere influenzata dal punto di vista e dalle interpretazioni personali.

Teoricamente, il metodo per descrivere un fenomeno è sempre lo stesso: c’è  la previsione teorica e ci sono l’osservazione, la misura, la raccolta dei dati, l’analisi, il confronto e la diffusione dei risultati attraverso i quali confermare o smentire la toeria. I fatti recenti hanno dimostrato che, in mancanza di un metodo e di una teoria scientifica “vera” da confermare (i due punti per i quali passa una e una sola retta), i dati possono prestarsi a ogni tipo di interpretazione. In poche parole, un set di dati, raccolti, analizzati e interpretati in modo scorretto, può permettere a chiunque di sostenere qualsiasi cosa, anche la più bizzarra: esattamente ciò che è accaduto con l’epidemia, un fenomeno tutto sommato storicamente conosciuto, che è stato affrontato con un metodo approssimativo e inefficace. Gli addetti ai lavori, quelli silenziosi che non si fanno intervistare dai media, manifestano continue perplessità rispetto alla leggerezza con cui vengono prodotti, analizzati e diffusi i dati riguardanti il coronavirus. Le mancanze sono tante, troppe. Fin dall’inizio, è mancato un metodo scientifico vero e prorpio attraverso cui affrontare il problema; è mancato, per esempio, un campione statistico affidabile che desse la possibilità di effettuare una rilevazione dei tamponi efficace e funzionale alla descrizione esatta del fenomeno. Da un dato rilevato in modo scorretto non possono derivare analisi corrette, questo è evidente. Statisticamente parlando, non ci sono grosse alternative: per rilevare correttamente i dati, si possono usare due metodologie: la rilevazione campionaria e la rilevazione censuaria. O si scelgono con un certo criterio gli elementi da misurare o si misurano tutti gli elementi esistenti. La rilevazione “casuale”, attualmente, non è contemplata tra le tecniche scientifiche  di raccolta dei dati. Soprassedendo su questa gravissima mancanza, c’è da dire che l’utilizzo dei dati raccolti con la tecnica “casuale”, attraverso l’osservazione disorganizzata, ha prodotto fortunosamente alcuni risultati: sappiamo per esempio che esistono un virus e un fenomeno epidemico il cui andamento è descritto da una certa curva. Sappiamo che il virus è più letale tra i soggetti di una certa fascia di età, in alcuni territori nei quali esiste una precisa distribuzione demografica, e che coesistono una popolazione “probabilmente” fragile e una popolazione “probabilmente” meno fragile. La fragilità, oltre ai fattori anagrafici, spesso è influenzata dalla presenza di una o più patologie pregresse. Queste evidenze, seppur faticosamente, e a colpi di insulti tra gli epidemiologi superstar, sono emerse: finalmente si parla della valutazione del rischio, dell’esposizione (in modo più accurato del tormentone “la mascherina chirugica qualcosa fa”) e della probabilità di sviluppare la malattia covid19. È abbastanza singolare che il concetto di rischio, conosciuto da tempo e applicato in diversi ambiti, dalla radioprotezione alle misure di sicurezza nei cantieri edili, si sia palesato dopo molti mesi in cui è sono state prese misure spesso contraddittorie e socialmente pericolose. Personalmente, ho qualche riserva quando sento i rappresentanti dello Stato incolpare i comportamenti dei cittadini, perché, teoricamente, i cittadini sono lo Stato. In ogni caso, finalmente siamo arrivati a istituire delle regioni “colorate”. Se un lettore attento potrebbe affermare che, con il tempo avuto a disposizione, si sarebbero potuti disegnare dei cluster territoriali più precisi e meno vasti, caratterizzati magari dalle caratteristiche demografiche e sociali degli abitanti e dalla densità abitativa locale, un lettore meno attento (e sui social ce ne sono stati parecchi) potrebbe chiedersi perché si sia utilizzato il colore giallo e non il verde: si tratta forse di un complotto della lobby dei pastelli? No, forse, più semplicemente, come nel caso delle allerte meteo, il colore verde viene associato a situazioni prive di rischio… e attualmente non esistono zone a rischio zero.

Vivere significa rischiare, questo è evidente. Anche le situazioni più rassicuranti, come possono essere le attività condotte tra le mura domestiche, espongono a un rischio più o meno alto.  Le questioni su cui varrebbe la pena soffermarsi a filosofeggiare, magari in un altro articolo, riguardano la percezione degli individui rispetto al rischio e l’abitudine al pericolo, oltre alla sua sottovalutazione o sopravvalutazione. Per esempio, è molto rischioso sottoporsi a cure ospedaliere (circa 50.000 decessi l’anno) o spostarsi con un qualche mezzo di locomozione privato (circa 80.000 decessi l’anno), ma l’abitudine al pericolo rispetto a questi temi e la sua sottovalutazione sono talmente radicati nel tessuto culturale che (quasi) a nessuno verrebbe in mente di avviare una campagna mediatica contro gli spostamenti in motocicletta o di invocare un “lockdown” automobilistico. Poiché il rischio è un concetto generale applicabile a diverse realtà, è possibile ricondurlo facilmente anche ai fenomeni epidemici. E la misura, seppur imprecisa, ha evidenziato un rischio maggiore per alcuni individui più fragili di altri. Da una stima spannometrica, che si può fare velocemente consultando il sito http://dati.istat.it, emerge che la popolazione residente, per la fascia di età che va dai 70 anni in su, è composta da oltre dieci milioni di persone.Circa sette milioni, se si prendono in considerazione gli ultrasettantacinquenni. Sappiamo che un sesto della popolazione è a rischio e sulla base di questa evidenza è necessario utilizzare i dati disponibili, per indicare ai decisori politici cosa si può fare in termini sociali, economici e demografici, cercando possibilmente di disegnare uno scenario futuro sostenibile. Per fare questo, i dati demografici non sono sufficienti: è necessario integrare diverse fonti, perché, come si dice spesso tra gli addetti ai lavori, un dato solo è sempre in cattiva compagnia. I dati, quando vengono associati ad altri tipi di dato, possono assumere significati diversi e fornire chiavi di letture più efficaci. Sapere che gli over 70 sono più di dieci milioni è importante, ma sarebbe interessante rispondere a una serie di domande alle quali, per il momento, non è stata data una risposta chiara. Quanti (o in che percentuali)  vivono in famiglia? Quanti (o in che percentuali)  nelle RSA? Quanti possono usufruire di una rete di protezione familiare? Quanti hanno bisogno di assistenza sociale? In che condizioni di salute si trovano? Quante e quali patologie pregresse hanno? In che condizioni economiche si trovano? Quali sono le città in cui si concentrano? E nei piccoli centri? In quali fasce di età si distribuiscono le diverse patologie? Quali sono i cluster territoriali delle fragilità da proteggere? Questo relativamente all’emergenza, poi ci sono le questioni relative alle ricadute economiche e sociali sulle quali non è stata avviata una riflessione seria e non ci sono, almeno all’apparenza, strategie a medio termine condivise dai mezzi d’informazione. L’unica cosa certa è l’incertezza e, francamente, con le conoscenze moderne, non possiamo permettercelo. Laddove si giochi con la vita e con la sofferenza delle persone, vita e sofferenza che non sono da intendersi soltanto come perdita e dolore per una certa malattia, ma anche in termini di disagio sociale, economico e di relazioni umane profondamente compromesse dai provvedimenti governativi, è quantomeno auspicabile che le decisioni siano prese attraverso una consapevolezza reale della realtà. Laddove i dati e le analisi non vengono condivisi, e la condivisione dei dati è un’altra grande mancanza del sistema contro la quale è in corso una vera e propria mobilitazione da parte dei ricercatori, si diffonde la sensazione che i provvedimenti e le restrizioni siano ingiusti e non vengano dettati dalla ragione ma dall’arbitrarietà discrezionale di chi non sa e, soprattutto, non sa cosa fare. Laddove i provvedimenti discrezionali non vengono supportati dal rigore dei dati, ma dettati da un comitato tecnico composto da personaggi più in cerca di gloria che di verità, possono verificarsi facili strumentalizzazioni da parte delle frange estremiste o, peggio, negazioniste. La leggerezza con cui, in questo momento storico, si parla dei dati è pericolosissima e sta creando un relativismo scientifico imbarazzante, che leggittima qualsiasi interpretazioni della realtà, sminuisce il ruolo della scienza e dà origine a fazioni contrapposte e in continuo conflitto. Lo studio dei dati è una questione seria che richiede preparazione e serietà: non si presta ai punti di vista personali, come può accadere per il fuorigioco di una partita di calcio. Per descrivere la realtà locale di un fenomeno osservabile esistono metodi e strumenti precisi: la sovrapposizione degli stati quantistici è meglio lasciarla alla fisica.