Sono ormai alcuni anni che in Italia si discute e si tenta di praticare politiche di Open Data, indicando in tal modo quelle iniziative che si rifanno al concetto di dato come “bene comune”, utilizzabile da tutti per lo sviluppo di nuovi servizi utili alla collettività.
Se da un lato questa rivoluzione culturale ha prodotto sicuramente degli effetti positivi, rendendo di fatto accessibili dei grandi “giacimenti informativi” (
termine usato nel settore per enfatizzare l’enorme valore derivabile da questi dati), dall’altro sembra che a questa crescente attenzione nel rendere pubbliche le informazioni non corrisponda ancora un adeguato impegno a garantire la qualità delle stesse.
Ne consegue che molto spesso i dati sono sì pubblici, ma incompleti, errati, incoerenti, non confrontabili, resi disponibili con modalità, formati e periodicità differenti. Tutto questo limita fortemente la loro effettiva utilizzabilità e, in certi casi (ad es. quando i dati sono anche solo parzialmente errati), compromette inevitabilmente la qualità e l’attendibilità complessiva delle analisi effettuate su di essi.
Proviamo a fare un esempio prendendo come riferimento una delle fonti analizzate nel nostro lavoro: le informazioni dei Certificati di Conto Consuntivo dei Comuni al 31/12/2014 pubblicati sul portale del Ministero dell’Interno (
www.finanzalocale.interno.it).
Supponiamo di voler valutare l’impegno di spesa pro-capite assunto dai Comuni nel 2014. Considerando le informazioni presenti sui certificati consuntivi, potremmo esprimere questo indicatore come il rapporto tra la voce “Totale generale delle spese” del quadro 3 (riepilogo generale delle spese), colonna Impegni, e la voce “Popolazione residente” del quadro 1 (Dati generali al 31/12/2014).
Osserviamo adesso i dati del Comune di Alfianello (BS): l’impegno di spesa riportato nel Quadro 3 per questo Comune ammonta a 1.798.465,35 euro mentre il numero di abitanti riportato sul Quadro 1 è 9.501. Ne deriva un impegno di spesa pro-capite pari a 189,29euro.
Tuttavia, consultando i dati ISTAT sulla popolazione, vediamo che gli abitanti di Alfianello al 31/12/2014 erano 2.536 e non 9.501. Di conseguenza se utilizzassimo questo dato per il calcolo della spesa pro-capite otterremmo 709,17 euro, cioè un valore di circa 4 volte superiore a quello calcolato a partire dai dati di bilancio pubblicati sul sito del Ministero dell’Interno. Quale è il dato corretto (visto che entrambi sono dati ufficiali comunicati dallo stesso Ente e riferiti alla stessa data)?
* * *
E’ evidente che quello evidenziato rappresenta un caso limite; ma se, partendo da questa incongruenza riscontrata, approfondissimo l’analisi potremmo verificare che, nel complesso, il numero dei Comuni che nel 2014 hanno segnalato nei bilanci consuntivi un dato “popolazione residente” difforme da quello segnalato all’ISTAT è pari a 3.605 (circa il 45% del totale). E, sebbene la maggior parte di questi Comuni sia di piccole dimensioni, rientrano in questo elenco anche Comuni capoluogo come Milano, Napoli, Genova, con differenze che, pur risultando poco significative in misura percentuale, assumono valori nell’ordine delle 10.000-15.000 unità.
Partendo da queste riflessioni e dai riscontri di questo tipo ottenuti in molti anni di elaborazioni condotte su dati pubblici, ho sentito l’esigenza di approfondire questi temi e di avviare uno studio specifico sugli “errori” per cercare di capire se ci fossero le condizioni per mettere a punto un modello diagnostico per queste basi di dati, utilizzabile per individuare i dati potenzialmente errati e selezionare opportunamente il campione di analisi in modo da aumentare l’attendibilità dei risultati.
L’articolo allegato e scaricabile riporta, con un taglio di tipo essenzialmente “divulgativo”, i primi risultati di una analisi di questo tipo condotta su un sottoinsieme molto ristretto di dati estratti dai certificati consuntivi di bilancio dei Comuni (dati riguardanti, essenzialmente, i servizi indispensabili e le informazioni generali).
L’obiettivo perseguito, in questa fase, è stato prevalentemente quello di introdurre la problematica e di rendere evidenti le difficoltà che normalmente incontra chi, per lavoro o per studio, si trova nella necessità di utilizzare questi dati per effettuare analisi, per mettere a punto dei servizi, per poter prendere delle decisioni.
Più in generale, credo che una maggiore consapevolezza su questi temi sia una condizione indispensabile affinché si possa iniziare a cambiare le cose ed in particolare a creare le condizioni affinché il concetto di “rendere pubblici i dati” non venga interpretato dagli enti solo come impegno a “pubblicare i dati da qualche parte”, ma anche come responsabilità di assicurarne la coerenza, la correttezza e la effettiva utilizzabilità da parte della collettività.