Conoscenza aperta e Open Data: rischi e potenzialita’

Gli Open Data sono dati che possono essere liberamente utilizzati, riutilizzati e ridistribuiti secondo i termini di una licenza che ne permetta l’impiego da parte di chiunque. In primo luogo, devono possedere i requisiti fondamentali di disponibilità e accesso, in quanto devono essere resi fruibili gratuitamente attraverso le tecnologie dell’informazione e della comunicazione in un formato utile e modificabile o ai costi marginali sostenuti per la loro riproduzione. Riutilizzo e ridistribuzione si riferiscono alla possibilità che queste informazioni hanno di essere combinate con altri dati [1].

Il fatto che non vi siano clausole, discriminazioni, diritti d’autore, restrizioni di copyright, brevetti o altre forme di controllo che ne limitino la riproduzione, apre la possibilità di una partecipazione universale alla conoscenza [2].

L’interoperabilità è la capacità di combinare una base di dati con altre, permettendo a componenti diverse di lavorare insieme e realizzare il principale vantaggio pratico dell’apertura: aumentare in modo esponenziale la possibilità di sviluppare nuovi servizi e prodotti più sofisticati. Cercare il confronto con i potenziali utilizzatori dei dati fra i cittadini, le imprese o gli sviluppatori fa crescere la rilevanza dell’iniziativa durante tutto il suo percorso [3].

Il principio dell’Open Data è il fondamento su cui poggia l’aspirazione di rendere la scienza un’impresa pubblica, condotta in modo trasparente. Affonda le radici nel più ampio movimento di pensiero dell’Open Government, che mira a difendere i diritti dei cittadini con iniziative affini, a volte sovrapposte, come l’Open Source, l’Open Access e l’Open Content [4].

Secondo il D.L. n. 33/2013 il presupposto di trasparenza dell’Open Government è “garanzia delle libertà individuali e collettive, nonché dei diritti civili, politici e sociali, integra il diritto ad una buona amministrazione e concorre alla realizzazione di una amministrazione aperta, al servizio del cittadino”, mentre la Carta dei Dati Aperti del G8 già sanciva che “l’accesso ai dati consente agli individui e alle organizzazioni di sviluppare nuove idee e innovazioni che possono migliorare le vite degli altri e aiutare a ridurre il flusso delle informazioni all’interno e tra gli Stati”.

Le positività derivanti dalla condivisione, la partecipazione e l’interoperabilità si riflettono su un miglioramento organizzativo-gestionale dei dati, così da evitare costi superflui a causa della duplicazione degli sforzi per produrre informazioni già condivise da un altro ente. Instaurando un processo virtuoso di omogeneizzazione, la qualità dei dati migliora, rendendo le informazioni più aggiornate e complete. Mentre i nuovi utilizzatori possono collaborare a questo miglioramento segnalando all’ente eventuali errori o imprecisioni nei dataset. Inoltre, autorizzare la diffusione degli open data in concomitanza con la pubblicazione di uno studio può funzionare da deterrente verso frodi scientifiche dove i dati sono stati inventati o manipolati per ottenere un risultato prefissato [5].

Secondo la logica dell’open data, le informazioni prodotte dalla pubblica amministrazione, in quanto finanziate da denaro pubblico, devono ritornare alla comunità dei contribuenti sotto forma di dati universalmente disponibili. Qualsiasi restrizione su di essi e sul loro riutilizzo limita lo sviluppo della comunità, perché sono necessari per agevolare l’esecuzione di comuni attività umane (ad esempio i dati cartografici, quelli sugli organismi per la scienza medica, quelli ambientali e meteorologici, ecc.). La scienza è più efficace e la società ottiene il massimo beneficio dalle ricerche scientifiche, in cui il tasso di scoperta è accelerato.

Comunque, deve essere anche detto che i potenziali di sinergia degli open data si applicano bene alle scienze naturali, per esempio, e meno ai settori in cui i prodotti intermedi della ricerca (ovvero, i dati) possano essere di uso produttivo per gli altri. Dipende dai contesti. Proteggere la proprietà intellettuale dei dati è di vitale importanza ancora per molti settori [6].

Una maggiore apertura è sicuramente desiderabile nel caso in cui i dati della ricerca siano potenzialmente pericolosi per la società. Per esempio, quando si ha a che fare con la tendenza nella sperimentazione clinica di riportare dati viziati, diffondendo solo i risultati positivi, con la conseguente distorsione della relazione tra causa ed effetto. Ugualmente, esiste un interesse diffuso a rendere accessibili i dati che riguardano i casi di sicurezza delle attività industriali che possono compromettere l’incolumità dei cittadini.

A questo è connessa una questione molto dibattuta: quanto è diffusa la fiducia dei cittadini ne i sistemi di regolamentazione dell’apertura dei dati da parte delle istituzioni che agiscono nell’interesse pubblico? Che cosa è privato e che cosa può essere opportunamente reso pubblico? E’ importante considerare caso per caso, tenendo conto delle particolarità di ogni situazione.

Capita che molti enti (di natura sia scientifica, sia governativa) non prendano in considerazione l’ipotesi di rilasciare i propri dati con licenze aperte proprio perché manca loro la consapevolezza dell’importanza delle informazioni che possiedono. Se pure avere a disposizione una grande quantità di dati viene considerato utile, la decisione di condividerli in maniera aperta è essenzialmente una questione culturale, prima che tecnologica. La mancanza di una corretta conoscenza dell’argomento sembra uno degli elementi che concorrono a creare diffidenza, generando l’errata idea che il dato aperto sia un dato indifeso, alla mercé di qualunque tipo di manipolazione. Così, è diffuso il timore di essere privati del risultato del proprio lavoro, che si traduce nel non rendere noti i dati, se non in forma molto generica e sommaria, fino al momento della pubblicazione integrale dei risultati della ricerca [7].

Un altro grande problema riguarda il valore commerciale che gli stessi dati possono avere e che per questo motivo sono controllati da organizzazioni, pubbliche o private, che mostrano reticenza di fronte alla possibilità di diffondere il proprio patrimonio informativo.

Altre questioni sono legate al fatto che la tecnologia in rapido avanzamento conduce a un mutamento altrettanto veloce della natura e del valore dell’informazione, con un’enorme generazione, trasmissione, condivisione e confronto di dati anche personali. Perciò, è essenziale che nel maneggiare questi ultimi le istituzioni governative e la pubblica amministrazione agiscano in modo trasparente e assolutamente affidabile.

Il diritto alla privacy è tanto importante quanto quello all’informazione o alla libertà d’espressione. Per esempio, app o website che raccolgono proteste contro la corruzione, dati medici, dati coperti da segreto statistico o altre informazioni sensibili potrebbero avere serie implicazioni di privacy [8]. La sicurezza dei dati personali nei database non può essere sempre garantita dalle procedure che sostengono di rendere le informazioni anonime e il modo più efficace per affrontare questi problemi è attraverso i cosiddetti safe havens (rifugi sicuri) dove i dati sono tenuti fisicamente al sicuro e resi disponibili solo ai ricercatori in buona fede, con sanzioni legali contro il rilascio non autorizzato [9].

Tutto sommato, nonostante ci siano dei casi in cui va a instaurarsi un conflitto fra i “diritti d’informazione”, in molte occasioni si tratta di un rinforzo mutuo di diritti, piuttosto che di una loro opposizione.

In ogni caso, per le decisioni legate alla condivisione di dati personali a uso della ricerca è necessario indagare i benefici pubblici e i rischi che ne derivano, cercando allo stesso tempo di proteggere la privacy individuale.

Innovare comporta successi e, per forza di cose, errori e costi. Nel caso degli Open Data, i costi riguardano la privacy, la sicurezza, le infrastrutture di raccolta e, di certo, il lavoro che sta dietro la loro gestione [10].

Aprire i dati richiede un investimento iniziale in termini di ore dedicate all’apprendimento di  come estrarre e pubblicare i dati e di come incardinare tali attività nell’organizzazione del proprio lavoro. Una grossa mole di dati richiede speciali meccanismi di compilazione, mantenimento, salvaguardia e diffusione [11].

Non è detto, poi, che tutte le banche dati saranno utilizzabili e produrranno lo stesso valore.

Secondo uno studio di Campbell et al. (2002), la ragione più comune che sta alla base del rifiuto di aderire alla richiesta di aprire i dati che si possiedono sarebbe proprio la quantità di lavoro necessario per soddisfarla.

Le tecnologie informatiche sono un mezzo utile, se non fondamentale, sia per la pratica della trasparenza, sia per la partecipazione diretta ai processi decisionali da parte di tutti gli interessati.

La loro evoluzione porta con sé un incredibile potenziale per migliorare la trasparenza e l’interoperabilità dell’informazione, anche se l’automazione delle banche dati presenta ancora tanti problemi di difformità ed elaborazione e porta, che lo si voglia o no, a una parziale rinuncia dell’autonomia conoscitiva dell’uomo.

Bibliografia e siti web

[1] Molloy J.C., “The open knowledge foundation: Open data means better science”, 2011.

[2] https://it.wikipedia.org/wiki/Dati_aperti

[3] Nielsen M., “Reinventing Discovery: The New Era of Networked Science”, 2011.

[4] Art. 68 del Codice dell’Amministrazione Digitale.

[5] Boulton J., “Gli imperativi dell’Open Science”, 2014

[6] Murray-Rust P., “Open Data in Science”, 2008.

[7] Sondaggio promosso dal Progetto MAPPA su Open Data e Archeologia, 2013.

[8] Banisar D., “The Right to Information and Privacy: Balancing Rights and Managing Conflicts”, 2011

[9] Open Rights Group, “Open Data and Privacy”, 2014

[10] http://www.dati.gov.it

[11] “Open Data e pianificazione territoriale. Domande e risposte dal laboratorio pilota della Provincia di Bologna”

Tags: , , ,

Ancora nessun commento.

Lascia una risposta