Gli Open Government Data: al via in Trentino la diffusione dei dati pubblici
a cura di redazione di Informatica Trentina
Trend e ApprofondimentiTREND E APPROFONDIMENTI

La Pubblica Amministrazione (PA) è un dominio applicativo complesso con una varietà di vincoli e interessi ed una ampia base di utenti diversi, come ad esempio, cittadini e imprese. Di solito le informazioni vengono create da enti diversi, sono rappresentate in formati diversi e possono essere di diversa qualità. Tuttavia, le fonti di dati devono essere interoperabili, permettendo così la condivisione e lo scambio di dati tra le applicazioni. Le tecnologie semantiche in generale e gli open government data nello specifico hanno un grande potenziale per il supporto della PA nell’affrontare la diversità di cui sopra.

Il termine open government data rappresenta il sottoinsieme di dati aperti e linkabili della PA. Nello specifico, i dati aperti offrono la possibilità di accesso per tutti tramite delle licenze che garantiscono la riutilizzabilità dei dati. A sua volta, il concetto di dati linkabili significa che tali dati sono maggiormente facili da trovare e da integrare.

Vantaggi. I principali vantaggi che derivano dagli open government data sono i seguenti: (i) aumento della trasparenza e dell’efficienza della PA, (ii) crescita del coinvolgimento e della partecipazione dei cittadini nella PA, (iii) riutilizzo dei dati e quindi generazione di nuove opportunità di business, nonché stimolazione dello sviluppo economico in generale.

Esperienze inerenti a livello comunitario e nazionale. Le principali esperienze considerate sono iniziative internazionali di rilievo, come ad esempio, data.gov.uk del Regno Unito e data.gov degli Stati Uniti. L’idea fondamentale è quella di rendere disponibili al pubblico la maggior parte dei dati non sensibili sui quali sono basati i servizi (on-line) della PA. Si incoraggiano quindi aziende e cittadini a utilizzare tali dati e a costruire le proprie applicazioni, garantendo in tal modo all’utente rilevanza sui dati esposti e sulla possibilità di fornire servizi nuovi (non-previsti) dalla PA. Infatti, il riuso non-previsto è il driver principale che ha portato al successo il web dei documenti e quindi si sostiene che questo è ciò che dovrebbe accadere anche con il web degli open government data. A sua volta nel caso degli Stati Uniti, nel 2009 quando Barack Obama ha preso l’incarico di Presidente, ha emesso subito una serie di misure di stimolo economico volta anche a costruire e mantenere la fiducia degli elettori, in parte compromessa dalla crisi finanziaria che ha avuto inizio nel 2008. A tal proposito la trasparenza è diventata lo stimolo principale per gli sviluppi futuri del Paese.

Sulla scia delle esperienze inglese ed americana, in pochi anni la cultura degli open data e dei data store governativi si è estesa sino in Australia con data.gov.au, Canada con data.gc.ca, Norvegia con data.norge.no, Francia con data.gouv.fr.

In Italia l’esperienza  dei dati aperti a livello regionale è stata avviata ufficialmente con l’iniziativa dati.piemonte.it. A questa prima esperienza si sono aggiunti la Regione Emilia – Romagna con dati.emilia-romagna.it e sempre a livello territoriale anche la Provincia autonoma di Trento, dove come primo ambito di diffusione di dati pubblici sono stati scelti alcuni tematismi del Sistema Informativo Ambiente e Territorio - SIAT. Su www.territorio.provincia.tn.it, sotto la voce S.I.A.T. > “Ricerca nel geo-catalogo” saranno liberamente  accessibili per consultazione e scarico  161 voci, il 40% circa sul totale gestito in questo settore, che vanno dal piano urbanistico provinciale al piano di utilizzazione delle acque pubbliche (PGUAP), dall’idrografia alle valanghe.

L’iniziativa dati.gov.it, il portale nazionale dei dati aperti, ha ripreso a livello italiano le esperienze dei data store governativi lanciati negli ultimi anni, in particolare del primo e più celebre, che ha sostanzialmente fatto da modello ai successivi, data.gov degli Stati Uniti.

Per una “Mappa degli open data” in Italia si veda anche http://www.dati.gov.it/content/infografica-lopen-data-italia.

Passi operativi. L’attuazione degli open government data, coerentemente con quanto raccomanda il gruppo di lavoro del W3C in materia di eGovernment[1], prevede i seguenti macro passaggi:

  • Identificare i dati della PA che si possono rendere disponili sul web; non si tratta solo dei dati che risiedono a livello centrale, ma anche a livello locale, per esempio, nei comuni e nelle comunità di valle.
  • Pubblicare i dati grezzi sul web.
  • Creare un catalogo con la documentazione di ciò che è disponibile.
  • Ri-pubblicare i dati in formato aperto e linkabile.

Si enfatizza che è più importante rilasciare dati subito, e poi ri-pubblicarli in forma linkabile. Tuttavia, piuttosto che ritardare qualsiasi rilascio dei dati, la raccomandazione è di rilasciare i dati “as is” al più presto possibile, e poi lavorare per convertirli in un formato migliore.

Aspetti istituzionali e giuridici. Per massimizzare i valori degli Open Government Data è importante attribuire ai dati rilasciati una licenza permissiva per chiunque di riutilizzare i dati per qualsiasi scopo. La Regione Piemonte ha adottato strumenti legali standard, come ad esempio il sistema di licenze Creative Commons. Ad esempio, per i dati della Provincia autonoma di Trento, già disponibili sul web, si è scelto l’utilizzo della licenza Creative Commons 0 - CCZero[2] (pubblico dominio).

A livello italiano è stata definita una “licenza italiana per i dati aperti”, progettata per permettere a tutte le pubbliche amministrazioni italiane di diffondere i propri dati. La licenza Italian Open Data Licence (IODL) è stata sviluppata da Formez PA e ha lo scopo di promuovere la “liberazione” e valorizzazione dei dati pubblici secondo la linea già tracciata dal Ministero per la pubblica amministrazione e l’innovazione con la pubblicazione del nuovo Codice dell’amministrazione digitale, che all’Articolo 52 pone in primo piano la responsabilità delle pubbliche amministrazioni nel rendere disponibili i propri dati in modalità digitale.

Aspetti tecnici. Dal punto di vista tecnico, esistono due ingredienti chiave: (i) RDF[3] – Resource Description Framework – è uno standard W3C[4] con un modello dati a “grafo”, (ii) ontologie che forniscono una rappresentazione formale, condivisa ed esplicita di una concettualizzazione di un dominio di interesse.

Coerentemente con la proposta di Tim Berners-Lee[5], si suggerisce un modello a cinque stelle per la pubblicazione tecnica dei dati che è da interpretare in maniera incrementale. Le prime 3 stelle sono facili da raggiungere e si ottiene un possibile riuso di dati, ma solo tramite un operatore umano che cura ogni aspetto semantico dell’integrazione. Per avere dati maggiormente facili da trovare e da integrare è necessario arrivare alla 4° e 5° stelle. Il modello è esposto di seguito:

Rendere i dati leggibili da umani via web in qualsiasi formato sotto forma di cataloghi o portali, ad esempio, anche come una immagine scannerizzata. In questa maniera gli utenti possono consultare e scaricare i documenti. Tuttavia, i dati esposti in questo modo non facilitano la loro integrazione.

Rendere i dati disponibili in un formato strutturato caricabile da macchine direttamente, come ad esempio, fogli excel e dump di database. In tal caso i PDF o le immagini non sono ammessi. In questa maniera gli utenti hanno accesso ai dati grezzi, se dispongono delle conoscenze sui software proprietari. Tuttavia, il software proprietario necessita l’interpretazione di schemi, e quindi occorre fornire documentazione sui campi e sui dati.

Utilizzare uno standard strutturato, aperto, non-proprietario, come ad esempio, CSV, XML, RTF. In questa maniera gli utenti hanno accesso più diretto ai dati grezzi. Tuttavia, l’interoperabilità è affrontata ancora solo a livello sintattico.

Usare un formato universale standard sia per la sintassi che per la semantica, ovvero RDF - una lingua franca; dove i termini sono “ben definiti”, e puntano alle ontologie pubblicate sul web, come ad esempio RSS[10] per aggregazione delle notizie. A sua volta il linguaggio di interrogazione per RDF è SPARQL Protocol and RDF Query Language[11].

Linkare i propri dati a dati di altri per fornire il contesto. Si può realizzare RDF appositamente per l’integrazione automatica tra fonti eterogenee. Per ogni nodo RDF usare una URI[12] esterna ben nota, se altri usano la stessa URI si sa a che cosa si fa riferimento. Elementi di semantica possono essere incapsulati anche nell’HTML.

ALTRI ARTICOLI DI INTERESSE
  • Nella newsletter
  • Nella rubrica
© Informatica Trentina
Via G. Gilli, 2 | 38121 Trento | Tel.:+39 0461 800111 | E-mail: infotn@infotn.it | E-mail certificata: infotn@pec.infotn.it | P.IVA 00990320228 | Informativa Privacy