Visualizza - Politecnico di Bari

Transcript

Visualizza - Politecnico di Bari
Un articolo scientifico di un team di ricercatori del Politecnico premiato in Austria
Accesso all’informazione sul Web
intelligente e personalizzata
Bari, 23 ottobre 2012 – Accesso all’informazione sul Web personalizzato, intelligente e
aggiornato, sono i contenuti di un articolo scientifico, premiato con il “Best Scientific
Paper Award” (Premio come Miglior Contributo Scientifico) alla 8th International
Conference on Semantic Systems a Graz in Austria.
La ricerca, dal titolo “Linked Open Data to support Content-based Recommender
Systems”, è stata scritta da un team di ricerca afferente al Politecnico di Bari composto
dai ricercatori: Tommaso Di Noia (coordinatore), Roberto Mirizzi, Vito Claudio
Ostuni, Davide Romito e da Markus Zanker dell'Università di Klagenfurt (Austria). Il
contributo di ricerca propone di sfruttare in maniera innovativa le informazioni
codificate nella cosiddetta nuvola di “Linked Open Data”. Infatti, il World Wide Web
(WWW), sta evolvendo da un Web composto da ipertesti ad un Web composto da
“iperdati”. “Per questo motivi si parla sempre di più di Web dei dati – dice Tommaso
Di Noia, ricercatore presso la Facoltà di Ingegneria di Bari - in contrapposizione al
classico Web dei documenti. Grazie alla diffusione del Web Semantico e alla più
recente iniziativa dei Linked Open Data, una vasta mole di dati codificati in linguaggio
RDF, sistematizzati in collezioni, è liberamente raggiungibile sul Web. L'idea alla base
del Web Semantico (proposta per la prima volta in un articolo del 2001 dall'inventore
del Web, Tim Berners-Lee) – continua - è quella di far evolvere il modo in cui viene
rappresentata l'informazione disponibile su Internet così che possa essere compresa ed
elaborata in maniera automatica da degli agenti software. Questa evoluzione passa
attraverso la codifica dei dati attraverso un linguaggio che renda possibile rappresentare
non solo i dati “per se” ma anche il loro significato. Il linguaggio principe per tale
codifica è RDF (Resource Description Framework). Cerchiamo di spiegare il concetto
con l'ausilio di un esempio. Se leggiamo su una pagina Web la parola “Roma”, la
associamo subito alla corrispondente città e a tutte le informazioni che abbiamo su di
essa. In altri termini, come esseri umani, siamo in grado di associare un significato
(semantica) alle parole collegandole alle entità corrispondenti. Grazie a questa
associazione possiamo aggregare informazioni e dati e operare dei processi di
ragionamento su di essi. Dall'altro lato, per un agente software che processa
l'informazione (testuale) contenuta nella stessa pagina, la parola “Roma” è soltanto una
sequenza di quattro caratteri. L'agente non è in grado, da solo, di dare un significato
alla sequenza di caratteri e di operare alcuni dei processi inferenziali di cui siamo
capaci. Ed è in questo passaggio che interviene RDF. Grazie ad esso è possibile
associare una semantica esplicita alla parola Roma e di conseguenza collegarla alla
entità corrispondente. Se poi si hanno a disposizione ulteriori dati codificati in RDF su
questa entità, l'agente può sfruttarli per “ragionare” su di essi. In altre parole, il dato si
trasforma in conoscenza.
Al giorno d'oggi, esistono intere collezioni di dati (anche note come dataset) in RDF
relativi a diversi domini di conoscenza. Abbiamo dataset relativi ai film, altri relativi ad
informazioni geografiche. È inoltre disponibile una versione RDF della ben nota
enciclopedia on-line Wikipedia. I dati contenuti nelle collezioni sono molto spesso
liberamente fruibili e aperti, ecco perché ci si riferisce ad essi come Open Data (dati
aperti). Se tutte queste collezioni di dati fossero tra loro isolate, sarebbe difficile
aggregare informazioni rilevanti tra di loro appartenenti a domini di conoscenza
differenti. Al fine di evitare tutto questo, l'iniziativa Linked Open Data (dati aperti e
collegati) favorisce l'interconnessione tra dataset disponibili online. Data la loro natura
interconnessa, ci si riferisce ad essi come alla “nuvola dei Linked Open Data”.
Nonostante esista una immensa quantità di dati in formato RDF disponibile sul Web
– conclude -attualmente sono disponibili solo un esiguo numero di applicazioni che ne
sfruttino completamente il loro potenziale”.
Nell'articolo scientifico presentato e premiato, gli autori mostrano come gli
Open Data possano essere sfruttati con successo per sviluppare un sistema di accesso
personalizzato all'informazione che si basi esclusivamente sui dati e sulla conoscenza
codificata nella nuvola dei Linked Open Data. Come prototipo per validare i risultati
ottenuti è stato sviluppato un sistema di raccomandazione (nel senso anglosassone del
termine) per suggerire ad un utente nuovi film da vedere. Un approccio alla
raccomandazione basato su Linked Open Data permette di superare due grossi
problemi tipici di tali sistemi: la freschezza dell'informazione e la sua completezza.
Grazie al continuo aggiornamento dei dataset presenti on-line, l'informazione
disponibile è sempre aggiornata. Inoltre, data la vastità dei dati presenti e la loro forte
interconnessione è possibile sfruttare molta più conoscenza rispetto a quella utilizzata
da sistemi analoghi che si basano sull'analisi del testo.
A seguito della comunicazione del premio, viva soddisfazione hanno espresso al dott.
Di Noia il Rettore del Politecnico, prof. Nicola Costantino, e il prof. Eugenio Di
Sciascio, coordinatore del laboratorio di ricerca in Sistemi Informativi del Politecnico
di Bari nell’ambito del quale il dott. Di Noia opera.
Comunicato stampa.
ufficio stampa politecnico di bari