SEMANTIC WEB

Transcript

SEMANTIC WEB
Ing. Federico Chesani
SEMANTIC WEB
Outline
Outline
ƒ Introduzione a Semantic Web
à Caratterizzazione del World Wide Web odierno
à La proposta Semantic Web
à Architettura del Semantic Web
ƒ Informazione semantica (I): RDF e RDFS
ƒ Informazione semantica (II): OWL
ƒ Logiche, proof e trust
ƒ SW oggi: problemi e critiche
Il Web oggi (Web 1.0) …
ƒ I contenuti sono pubblicati su web per essere
“human-readable”
à Standard HTML concentrato su “come”
rappresentare i contenuti
à Nessun meccanismo per definire “cosa” si sta
rappresentando
à Alcuni tags (e.g. <title>) danno semantica
implicitamente ma …
‚ … il loro contenuto non è strutturato
‚ … il loro uso non è standardizzato
Il Web oggi (Web 1.0) …
Possiamo identificare il
titolo in base alla sua
presentazione (<h1>, <b>) …
… se domani il grafico
cambia il formato esterno
esterno, il
nostro programma non
funziona più!!!
<h1>
<!-- inizio TITOLO -->
<B>Finanziaria, il voto slitta a domani<br>
Al Senato va in scena l&#039;assurdo</B>
<!-- fine TITOLO -->
</h1>
Il Web oggi (Web 1.0) …
ƒ Le pagine contengono collegamenti (links) ad
altre pagine
à Nessuna informazione sul link …
‚ … cosa rappresenta
t un certo
t collegamento?
ll
t ?
‚ … cosa rappresenta la pagina/risorsa riferita da un
link?
Il Web oggi (Web 1.0) …
Actual Web = Layout + Routing
Problema: non è possibile ragionare in
modo automatico sui dati
Il Web oggi (Web 1.0) …
ƒ Web inteso come colossale archivio di dati,
interrogato ogni giorno da milioni di utenti
à L’accesso a tale archivio avviene tramite motori di
ricerca ed in base a keywords …
à … il successo di tale ricerca dipende da molti
fattori
‚ Bontà dell’algoritmo di ricerca
‚ Numero delle pagine indicizzate
‚ Contenuti/meta-contenuti delle pagine indicizzate
Il Web oggi (Web 1.0) …
ƒ Il web è universale
à Qualunque pagina può contenere collegamenti ad
altre pagine
à Approssimativamente,
Approssimativamente chiunque può pubblicare su
web riguardo qualunque argomento
‚ Decentralizzazione delle informazioni
‚ Inconsistenza delle informazioni
‚ Incompletezza delle informazioni
Semantic Web
Obiettivo: poter “utilizzare”/”ragionare su” la
enorme quantità di dati disponibili sul web in
maniera automatica
Come? Estendendo l’attuale web con
informazioni sul contenuto (informazioni
semantiche)
Proposto da Tim Berners-Lee nel 2001, in un articolo
pubblicato su Scientific American
Semantic Web
Principi che si vogliono salvaguardare:
ƒ Universalità del web
ƒ De-centralizzazione dell’informazione
ƒ Inconsistenza dell’informazione
à Inconsistenza dei contenuti
à Inconsistenza delle informazioni di routing (links)
ƒ Incompletezza dell’informazione
Aggiungere informazioni sul contenuto
Aggiungere informazioni sul contenuto non è
sufficiente
ƒ Tali informazioni devono essere opportunamente
strutturate (e.g., classificazione di Linneo per il mondo animale)
à Ontologie?
ƒ E’ necessario aggiungere anche regole di inferenza
(e.g., sillogismo aristotelico)
à Logica?
ƒ Applicando regole a dati si ottengono nuove
conoscenze
à Processo di prova (proof) con cui si dimostrano le
conclusioni
Proof e Trust
Le “proofs” usate per inferire nuove informazioni possono essere scambiate ed analizzate
per…
ƒ … giustificare
i tifi
i risultati
i lt ti ottenuti
tt
ti
ƒ … superare l’aspetto definitorio dell’IT
ƒ … ragionare ulteriormente sulla “fiducia”
riguardo i risultati ottenuti
à Le informazioni sul web sono (e saranno)
incoerenti, contradditorie ed incomplete
Standard
Assestati
Ricerca
Architettura del Semantic Web
SW – Applicazioni?
Qualche esempio …
ƒ Migliorare i sistemi di ricerca (e.g., Portale Vodafone)
ƒ Assistente remoto
ƒ Integrazione Database (ambito industriale)
ƒ Biblioteche ed archivi digitali (XMP Adobe)
ƒ Semantic Web Services
Identificazione dei concetti
ƒ In SW, i concetti vengono identificati tramite
URI (Uniform Resource Identifier)
à Gli URI sono per definizione un sistema di nomi
unici
à Ad
d ogni URI corrisponde
d uno ed
d un solo
l concetto…
à … però più URI possono definire lo stesso concetto!
à URI (non URL): non è necessario che vi corrisponda
un contenuto
Esempi di URI:
http://www.repubblica.it
[email protected]
ISBN 88-7750-483-8
Resource Description Framework
(RDF/RDFS)
ƒ Standard W3C
ƒ Linguaggio (XML based) per la rappresentazione
di conoscenza
ƒ Obiettivo:
Obietti o fornire uno
no strumento
str mento minimalista
ƒ Basato sul concetto di tripla:
< soggetto, predicato, oggetto >
< risorsa, attributo, valore >
ƒ Diverse rappresentazioni possibili (N3, Grafo,
RDF/XML)
RDF – Rappresentazione a grafo
ƒ Un nodo per il soggetto
ƒ Un nodo per l’oggetto
ƒ Un arco etichettato per il predicato
http://www.example.org/index.html has a
creator whose value is John Smith
RDF – Rappresentazioni
RDF – Rappresentazioni
<rdf:RDF
xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#
xmlns:contact=http://www.w3.org/2000/10/swap/pim/contact#
>
<contact:Person
rdf:about="http://www.w3.org/People/EM/contact#me">
<contact:fullName>Eric Miller</contact:fullName>
<contact:mailbox rdf:resource="mailto:[email protected]"/>
<contact:personalTitle>Dr.</contact:personalTitle>
</contact:Person> Posso chiedere al computer la mailbox di Eric Miller, senza
</rdf:RDF>
sapere a priori se usa una casella di posta elettronica,
piuttosto che una casella postale fisica, o quant’altro…
… e se Eric Miller cambia mailbox, il risultato della mia
ricerca sarà sempre coerente!
RDF – Capacità espressive
Supporta:
ƒ tipizzazione tramite attributo type (che
assume come valore un URI)
ƒ soggetto/oggetto di una frase possono essere
anche contenitori (bag, sequence,
alternative)
ƒ meta-asserzioni, tramite reificazione delle
asserzioni (“Marco afferma che Federico è autore di
una certa pagina web”)
RDF Schema
ƒ RDF può essere inteso come descrizione di attributi di
risorse e dei valori assunti da tali attributi
ƒ RDFS permette di descrivere classi, proprietà e
relazioni con altre risorse (simile ad OO)
à type
à subClassOf
à subPropertyOf
à range
à domain
RDF e RDFS - Limiti
ƒ Limitato potere espressivo
ƒ Semantica non “ben definita”
ƒ Non permette ancora di effettuare inferenze
sulla conoscenza
ƒ Non risolve l’ambiguità di più URI che si
riferiscono ad uno stesso concetto
Soluzione proposta: Ontology Web Language
(OWL)
Modelli semantici
Modal Logic
First Order Logic
Description Logic
UML, OWL
RDF
RDFS
DB Schemas
XMLS
Thesaurus
XML
Modelli
concettuali
Teorie
Logiche
Tassonomie
Modelli semantici
ƒ Tassonomia: insieme di termini organizzati in
una gerarchia
à rappresenta il fatto che esistono delle relazioni fra
termini …
à … ma non permette di stabilire la natura di tali
relazioni
à tipicamente gerarchie di tipo padre/figlio
à la ricerca di un termine ha successo solo se si
conosce a priori “dove” cercare
Modelli semantici
ƒ Thesaurus: insieme di termini fra cui esistono
più relazioni
à oltre alla relazione padre/figlio (gerarchia), vi sono
ulteriori relazioni associative (e.g.
(e g sinonimia,
sinonimia
iperonimia, iponimia, olonimia, meronimia)
à risolvono problemi tipici del linguaggio naturale,
quali ambiguità e rindondanza
à Esempio: WordNet
Modelli semantici
ƒ Modello concettuale: è il modello di una
particolare area di conoscenza (dominio).
Definisce:
à Entità
E tità del
d l dominio
d i i
à Relazioni fra le entità (in forma di proprietà ed
attributi)
à Regole su classi, attributi e relazioni
à Regole di inferenza … Teorie Logiche!!!
Ontologie – una definizione
Una ontologia è una descrizione formale
esplicita di un dominio di interesse
ƒ Classi
ƒ Relazioni semantiche tra classi
ƒ Proprietà associate ad un concetto (eventuali
restrizioni)
ƒ Eventuale livello logico (assiomi, regole di
inferenza)
Ontologie – un esempio
Ontology Web Language (OWL)
ƒ Standard W3C
ƒ Si basa ed estende RDF/RDFS
ƒ Dotato di semantica formale (supporta
Description Logic)
ƒ Tre livelli di espressività/complessità
à OWL Lite (semplice, poco espressivo)
à OWL DL (complessità della description logic,
mediamente espressivo)
à OWL Full (altamente espressivo ed oltre FOL, non
decidibile)
OWL – caratteristiche
ƒ Classi: subClassOf, intersectionOf, unionOf,
complementOf, enumerationm equivalnece,
disjoint
ƒ Proprietà:
P
i tà symmetric,
t i transitive,
t
iti functional,
f ti
l
inverse Functional, range, domain,
subPropertyOf, inverseOf, equivalentProperty
ƒ sulle Istanze: sameIndividualAs,
differentFrom, allDifferent
Interesse per le ontologie
ƒ Una ontologia fornisce un
modello/strutturazione di un dominio
à Risolve ambiguità di termini
à Chiarifica/semplifica
Chi ifi /
lifi le
l peculiarità
li ità di un d
dominio
i i
à Come ricaduta, analisi approfondita di un
dominio/processo …
à … elevato valore in ambito industriale/business
Ontologie – problemi aperti
ƒ Equivalenza tra ontologie diverse
à Ontology matching problem
à
Una ditta vende un oggetto chiamato “golden”… una seconda ditta sta
cercando di comprare delle “mele…
ƒ Ragionamento/interazione sulla base di ontologie
differenti
à Ontology mediators
ƒ Estensione degli algoritmi di ricerca, con le
ontologie e metodi di ragionamento
Esempi di ontologie
ƒ Dublin Core, per documenti
ƒ WordNet, sistema lessicale
ƒ Gene Ontology, genomica
ƒ Protein Ontology, proteomica
ƒ SnoMed, campo medico (costo 1500$/anno)
Strumenti per definire ontologie:
ƒ Protégé http://protege.stanford.edu/
Standard
Assestati
E gli altri strati di SW?
Regole e logiche
ƒ Le Description Logics si stanno affermando
come logiche di riferimento per SW
à Si sviluppano a partire dagli anni ’80
à Tecnologia
T
l i assestata
t t
à Decidibili (la logica dei predicati è semi-decidibile)
à Hanno complessità computazionale accettabile
(O(P) )
à Sono basate sul concetto di ruolo (non hanno le
variabili)
Regole e logiche
ƒ Recentemente, un fortissimo interesse (industria
e ricerca) per le regole
ƒ Informazioni semantiche comprendono anche
regole che descrivono aspetti caratteristici di un
dominio
ƒ Problema aperto: ragionare sia sui dati semantici
che sulle regole
ƒ Rule Interchange Format: standard W3C
(tentativo) per la rappresentazione di regole
ƒ Applicazioni a Semantic Web Services, Business
Rules, e-Contracts,…
Proof e Trust ?
ƒ Prevalentemente argomento di ricerca
à Argumentation dialogues
à Proof exchange
à Trust
T
models
d l
à Veridicità delle informazioni
à Incompletezza delle informazioni
à Informazioni contraddittorie
Semantic Web – problemi?
ƒ Nonostante il paradigma SW sia in discussione
dal 2001 …
ƒ … nel web attuale tale architettura stenta ad
affermarsi
ff
i
à Molto discussa in ambito accademico
à Poco apprezzata in ambito industriale
‚ Solo recentemente, con i Semantic Web Services, è
(ri)sorto un notevole interesse nell’ambito business
ƒ In generale, “fatica” a percepirne i vantaggi
Semantic Web – problemi?
ƒ Adozione di RDF
à Aggiungere contenuto semantico è molto costoso
à Finché non si raggiunge una “massa critica” di informazioni
semantiche disponibili su web …
à … gli strumenti di SW appaiono essere “sterili”
sterili
à Recente proposta in W3C di Gleaning Resource Descriptions
from Dialects of Languages (GRDDL)
ƒ Ontologie
à Costo elevato nel produrre una ontologia ex-novo
à Una ontologia è “viva”, muta nel tempo
‚ Costo di manutenzione
‚ Costo di gestione (uso di temporal logic per gestire il versioning)
Semantic Web – critiche?
ƒ Praticamente irrealizzabile
à Problemi intrinseci quali ad esempio il “metacrap”
ƒ Quale uso dei dati?
à Problemi di censura
à Problemi di privacy
ƒ I dati semantici sono già disponibili su web, è
sufficiente estrapolarli opportunamente
à SW inteso come una duplicazione non necessaria
di ciò che esiste già
à GRDDL potrebbe essere usato anche a tale scopo
Conclusioni
ƒ Semantic Web: aggiunta di informazioni
semantiche sul contenuto delle risorse
presenti su web
ƒ Grandi
G di prospettive
tti sulla
ll carta
t …
à Fortissimo interesse nell’ambito della ricerca,
specie nel settore dell’intelligenza artificiale
ƒ … fatica ad affermarsi in realtà
à Grande interesse recentemente per i Semantic
Web Services
Qualche riferimento…
Sito ufficiale W3C:
ƒ http://www.w3.org/2001/sw/
Sito comunità
ƒ http://www.semanticweb.org/
ƒ http://www.websemantico.org/

Documenti analoghi

Rappresentazione della Conoscenza nel Semantic Web

Rappresentazione della Conoscenza nel Semantic Web Gli obiettivi di Tim Berners Berners--Lee Lee:: • Metainformazioni machine machine--processable processable;; • Interoperabilità sintattica (facilità di leggere i dati da applicazioni diverse); • I...

Dettagli

Strutturare la conoscenza: XML, RDF, Semantic Web

Strutturare la conoscenza: XML, RDF, Semantic Web per assegnare una semantica ai tag e supportare le transazioni sul Web, permettendo lo scambio di informazioni tra database diversi. Ulteriori e significativi vantaggi sono costituiti dalla possibi...

Dettagli

Il Semantic Web

Il Semantic Web esempio concreto di come diverse comunità umane (per esempio, diversi gruppi di ricercatori) sviluppino diverse rappresentazioni persino dello stesso dominio (è esperienza comune di chi ha partec...

Dettagli