27/05/2014
Dai metadati bibliografici ai linked data: un’introduzione di Carlo Bianchini Corso di aggiornamento professionale CEDOC – Centro di Documentazione Modena, 26 maggio 2014
Prefazione
C. Bianchini - Dai metadati ai LD
27/05/2014
2
1
27/05/2014
Le biblioteche in crisi • La diffusione del web e l’enorme disponibilità di contenuti in rete sembra rendere marginale e forse obsoleto il ruolo delle biblioteche • Le nuove abitudini degli utenti hanno creato distanza tra i desideri percepiti e i servizi offerti, tra i modelli di ricerca di informazioni seguiti dai lettori e gli strumenti messi a disposizione dal servizio bibliotecario • Si è creato squilibrio tra raccolte, strumenti di mediazione e utenti C. Bianchini - Dai metadati ai LD
27/05/2014
3
I dati delle biblioteche • Milioni di dati bibliografici conservati negli opac delle biblioteche di tutto il mondo non sono raggiungibili dai motori di ricerca; • I dati delle biblioteche rimangono invisibili alla maggior parte degli utenti (84%) che cercano informazioni sulla rete a partire dai motori di ricerca
C. Bianchini - Dai metadati ai LD
27/05/2014
4
2
27/05/2014
I dati delle biblioteche Se oggi cerchiamo un’opera tramite un motore otteniamo risposte dai cataloghi di vendita di libri in commercio e di antiquariato. I cataloghi delle biblioteche, invece, la cui redazione ha richiesto l’elaborazione di normative, competenze professionali e consistenti finanziamenti pubblici, non forniscono risposte ai motori di ricerca.
C. Bianchini - Dai metadati ai LD
27/05/2014
5
I dati della PA • Lo sviluppo del web non ha lasciato indietro solo il mondo delle biblioteche • Moltissimi dati delle istituzioni che hanno sviluppato banche dati con formati specifici (archivi anagrafici, geografici, statistici, giuridici ecc.) sono invisibili dai motori e dalla rete • Ciò accade perché gli archivi sono prodotti con modelli e formati di dati specifici (silos) e non secondo standard interoperabili con il web.
C. Bianchini - Dai metadati ai LD
27/05/2014
6
3
27/05/2014
I dati delle biblioteche 3 Ci sono eccezioni, anche italiane, come il catalogo delle Biblioteche Civiche Torinesi
C. Bianchini - Dai metadati ai LD
27/05/2014
7
C. Bianchini - Dai metadati ai LD
27/05/2014
8
4
27/05/2014
Il mercato di Google Secondo il sito Searchenginewatch.com i primi tre siti elencati nelle risposte di una ricerca su Google ricevono una media del 58,4% delle visite (clickthrough rate – CRT) da parte di chi ha fatto la ricerca: o 36,4% primo classificato o 12,5% visite al secondo classificato o 9,5% visite al terzo classificato C. Bianchini - Dai metadati ai LD
27/05/2014
9
I dati delle biblioteche 3 Ci sono eccezioni, anche italiane, come il catalogo delle Biblioteche Civiche Torinesi. Queste eccezioni si basano su applicazioni specifiche costruite su misura per alcuni silos ma si può (e si deve) fare MOLTO di più
C. Bianchini - Dai metadati ai LD
27/05/2014
10
5
27/05/2014
Interoperabilità • È necessario rendere i dati interoperabili, non solo tra istituzioni culturali (MAB), ma tra i silos culturali e qualsiasi altro produttore di dati esterno – pubblico e privato – attraverso il web aperto. • Per riuscirci, è necessario registrare e pubblicare i dati (bibliografici e non) con modalità che consentano agli elaboratori o di individuarli, o di comprendere che tra di essi esistono relazioni e o di stabilire che tipo di relazioni sono C. Bianchini - Dai metadati ai LD
27/05/2014
11
Descrivere le risorse • Malgrado molti detrattori, il catalogo – inteso come complesso di dati per l’accesso e la gestione delle risorse – rimane il core business delle biblioteche • Senza i dati non funzionano la ricerca, la consultazione, la circolazione, il reference, le acquisizioni, la conservazione, l’aggiornamento … • Ma soprattutto: i lettori, non trovando i nostri dati con i motori di ricerca, ignorano semplicemente le biblioteche e tutti i loro servizi.
C. Bianchini - Dai metadati ai LD
27/05/2014
12
6
27/05/2014
Come superare la crisi? Le biblioteche non sono rimaste immobili nel corso del tempo. Hanno cercato di adeguare il proprio servizio seguendo (almeno) due percorsi: 1. Rinnovamento di principi, modelli, standard e regole di descrizione e accesso 2. Rinnovamento degli strumenti di ricerca e navigazione bibliografica
Le nuove regole e i nuovi strumenti di ricerca si sono rivelati efficienti ed efficaci? Esistono altri percorsi? Se si, come si conciliano con quanto è stato realizzato finora? C. Bianchini - Dai metadati ai LD
27/05/2014
13
Indice generale 1. Breve storia dei metadati 2. Rinnovamento di principi, modelli, standard e codici di catalogazione 3. Evoluzione degli opac 4. Linked data. Definizione e principi 5. Pubblicare i dati C. Bianchini - Dai metadati ai LD
27/05/2014
14
7
27/05/2014
Parte 1 Storia (breve) dei metadati
C. Bianchini - Dai metadati ai LD
27/05/2014
15
I metadati • La comune definizione di metadati è «dati sui dati», cioè dati che servono a fornire il contesto o ulteriori informazioni su altri dati
C. Bianchini - Dai metadati ai LD
27/05/2014
16
8
27/05/2014
Metadati. Definizione Karen Coyle offre una definizione di metadati più chiara e più utile nel nostro contesto: “Dati costruiti per risolvere un problema o per svolgere una funzione.” (Coyle 2010)
C. Bianchini - Dai metadati ai LD
27/05/2014
17
Dati e tecnologia • Le trasformazioni tecnologiche del catalogo sono state determinate dalla necessità di svolgere nuove funzioni. • Nel tempo, per realizzare nuove funzioni si è progressivamente modificata la struttura del catalogo e, di conseguenza, è stato necessario rendere sempre più espliciti i metadati.
C. Bianchini - Dai metadati ai LD
27/05/2014
18
9
27/05/2014
‘Nascita’ dei metadati • L’espressione metadati nasce e diventa di uso comune in biblioteca quando si passa dal loro uso implicito alla loro formalizzazione logica, per disporre di un modello concettuale necessario alla realizzazione di programmi di gestione dei dati bibliografici.
C. Bianchini - Dai metadati ai LD
27/05/2014
19
Catalogo a libro • Nel catalogo a libro i metadati erano di norma impliciti: in quel contesto tecnologico semplice, i dati svolgono una funzione di base, ovvero rappresentare, surrogare, i documenti. • Nel catalogo manoscritto e nel catalogo a stampa, non c’è alcun bisogno di rendere espliciti i metadati.
C. Bianchini - Dai metadati ai LD
27/05/2014
20
10
27/05/2014
Catalogo a libro In questi due esempi
MILL, JOHN S.. On liberty; 3rd Ed. Boston; 1864, 16mo.
la tecnologia utilizzata per esplicitare il tipo e la funzione dei dati consiste nella sequenza ordinata e nella presentazione tipografico utilizzate. I metadati sono nel contesto (e nel lettore). C. Bianchini - Dai metadati ai LD
27/05/2014
21
Seconda funzione. Interpolazione dei dati • I metadati cambiano quando alla funzione originaria (la rappresentazione dei documenti) si aggiunge una seconda funzione: l’interpolazione e lo scambio dei dati bibliografici. • L’unità di descrizione della raccolta, rappresentata fino a quel momento dal catalogo nel suo complesso (catalogo a libro), deve essere spezzata in sottounità (schede), che possono essere scambiate, riordinate, sostituite, interpolate. C. Bianchini - Dai metadati ai LD
27/05/2014
22
11
27/05/2014
Seconda funzione. Interpolazione dei dati 2 • Nel passaggio dal catalogo a libro al catalogo a schede, p. es., il trattino lungo che indicava la medesima intestazione è sostituito dal dato esplicito dell’intestazione della scheda. • Infatti il contesto non è più sufficientemente chiaro per usare il trattino lungo
C. Bianchini - Dai metadati ai LD
27/05/2014
23
Catalogo a schede MILL, JOHN S.. Utilitarianism. London; 1863, 8vo. MILL, JOHN S.. On liberty; 3d Ed. Boston; 1864, 16mo. Utilitarismo MILL, JOHN S.. Utilitarianism. London; 1863, 8vo.
C. Bianchini - Dai metadati ai LD
27/05/2014
24
12
27/05/2014
Granularità • La maggiore articolazione dei dati (registrati su schede) richiede una maggiore esplicitazione dei metadati, cioè una maggiore granularità. • Il termine granularità indica il livello di dettaglio logico e tecnico con il quale si registrano i dati all’interno del sistema.
C. Bianchini - Dai metadati ai LD
27/05/2014
25
Granularità 2 • È possibile formulare un principio che governa la granularità dei dati del catalogo? Ipotesi
Ogni unità informativa deve essere completa e autoesplicativa
C. Bianchini - Dai metadati ai LD
27/05/2014
26
13
27/05/2014
Terza funzione. Normalizzazione dei dati • Nel passaggio al catalogo elettronico si aggiunge la funzione di normalizzazione dei dati: • Riduzione della ridondanza dei dati • Authority control • Scambio internazionale dei dati
C. Bianchini - Dai metadati ai LD
27/05/2014
27
Terza funzione. Normalizzazione dei dati • Si creano archivi separati per o le descrizioni bibliografiche o le registrazioni di autorità e o i dati gestionali (di copia)
• Si crea una sintassi che sostituisce il contesto del catalogo cartaceo per i dati oggetto di scambio (ISBD) Utilitarianism / by John Stuart Mill. – London : Parker, son, and Bourn, 1863. – 95 p. ; 22 cm
C. Bianchini - Dai metadati ai LD
27/05/2014
28
14
27/05/2014
Terza funzione. Normalizzazione dei dati • In questo passaggio, aumenta la granularità dei cataloghi, cioè il dettaglio logico e tecnico di registrazione dei dati (in archivi separati) • Di conseguenza aumenta la necessità di esplicitare i metadati, per consentire allo strumento tecnologico in uso (software) di riconoscere i dati e ricostruire correttamente l’unità di ciascuna descrizione bibliografica. • Si conferma il principio: ogni unità deve essere completa e autoesplicativa C. Bianchini - Dai metadati ai LD
27/05/2014
29
Terza funzione. Struttura delle relazioni • In questa fase, devono essere rese esplicite anche le relazioni tra i dati che fanno parte di un’unica descrizione e sono registrati in archivi diversi • La sintassi del linguaggio documentario, utile per la comprensione da parte del lettore, non è più sufficiente perché tali relazioni siano gestite anche dalle macchine • Anche per le relazioni sono necessari i metadati
C. Bianchini - Dai metadati ai LD
27/05/2014
30
15
27/05/2014
Terza funzione. Struttura delle relazioni • È questo il livello logico dei DB relazionali oggi esistenti e in uso, a partire da SBN.
C. Bianchini - Dai metadati ai LD
27/05/2014
31
Attuali cataloghi (dal ’70 a oggi) Intestazione/i uniforme/i Persona/Ente
Intestazione/i uniforme/i Persona/Ente
Intestazione/i uniforme/i Soggetto/Classe
Descrizione bibliografica: (Pubblicazioni e documenti d’altro genere)
Registr. copia/localizzaz. C. Bianchini - Dai metadati ai LD
Registr. copia/localizzaz. 27/05/2014
32
16
27/05/2014
Terza funzione. Struttura delle relazioni • È questo il livello logico dei DB relazionali oggi esistenti e in uso, a partire da SBN • Ciascuna registrazione richiede l’esplicitazione e l’uso di metadati appropriati • È valido il principio che ogni unità deve essere completa e autoesplicativa
C. Bianchini - Dai metadati ai LD
27/05/2014
33
Crisi dei cataloghi attuali La struttura dei cataloghi attuali non è soddisfacente: • dal punto di vista dell’efficienza, perché i costi di produzione dei cataloghi sono troppo alti (FRBR e modelli derivati) • dal punto di vista dei lettori, perché non garantisce in modo adeguato la funzione di navigazione (Svenonius, 2000)
C. Bianchini - Dai metadati ai LD
27/05/2014
34
17
27/05/2014
Parte 2 Rinnovamento di principi, modelli, standard e codici
C. Bianchini - Dai metadati ai LD
27/05/2014
35
ICP dell’IFLA I Principi internazionali di Catalogazione dell’IFLA • Pubblicati da Saur nel 2009 • Traduzione italiana a cura dell’ICCU e di un gruppo di esperti • Disponibili in linea e a stampa
C. Bianchini - Dai metadati ai LD
27/05/2014
36
18
27/05/2014
Principi internazionali di catalogazione
http://www.ifla.org/files/assets/cata loguing/icp/icp_2009-it.pdf
C. Bianchini - Dai metadati ai LD
27/05/2014
37
Elementi di novità • ICP recepisce il modello FRBR e adatta i principi al nuovo contesto: p. es. un paragrafo (§ 3) è dedicato a Entità, Attributi e Relazioni • Introduce la funzione di navigare, nuova anche rispetto a FRBR • ICP si concentra sui dati piuttosto che sulle registrazioni bibliografiche, che sono considerate un insieme di dati. • Anche le “intestazioni” diventano dati che assumono un ruolo particolare (fungono da punti di accesso) C. Bianchini - Dai metadati ai LD
27/05/2014
38
19
27/05/2014
Elementi di novità ICP contiene importanti novità terminologiche, che hanno rilevanza concettuale: o Unità bibliografica Manifestazione o Intestazione Punto di accesso autorizzato/controllato o Rinvio Forma variante del nome o Titolo uniforme Punto di accesso autorizzato, Forma autorizzata del nome, Nome
C. Bianchini - Dai metadati ai LD
27/05/2014
39
Elementi di novità ICP contiene importanti novità terminologiche, che hanno rilevanza concettuale: o Unità bibliografica Manifestazione (istanza) o Intestazione Punto di accesso autorizzato/controllato o Rinvio Forma variante del nome o Titolo uniforme Punto di accesso autorizzato, Forma autorizzata del nome, Nome
Il focus si sposta dalla tecnologia alla funzione C. Bianchini - Dai metadati ai LD
27/05/2014
40
20
27/05/2014
VIAF • Il Virtual International Authority File costituisce una soluzione pratica a un problema teorico irrisolto: l’uniformità degli accessi a livello internazionale (Principi di Parigi, 1961) • Nel VIAF non esiste una forma unica del nome di un’entità, ma molte forme equivalenti • Nel VIAF esistono intestazioni “a grappolo”: un insieme di punti di accesso, privo di una forma principale Esempio • http://viaf.org/viaf/32197206/ C. Bianchini - Dai metadati ai LD
27/05/2014
41
FRBR e modelli derivati
C. Bianchini - Dai metadati ai LD
27/05/2014
42
21
27/05/2014
Evoluzione concettuale • IFLA Study Group on the Functional Requirements for Bibliographic Records. 1998. Functional Requirements for Bibliographic Records : Final Report. München: K.G. Saur • IFLA Working Group on Functional Requirements and Numbering of Authority Records (FRANAR). 2009. Functional Requirements for Authority Data : a Conceptual Model : Final Report, December 2008. München: K. G. Saur • Zeng, ML, M Žumer, and A Salaba. 2011. Functional Requirements for Subject Authority Data (FRSAD): A Conceptual Model. Berlin: De Gruiter Saur C. Bianchini - Dai metadati ai LD
27/05/2014
43
Evoluzione concettuale • IFLA Study Group on the Functional Requirements for Bibliographic Records. 1998. Functional Requirements for Bibliographic Records : Final Report. München: K.G. Saur • IFLA Working Group on Functional Requirements and Numbering of Authority Records (FRANAR). 2009. Functional Requirements for Authority Data : a Conceptual Model : Final Report, December 2008. München: K. G. Saur • Zeng, ML, M Žumer, and A Salaba. 2011. Functional Requirements for Subject Authority Data (FRSAD): A Conceptual Model. Berlin: De Gruiter Saur C. Bianchini - Dai metadati ai LD
27/05/2014
44
22
27/05/2014
REICAT e RDA • FRBR ha ispirato la redazione di nuove regole di catalogazione: REICAT e RDA. • I due codici riflettono la necessità – espressa da FRBR – di rappresentare un maggior numero di entità e di relazioni
C. Bianchini - Dai metadati ai LD
27/05/2014
45
RDA • Nell’ottobre 2006, Tom Delsey preparò per il JSC (Joint Steering Committee for Development of RDA, già Joint Steering Committee for Revision of Anglo-American Cataloguing Rules), un documento che descriveva tre possibili scenari (tre contesti) di implementazione per il nuovo codice (Delsey 2007) • Gli scenari descritti da Delsey rappresentano modelli esemplificativi di funzionamento dei database bibliografici e si differenziano per il loro grado di granularità C. Bianchini - Dai metadati ai LD
27/05/2014
46
23
27/05/2014
Scenari RDA • Ogni scenario delineato ospita la stessa quantità e tipologia di dati bibliografici, ma si distingue per o il livello di dettaglio nella distinzione tra i dati, o le strutture previste per l’immagazzinamento degli attributi e delle relazioni tra entità, o il reperimento e la visualizzazione dei dati
• Queste differenze tecnologiche hanno una forte ricaduta sull’efficienza del sistema, sui costi di creazione e di mantenimento dei dati e sulle possibilità di riutilizzo dei dati bibliografici nel loro complesso C. Bianchini - Dai metadati ai LD
27/05/2014
47
Scenari • Barbara B. Tillett, 2012. Looking to the future with RDA, dia 19-24 (basate su Gordon Dunsire)
C. Bianchini - Dai metadati ai LD
27/05/2014
48
24
27/05/2014
Scenario REICAT REGISTRAZIONE BIBLIOGRAFICA Intestazione/i uniforme/i Persona/Ente Tit. uniforme/i (Opera)
Intestazione/i uniforme/i Persona/Ente Tit. uniforme con aggiunte (Espressione)
Descrizione bibliografica: (Pubblicazioni e doc. d’altro genere) Registr. copia/localizzaz. C. Bianchini - Dai metadati ai LD
Registr. copia/localizzaz. 27/05/2014
49
Qual è lo scenario di RDA?
C. Bianchini - Dai metadati ai LD
27/05/2014
50
25
27/05/2014
Flessibilità di RDA • Tra i principi alla base di RDA, è inserita la flessibilità delle regole • Flessibilità significa che i dati dovrebbero funzionare indipendentemente dal formato, dal medium e dal sistema usato per immagazzinare o comunicare i dati • I dati dovrebbero essere adatti all’utilizzo in qualsiasi ambiente (o scenario) Perciò RDA è uno “standard di contenuto”
C. Bianchini - Dai metadati ai LD
27/05/2014
51
Standard di contenuto • Come standard di contenuto, RDA risponde esclusivamente alla domanda «Quali dati devo registrare?» • Con RDA si producono dati che possono essere registrati utilizzando schemi di codifica diversi (per es. MARC 21, MODS, Dublin Core …) • I dati RDA possono essere visualizzati utilizzando convenzioni di visualizzazione diverse (per es. ISBD, formato a bandiera …) • I dati RDA possono essere registrati negli attuali database o in strutture di database di nuova generazione C. Bianchini - Dai metadati ai LD
27/05/2014
52
26
27/05/2014
Granularità in RDA RDA ha un modello di dati (data model) con una maggiore granularità rispetto ai precedenti codici; Ciò significa che RDA prevede: • un element set più esteso, cioè un insieme maggiore di elementi di dati da riconoscere e da registrare • un maggiore dettaglio e precisione nella rappresentazione delle relazioni, che assumono valori prestabiliti registrati nei Vocabularies
C. Bianchini - Dai metadati ai LD
27/05/2014
53
Element sets e Vocabularies • È opportuno chiarire la distinzione tra Element sets e Vocabularies • Esempio (a)Opera – CreataDa – Persona (b) Manifestazione – RegistrataSu – Tipo di supporto
C. Bianchini - Dai metadati ai LD
27/05/2014
54
27
27/05/2014
Element set Nella relazione (tripla) (a) Opera – CreataDa – Persona gli elementi Opera e Persona possono assumere qualsiasi valore per i rispettivi attributi «Titolo» e «Nome» Il valore assunto dagli elementi quindi è aperto
C. Bianchini - Dai metadati ai LD
27/05/2014
55
Vocabularies Nella relazione (tripla) (b) Manifestazione – RegistrataSu – Tipo di Supporto i valori dell’elemento Tipo di supporto (Carrier type) possono variare, ma solo all’interno di un elenco chiuso ed esaustivo, che fornisce tutti e soltanto i tipi di supporto esplicitamente previsti.
C. Bianchini - Dai metadati ai LD
27/05/2014
56
28
27/05/2014
C. Bianchini - Dai metadati ai LD
27/05/2014
57
Element
Vocabulary
C. Bianchini - Dai metadati ai LD
27/05/2014
58
29
27/05/2014
Element sets e vocabularies • La distinzione è utile perché i vocabolari consentono di mantenere un maggiore controllo sulla coerenza e sulla affidabilità dei dati • I vocabolari hanno lo svantaggio di richiedere un aggiornamento costante. • Per esempio l’Appendice D – Designazioni specifiche del materiale delle REICAT non prevede come supporto le chiavette USB o le MicroSD C. Bianchini - Dai metadati ai LD
27/05/2014
59
Entità di RDA • In tutti gli scenari che abbiamo visto, il tipo e gli attributi delle entità e che si possono/devono descrivere sono stabilite dalle regole che si applicano. • L’insieme degli elementi previsti da RDA è definito in appositi registri chiamati RDA element sets. Per esempio: • FRBR entities for RDA (14 entità) • RDA Group 1: 469 elementi • RDA Group 2: 62 elementi • RDA Group 3: 19 elementi C. Bianchini - Dai metadati ai LD
27/05/2014
60
30
27/05/2014
Relazioni di RDA • Anche il valore delle relazioni deve essere definito in modo esplicito. • RDA ha inserito in un apposito registro RDA 508 elementi, cioè possibili valori delle RDA Relationships for Works, Expressions, Manifestations, Items. Per esempio sono state previste le relazioni: • «basato su» (Opera-Opera) • «adattamento di» (Opera-Opera) • «adattamento radiofonico di» (Opera-Opera) • «commento di» (Opera-Opera)
C. Bianchini - Dai metadati ai LD
27/05/2014
61
RDA: dal record ai dati • Due parti principali organizzate in 10 sezioni • • • • • • • • • •
Sezione 1. Registrare gli attributi delle manifestazioni e degli item Sezione 2. Registrare gli attributi delle opere e delle espressioni Sezione 3. Registrare gli attributi di persone, famiglie ed enti Sezione 4. Registrare gli attributi di concetto, oggetto, evento e luogo Sezione 5. Registrare le relazioni primarie tra opera, espressione, manifestazione e item Sezione 6. Registrare le relazioni con persone, famiglie ed enti Sezione 7. Registrare le relazioni con concetti, oggetti, eventi e luoghi Sezione 8. Registrare le relazioni tra opere, espressioni, manifestazioni e item Sezione 9. Registrare le relazioni tra persone, famiglie ed enti Sezione 10. Registrare le relazioni tra concetti, oggetti, eventi e luoghi
C. Bianchini - Dai metadati ai LD
27/05/2014
62
31
27/05/2014
RDA: dal record ai dati • Due parti principali organizzate in 10 sezioni • • • • • • • • • •
Sezione 1. Registrare gli attributi delle manifestazioni e degli item Sezione 2. Registrare gli attributi delle opere e delle espressioni Sezione 3. Registrare gli attributi di persone, famiglie ed enti Sezione 4. Registrare gli attributi di concetto, oggetto, evento e luogo Sezione 5. Registrare le relazioni primarie tra opera, espressione, manifestazione e item Sezione 6. Registrare le relazioni con persone, famiglie ed enti Sezione 7. Registrare le relazioni con concetti, oggetti, eventi e luoghi Sezione 8. Registrare le relazioni tra opere, espressioni, manifestazioni e item Sezione 9. Registrare le relazioni tra persone, famiglie ed enti Sezione 10. Registrare le relazioni tra concetti, oggetti, eventi e luoghi
C. Bianchini - Dai metadati ai LD
27/05/2014
63
RDA: dal record ai dati • Due parti principali organizzate in 10 sezioni • • • • • • • • • •
Sezione 1. Registrare gli attributi delle manifestazioni e degli item Sezione 2. Registrare gli attributi delle opere e delle espressioni Sezione 3. Registrare gli attributi di persone, famiglie ed enti Sezione 4. Registrare gli attributi di concetto, oggetto, evento e luogo Sezione 5. Registrare le relazioni primarie tra opera, espressione, manifestazione e item Sezione 6. Registrare le relazioni con persone, famiglie ed enti Sezione 7. Registrare le relazioni con concetti, oggetti, eventi e luoghi Sezione 8. Registrare le relazioni tra opere, espressioni, manifestazioni e item Sezione 9. Registrare le relazioni tra persone, famiglie ed enti Sezione 10. Registrare le relazioni tra concetti, oggetti, eventi e luoghi
C. Bianchini - Dai metadati ai LD
27/05/2014
64
32
27/05/2014
Parte 3 Evoluzione degli opac
C. Bianchini - Dai metadati ai LD
27/05/2014
65
Tipi di ricerche di informazioni • Ricerca esplorativa (Exploratory Search) o o o o
Ha per scopo ottenere informazioni generali Non si hanno preferenze relative ad aspetti del tema Non si ha familiarità con le parole chiave In genere il lettore ha bisogno di aiuto
• Ricerca consapevole (Known Item research) o Si ha familiarità con parole chiave o termini della ricerca o Si ha una specifica risorsa in mente (rivista, libro ecc.) o Si sa da dove partire (sito web, database ecc.)
(Sweet, 2012) C. Bianchini - Dai metadati ai LD
27/05/2014
66
33
27/05/2014
Comportamento degli utenti OCLC 2008, 2005 L’84% degli utenti non sa da dove iniziare la ricerca L’84% degli utenti inizia la propria ricerca da un motore di ricerca [Quale risposta forniscono i motori di ricerca?] Quale risposta forniscono le biblioteche?
C. Bianchini - Dai metadati ai LD
27/05/2014
67
Esempio 1: Known item search
C. Bianchini - Dai metadati ai LD
27/05/2014
68
34
27/05/2014
Esempio 2: Ricerca esplorativa
? C. Bianchini - Dai metadati ai LD
27/05/2014
69
Le ricerche con i motori • I motori di ricerca: • Sono più efficaci nella ricerca consapevole (known item search) • Forniscono risposte non personalizzate (ma esistono i profiles); • Manipolano (e lasciano manipolare) l’ordinamento delle risposte • Indicizzano una piccolissima porzione di internet (copertura di Google = 0,004%) • Non ‘vedono’ i dati dei nostri opac
C. Bianchini - Dai metadati ai LD
27/05/2014
70
35
27/05/2014
Le ricerche in biblioteca ieri • Il catalogo (soprattutto in passato) risponde bene a ricerche di oggetti conosciuti • Il catalogo in passato era sempre utilizzato nel contesto della biblioteca, nella quale il bibliotecario soddisfaceva direttamente le esigenze delle ricerche esplorative (con gli strumenti di reference o con il servizio di reference) e aiutava a superare il momento critico iniziale della ricerca
C. Bianchini - Dai metadati ai LD
27/05/2014
71
27/05/2014
72
Opac tradizionale
C. Bianchini - Dai metadati ai LD
36
27/05/2014
Evoluzione dell’opac La complessità d’uso dell’interfacce semplici e avanzate degli opac tradizionali ha spinto a sviluppare interfacce più amichevoli Negli opac ‘arricchiti’, il software si è ‘arricchito’, con nuove funzioni orientate a rendere più semplici ed efficaci: 1. l’interazione dell’utente con il catalogo; e 2. l’interazione degli utenti tra loro
C. Bianchini - Dai metadati ai LD
27/05/2014
73
27/05/2014
74
Opac arricchiti
C. Bianchini - Dai metadati ai LD
37
27/05/2014
C. Bianchini - Dai metadati ai LD
27/05/2014
75
Problemi aperti Opac tradizionali e opac arricchiti presentano tre importanti problemi dal punto di vista dell’utente: 1. La necessità di ripetere l’interrogazione tante volte quante sono le banche dati (silos) di interesse per la ricerca 2. La scarsa navigabilità dei dati bibliografici 3. La separazione dei dati dell’universo bibliografico (MARC) dai dati del web
C. Bianchini - Dai metadati ai LD
27/05/2014
76
38
27/05/2014
Problema 1 Ricerche separate per silos LIBRI
PERIODICI
CONTENUTI LOCALI
Catalogo
Indici e Abstract
OAI Harverster
Ebooks
Full Text
Sito/Deposito Istituzionale
C. Bianchini - Dai metadati ai LD
27/05/2014
77
Ricerche uniche ‘federate’ LIBRI
PERIODICI
CONTENUTI LOCALI
Catalogo
Indici e Abstract
OAI Harverster
Ebooks
Full Text
Deposito Istituzionale
NEXT GENERATION CATALOGUES
C. Bianchini - Dai metadati ai LD
27/05/2014
78
39
27/05/2014
C. Bianchini - Dai metadati ai LD
27/05/2014
79
Ricerche uniche indicizzate LIBRI
PERIODICI
CONTENUTI LOCALI
Catalogo
Indici e Abstract
OAI Harverster
Ebooks
Full Text
Deposito Istituzionale
INDICE
C. Bianchini - Dai metadati ai LD
DISCOVERY TOOLS
27/05/2014
80
40
27/05/2014
Problema 2 Cataloghi FRBR-izzati
C. Bianchini - Dai metadati ai LD
27/05/2014
81
27/05/2014
82
Problema 2 Cataloghi FRBR-izzati
C. Bianchini - Dai metadati ai LD
41
27/05/2014
Cataloghi FRBR-izzati
C. Bianchini - Dai metadati ai LD
(link)
27/05/2014
83
La struttura degli opac NGC E DISCOVERY TOOLS Indici e Abstract OPAC ARRICCHITI Full Text OPAC TRADIZIONALE
BANCA DATI BIBLIOGRAFICA (MARC) C. Bianchini - Dai metadati ai LD
27/05/2014
84
42
27/05/2014
Problema 3 Separazione biblioteche vs web SITI WEB
LIBRI
BLOGOSFERA PERIODICI E-COMMERCE CONTENUTI LOCALI
C. Bianchini - Dai metadati ai LD
OPEN ACCESS
27/05/2014
85
27/05/2014
86
Soluzioni?
C. Bianchini - Dai metadati ai LD
43
27/05/2014
Parte 4 Linked data
C. Bianchini - Dai metadati ai LD
27/05/2014
87
Il web dei documenti Non solo i dati di MAB hanno problemi di visibilità sul web. Anche i siti web hanno bisogno di un modello diverso da quello attuale per almeno due esigenze: 1. Collegare le informazioni del web in modo più stretto 2. Creare servizi di informazione che si aggiornino in modo automatico
C. Bianchini - Dai metadati ai LD
27/05/2014
88
44
27/05/2014
Creare servizi d’informazione aggiornati
C. Bianchini - Dai metadati ai LD
27/05/2014
89
Aggiornamento del sito Esistono tre possibili modelli di aggiornamento del sito di esempio; i curatori: A. cercano le notizie sul web e aggiornano il proprio sito manualmente; B. cercano le notizie sul web, scrivono un programma per estrarre i dati e poi li inseriscono nel proprio sito; C. tramite apposite API (Application Program Interface), cercano sul web, interpretano e raccolgono i dati rilevanti e inseriscono i dati ottenuti in modo automatico nel proprio sito Tutti questi sistemi richiedono comunque un intervento umano. C. Bianchini - Dai metadati ai LD
27/05/2014
90
45
27/05/2014
Il modello BBC • Utilizza insiemi di dati esterni e pubblici • Per esempio Wikipedia, MusicBrainz …
• Questi siti rendono le proprie informazioni accessibili direttamente in forma di dati o Sui siti non ci sono API per l’estrazione dei dati o I dati possono essere estratti utilizzando richieste con standard o tramite il protocollo HTTP
C. Bianchini - Dai metadati ai LD
27/05/2014
91
Il modello BBC In pratica, la BBC ha scelto di 1. utilizzare i dati distribuiti sul web come un sistema di gestione dei contenuti (Content Management System) 2. avvalersi della comunità della rete, nel suo insieme, come curatrice dei contenuti
C. Bianchini - Dai metadati ai LD
27/05/2014
92
46
27/05/2014
Il modello BBC
C. Bianchini - Dai metadati ai LD
27/05/2014
93
Creare il web dei dati In conclusione, il sito della BBC è un esempio del passaggio dal web dei documenti al web semantico. Affinché ciò avvenga, è necessaria una infrastruttura adatta a costruire una rete di dati (anziché di documenti), nella quale o I dati siano accessibili sul web, tramite tecnologie web standard o I dati siano interconnessi sul web, ovvero possano essere completamente integrati nel web.
Qui entrano in gioco i linked data C. Bianchini - Dai metadati ai LD
27/05/2014
94
47
27/05/2014
4.1 Definizione di linked data
C. Bianchini - Dai metadati ai LD
27/05/2014
95
I linked data • I linked data sono un insieme di principi e di tecnologie per consentire la pubblicazione di dati modulari, condivisibili e riutilizzabili (nel web) • L’espressione linked data si riferisce a dati pubblicati sul web in una modalità leggibile, interpretabile e, soprattutto, utilizzabile (anche) da un elaboratore • Nel web semantico i data pubblicati devono avere un significato esplicito e devono essere collegati ad altri insiemi di dati esterni. • Ogni dato deve essere completo e autoesplicativo C. Bianchini - Dai metadati ai LD
27/05/2014
96
48
27/05/2014
Dai documenti ai dati • Tim Berners Lee ha pensato che si potesse applicare ai linked data la medesima struttura con cui è stato creato il World Wide Web, allo scopo di condividere i dati su scala globale (es. BBC) • Il World Wide Web oggi disponibile, inteso come spazio unico di pubblicazione di documenti, è cresciuto e si è sviluppato grazie a tre strumenti fondamentali
C. Bianchini - Dai metadati ai LD
27/05/2014
97
Dai documenti ai dati Uno strumento di identificazione globale URI – Uniform Resource Identificator Uno strumento di accesso globale HTTP – HyperText Transfer Protocol Uno strumento di formattazione dei contenuti HTML – HyperText Markup Language
C. Bianchini - Dai metadati ai LD
27/05/2014
98
49
27/05/2014
• URI http://www.anaiveneto.org
C. Bianchini - Dai metadati ai LD
27/05/2014
99
Dai documenti ai dati Lo sviluppo e l’uso di standard (HTTP e HTML) consente di superare le differenze tra le architetture tecnologiche con le quali vengono prodotti i documenti I link (HyperLink) che si intrecciano tra i diversi documenti consentono agli utenti di navigare nella rete. I link sono determinanti per la creazione e il mantenimento di un unico spazio di informazioni globale (il docuverso) C. Bianchini - Dai metadati ai LD
27/05/2014
100
50
27/05/2014
4.2 I principi dei linked data
C. Bianchini - Dai metadati ai LD
27/05/2014
101
Principi per i linked data Tim Berners-Lee (2006) ha definito quali devono essere i requisiti dei linked data; questi sono noti come Principi dei linked data 1. Usare gli URI come nome per le cose 2. Usare degli URI HTTP, in modo che i nomi delle cose si possano cercare 3. Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP 4. Inserire collegamenti ad altri URI, in modo che si possano scoprire cose collegate tra loro
C. Bianchini - Dai metadati ai LD
27/05/2014
102
51
27/05/2014
Definizione di URI • URI sta per Uniform Resource Identifier e indica una sequenza sintetica di caratteri che identifica una risorsa fisica o astratta. Esempi • • • •
mailto:
[email protected] news:comp.infosystems.www.servers.unix tel:+1-816-5551212 http://dbpedia.org/resource/Karlsruhe C. Bianchini - Dai metadati ai LD
27/05/2014
103
Principi dei linked data 1. Usare gli URI come nome per le cose 2. Usare URI HTTP, in modo che quei nomi si possano cercare 3. Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP 4. Inserire collegamenti ad altri URI, in modo che si possano scoprire altre cose collegate
C. Bianchini - Dai metadati ai LD
27/05/2014
104
52
27/05/2014
URI per l’identificazione • Nel primo principio, l’accento è posto sul termine «cose», per indicare che è necessario identificare non solo documenti o contenuti digitali, ma anche oggetti del mondo reale e concetti astratti o o o o
Persone (es. Leonardo da Vinci, Virgilio) Luoghi (es. Venezia, Genova, Monte Bianco) Oggetti (es. il film Casablanca, una Ditta) Relazioni (es. èRegistaDi, RisiedeA, èAmicoDi)
• L’ambito del web si allarga per includere anche oggetti o concetti, non solo documenti • Il termine utilizzato nell’architettura del web per indicare questi oggetti di interesse è risorse. C. Bianchini - Dai metadati ai LD
27/05/2014
105
Gli URI: un nome Esempi Daniel Defoe
http://dbpedia.org/page/Daniel_Defoe
Berlino
http://it.dbpedia.org/resource/Berlino
Los Angeles Lakers
http://dbpedia.org/resource/Los_Angeles _Lakers
C. Bianchini - Dai metadati ai LD
27/05/2014
106
53
27/05/2014
Principi dei linked data 1. Usare gli URI come nome per le cose 2. Usare URI HTTP, in modo che quei nomi si possano cercare 3. Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP 4. Inserire collegamenti ad altri URI, in modo che si possano scoprire altre cose collegate
C. Bianchini - Dai metadati ai LD
27/05/2014
107
HTTP per l’accesso • Il protocollo HTTP è il meccanismo di accesso universale del web. Gli URI HTTP garantiscono un meccanismo di recupero semplice, trasparente e universale • Il secondo principio dei LD richiede l’uso di URI HTTP per consentire agli utenti di essere dereferenziati, cioè reindirizzati a una descrizione dell’oggetto o del concetto identificato, attraverso il protocollo HTTP C. Bianchini - Dai metadati ai LD
27/05/2014
108
54
27/05/2014
Dereferenziazione • Tutti gli URI HTTP devono essere dereferenziabili, cioè devono consentire che un client HTTP (p. es. un browser) possa cercare l’URI attraverso il protocollo HTTP e trovare la descrizione della risorsa identificata da quell’URI Esempio • http://dbpedia.org/page/Italo_Svevo
C. Bianchini - Dai metadati ai LD
27/05/2014
109
URI dereferenziabili • Creare nomi attraverso gli URI presenta due vantaggi notevoli: 1) È un modo semplice per creare nomi univoci (su scala globale) in modo decentralizzato, dato che qualsiasi proprietario di un sito web può creare nuovi riferimenti URI. 2) Gli URI non sono solo il nome di un oggetto; se sono di tipo HTTP costituiscono anche un punto di accesso alla risorsa e alle relative informazioni
C. Bianchini - Dai metadati ai LD
27/05/2014
110
55
27/05/2014
URI dereferenziabili 2 • Nella catalogazione classica conosciamo da sempre un dispositivo che costituisce il nome di una risorsa e funge da strumento di accesso alla risorsa stessa:
L’INTESTAZIONE • Un URI HTTP e un’intestazione sono equiparabili dal punto di vista funzionale
C. Bianchini - Dai metadati ai LD
27/05/2014
111
Principi dei linked data 1. Usare gli URI come nome per le cose 2. Usare URI HTTP, in modo che quei nomi si possano cercare 3. Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP 4. Inserire collegamenti ad altri URI, in modo che si possano scoprire altre cose collegate
C. Bianchini - Dai metadati ai LD
27/05/2014
112
56
27/05/2014
Fornire informazioni standard • Per garantire che una vasta gamma di applicazioni (architetture h/w e s/w) sia in grado di utilizzare il contenuto del web, è necessario utilizzare formati di contenuto standard. • Perciò, il terzo principio dei LD richiede l’uso di un unico modello di dati per pubblicare sul web dati strutturati in modo standard
C. Bianchini - Dai metadati ai LD
27/05/2014
113
RDF per il contenuto • Per pubblicare linked data è necessario esprimere i dati secondo il modello Resource Description Framework (RDF) • RDF è un modello di dati estremamente semplice e fortemente orientato al web
C. Bianchini - Dai metadati ai LD
27/05/2014
114
57
27/05/2014
Il modello di dati RDF • L’essenza di RDF è definire relazioni tra gli oggetti sotto forma di triple, cioè affermazioni semplici Esempi Una Persona – LavoraPresso – una Ditta Un Maglione – èDiColore – Rosso
C. Bianchini - Dai metadati ai LD
27/05/2014
115
Il modello di dati RDF 2 • Nei linked data si usa lo stesso modello che è alla base della logica aristotelica • L’interpretazione logica di una tripla RDF consiste nel considerarla una frase del tipo: soggetto – predicato – oggetto I promessi sposi – scrittiDa – Alessandro Manzoni Gioconda – èConservataDa – Museo del Louvre
C. Bianchini - Dai metadati ai LD
27/05/2014
116
58
27/05/2014
Il modello di dati RDF 3 • Il modo più semplice e intuitivo per rappresentare graficamente una tripla è un grafo (orientato) Gioconda – èConservataDa – Museo del Louvre Arco
Nodi èConservataDa
Museo del Louvre
Gioconda
C. Bianchini - Dai metadati ai LD
27/05/2014
117
Le triple • Una tripla è una dichiarazione, nella quale si asserisce che una risorsa (o classe) possiede una certa proprietà • In termini FRBR, equivale a dire che una tripla afferma che un’entità ha un certo attributo o relazione Esempi? Un’Opera – HaPerTitolo – De bello Gallico Un’espressione – HaPerTitolo – La guerra gallica De bello Gallico – HaPerAutore – Caio Giulio Cesare C. Bianchini - Dai metadati ai LD
27/05/2014
118
59
27/05/2014
A che servono le triple? • Mediante una concatenazione di triple è possibile esprimere dati molto complessi, in modo che siano leggibili, modulari e riutilizzabili anche da una macchina. Esempio Robinson Crusoe / Daniel Defoe
C. Bianchini - Dai metadati ai LD
27/05/2014
119
Linked Data Triple
Linguaggio naturale
«Daniel Defoe» «èAutoreDi» «Robinson Crusoe» «Robison Crusoe» «è» «un titolo» «Daniel Defoe» «è» «un nome» «Robinson Crusoe» «è il titolo di» «Un’opera» «Daniel Defoe» «è il nome di» «Una persona» «Un titolo» «è una proprietà di» «un’opera» Robinson Crusoe / Daniel Defoe
«Un nome» «è una proprietà di» «una persona» …. ??
C. Bianchini - Dai metadati ai LD
27/05/2014
120
60
27/05/2014
A che servono le triple? • In base alle triple esistenti, un elaboratore può ‘dedurre’ molti dati. Per esempio, è in grado di inferire nuove triple corrette Esempi: «Alberto» «èFiglioDi» «Andrea» «Agata» «èFigliaDi» «Andrea» «Alberto» «èFratelloDi» «Agata»
C. Bianchini - Dai metadati ai LD
27/05/2014
121
Composizione delle triple Nelle triple RDF: • Il soggetto della tripla è l’URI che identifica la risorsa; l’URI corrisponde infatti al ‘nome univoco’ della risorsa; • Il predicato, al centro, è l’URI che indica un tipo di relazione o una proprietà del soggetto • L’oggetto è un URI che corrisponde a un’altra risorsa in relazione con il soggetto, oppure è un semplice dato.
C. Bianchini - Dai metadati ai LD
27/05/2014
122
61
27/05/2014
Tipi di triple Per comprendere meglio il modello logico che si ottiene con RDF, è opportuno distinguere diversi tipi di triple in base al loro: a) Soggetto b) Oggetto c) URI
C. Bianchini - Dai metadati ai LD
27/05/2014
123
Triple in base al soggetto La distinzione delle triple in base al soggetto consente di rappresentare un insieme di triple con due grafi (rappresentazioni) diversi. Un insieme di triple che hanno il medesimo soggetto si può rappresentare con un grafo a grappolo (cluster). Un insieme di triple che hanno per soggetto l’oggetto della tripla precedente forma un grafo a catena. C. Bianchini - Dai metadati ai LD
27/05/2014
124
62
27/05/2014
Grappoli di triple • Un grappolo è un insieme di affermazioni sulla stessa risorsa, ovvero nel quale ogni tripla ha per soggetto lo stesso URI 1952
Ugo Foscolo HaPerNome
10.000 volumi
Roma
HaPerData HaPerLuogo
Biblioteca Ecc.
http://www.foscolo.it
Piazza Garibaldi
02 555666777
[email protected]
C. Bianchini - Dai metadati ai LD
27/05/2014
125
Catene di triple • Oltre ai grappoli, un altro modo semplice per collegare le triple tra loro è la catena.
• Una catena di triple si può sviluppare se l’URI oggetto della prima tripla diventa soggetto della seconda tripla
C. Bianchini - Dai metadati ai LD
27/05/2014
126
63
27/05/2014
Catene di triple Robinson Crusoe HaPerAutore
Daniel Defoe ÈNatoA
Londra Ecc.
Gran Bretagna
C. Bianchini - Dai metadati ai LD
ÈCapitaleDi
27/05/2014
127
Triple in base all’oggetto Si possono distinguere le triple anche dal punto di vista dell’oggetto, che può essere costituito da A. Un URI di un’altra risorsa collegata in qualche modo al soggetto; o B. Un valore letterale (una stringa alfanumerica, un numero, o una data)
C. Bianchini - Dai metadati ai LD
27/05/2014
128
64
27/05/2014
A. Tripla Link RDF • Nel primo caso, gli URI del soggetto e dell’oggetto della tripla identificano due risorse che sono in relazione • L’URI in posizione di predicato definisce il tipo di relazione sussiste tra le risorse • Nastassia Kinsky – HaRecitatoIn – Paris, Texas (film) • N.B. Tutti e tre gli elementi sono identificati da un URI univoco; perciò il grafo della tripla diventa: C. Bianchini - Dai metadati ai LD
27/05/2014
129
A. Triple link RDF
C. Bianchini - Dai metadati ai LD
27/05/2014
130
65
27/05/2014
B. Tripla letterale • Le triple letterali sono utilizzate per descrivere le risorse, per esempio per indicare il nome, o la data di nascita di una persona, un numero … • Nastassia Kinsky – haPerNome – «Nastassja» • I primi due elementi della tripla sono identificati da un URI univoco; perciò il grafo della tripla diventa:
C. Bianchini - Dai metadati ai LD
27/05/2014
131
27/05/2014
132
B. Tripla letterale Esempio < http://xmlns.com/foaf/spec/ #term_givenName>
C. Bianchini - Dai metadati ai LD
66
27/05/2014
Domanda • Quando l’oggetto di una tripla è un valore letterale (literal), la tripla farà parte di una catena o di un grappolo? < http://xmlns.com/foaf/spec/ #term_givenName>
C. Bianchini - Dai metadati ai LD
27/05/2014
133
Risposta • Il primo principio dei Linked Data afferma che si deve assegnare un URI a ogni cosa. • I valori letterali non hanno un URI; perciò non rispettano un principio dei LD e non possono essere in posizione di soggetto di una tripla. • Perciò se una tripla contiene un literal (una stringa alfanumerica, un numero o una data), la catena si interrompe e la tripla fa parte di un grappolo • Questa limitazione garantisce la coerenza del web semantico, perché la corrispondenza dei valori letterali può essere ambigua (p.es. «Chicago») C. Bianchini - Dai metadati ai LD
27/05/2014
134
67
27/05/2014
C. Bianchini - Dai metadati ai LD
27/05/2014
135
C. Bianchini - Dai metadati ai LD
27/05/2014
136
68
27/05/2014
Triple in base all’URI Si possono raggruppare le triple anche in base alla provenienza degli URI delle risorse che fanno parte della tripla (soggetto, predicato e oggetto); gli URI possono essere stati A. Definiti all’interno di un unico dominio, cioè un’unica fonte di dati (link RDF interni) B. Definiti all’interno di domini diversi, per esempio da diversi produttori di dati (link RDF esterni)
C. Bianchini - Dai metadati ai LD
27/05/2014
137
Link RDF interni • I Link RDF interni connettono risorse all’interno di un’unica fonte di linked data (p. es. il medesimo silos). Si dice che le risorse si trovano all’interno dello stesso namespace.
C. Bianchini - Dai metadati ai LD
27/05/2014
138
69
27/05/2014
Definizione di namespace • Per namespace si intende un insieme di URI assegnati a specifiche risorse RDF che usano lo stesso dominio (la stessa infrastruttura di gestione). • Esempio o o o o o
http://dbpedia.org/page/Nastassja_Kinski http://dbpedia.org/property/starring http://dbpedia.org/page/Paris,_Texas_(film) http://dbpedia.org/... http://dbpedia.org/... etc.
C. Bianchini - Dai metadati ai LD
27/05/2014
139
La semantica di RDF • Il terzo principio dei LD richiede che siano fornite informazioni utili in risposta alle richieste di URI HTTP. • In un namespace si devono trovare le descrizioni [metadati] delle risorse (classi e proprietà) che ne fanno parte. • Le descrizioni sono raccolte in Element Sets (classes) e in Vocabularies (properties), come abbiamo visto succede in RDA. Esempio • http://dbpedia.org/page/Italo_Svevo C. Bianchini - Dai metadati ai LD
[Agent; BirthDate) 27/05/2014
140
70
27/05/2014
Namespace dell’IFLA Anche l’IFLA ha provveduto alla creazione di namespaces per i propri standard, come ISBD, FRBR, FRAD, FRSAD ecc. • • • • • •
http://iflastandards.info/ns http://iflastandards.info/ns/isbd/elements/ http://iflastandards.info/ns/fr/ http://iflastandards.info/ns/fr/frbr/frbrer/ http://iflastandards.info/ns/fr/frad/ http://iflastandards.info/ns/fr/frsad/
C. Bianchini - Dai metadati ai LD
27/05/2014
141
Namespace dell’IFLA 2 • Per identificare gli elementi l’IFLA ha scelto di utilizzare degli URI opachi. Questo garantisce: • Neutralità linguistica • Riconoscimento e promozione del multilinguismo (in linea con la strategia dell’IFLA)
Esempio http://iflastandards.info/ns/isbd/elements/P1004 • È l’URI della proprietà (predicato) ISBD “has title proper” (Eng) ed è la stessa URI per “tiene título propiamente dicho” (Spa) C. Bianchini - Dai metadati ai LD
27/05/2014
142
71
27/05/2014
Element sets: FRBRer
C. Bianchini - Dai metadati ai LD
27/05/2014
143
27/05/2014
144
Vocabularies: ISBD
C. Bianchini - Dai metadati ai LD
72
27/05/2014
Esempio • Proviamo a costruire una tripla utilizzando Element Sets e Vocabularies pubblicati dall’IFLA, in particolare ISBD. Dobbiamo esprimere questa relazione: Una risorsa ha per titolo «Robinson Crusoe» • http://iflastandards.info/ns/isbd/elements/C2001 [Resource] • http://iflastandards.info/ns/isbd/elements/P1012 [Has title] • «Robinson Crusoe» C. Bianchini - Dai metadati ai LD
27/05/2014
145
Grafo dell’esempio Esempio
C. Bianchini - Dai metadati ai LD
27/05/2014
146
73
27/05/2014
I vantaggi di RDF • Il modello logico RDF presenta numerosi vantaggi, alcuni dei quali già messi in evidenza. • I principali benefici che si hanno nell’utilizzare il modello di dati RDF nel contesto dei linked data sono: 1. RDF può essere usato su scala globale e consente a chiunque di creare un legame con qualsiasi oggetto 2. Qualsiasi URI consente di ottenere ulteriori informazioni (catene) e quindi qualsiasi tripla RDF costituisce un punto di partenza per navigare. C. Bianchini - Dai metadati ai LD
27/05/2014
147
I vantaggi di RDF 3. Il modello di dati consente di creare link RDF tra dati provenienti da fonti diverse 4. È possibile creare un grafo unico a partire da due insiemi di triple diverse 5. RDF consente di rappresentare in un unico grafo informazioni in origine espresse mediante diversi modelli, mescolando termini da vocabolari diversi 6. In combinazione con linguaggi di schemi (p.e. RDFSchema e OWL) il modello di dati lascia liberi di impiegare a preferenza molti o pochi dati
C. Bianchini - Dai metadati ai LD
27/05/2014
148
74
27/05/2014
Un esempio
C. Bianchini - Dai metadati ai LD
27/05/2014
149
Unire linked data diversi Agenzia A
http://xmlns.com/foaf/spec/#term_name
http://purl.org/dc/terms/title
«Robinson Crusoe» «Daniel Defoe»
http://dbpedia.org/ontology/isbn
C. Bianchini - Dai metadati ai LD
27/05/2014
150
75
27/05/2014
Unire linked data diversi Agenzia B «1998»
http://dbpedia.org/property/publisher
«DK Publishing»
http://dbpedia.org/ontology/isbn
C. Bianchini - Dai metadati ai LD
27/05/2014
151
I dati visti dal web
«1998» http://xmlns.com/foaf/spec/#term_name http://dbpedia.org/property/publisher
«Daniel Defoe»
«DK Publishing»
http://dbpedia.org/ontology/isbn
http://purl.org/dc/terms/title
« Robinson Crusoe» C. Bianchini - Dai metadati ai LD
27/05/2014
152
76
27/05/2014
Web semantico • Nel web semantico, i computer hanno accesso a raccolte strutturate di informazioni e a insiemi di regole di inferenza da potere utilizzare per sviluppare un ragionamento automatico. • Se i dati sono pubblicati come linked data, i computer sono in grado di recuperare dati prodotti da agenzie diverse, interpretarli (cioè riconoscere identità e relazioni) e riutilizzarli
C. Bianchini - Dai metadati ai LD
27/05/2014
153
Esempio RelFinder http://www.visualdataweb.org/relfinder.php
C. Bianchini - Dai metadati ai LD
27/05/2014
154
77
27/05/2014
Esempio Wikidata http://www.wikidata.org/wiki/Q1339 http://tools.wmflabs.org/reasonator/?q=Q1339 http://toolserver.org/~magnus/ts2/geneawiki/
C. Bianchini - Dai metadati ai LD
27/05/2014
155
Creazione delle triple • Una caratteristica fondamentale dei linked data è che sono modulari. • Modularità significa che è possibile creare nuove triple e aggiungerle alle triple esistenti con la certezza che si integrino perfettamente. • Per la creazione delle triple esistono due assunti di base del web semantico o Open world assumption o AAA principle
C. Bianchini - Dai metadati ai LD
27/05/2014
156
78
27/05/2014
Open World Assumption • Il web semantico si basa sull’assunto che l’assenza di una tripla RDF è una prova che la relativa affermazione non è ancora stata fatta (non che è falsa) • In pratica, si ritiene che l’insieme delle triple relative a un soggetto (cluster) è sempre incompleto, e si possono sempre aggiungere nuove triple
C. Bianchini - Dai metadati ai LD
27/05/2014
157
AAA principle • AAA sta per «Anyone can say anything about anything» (Chiunque può affermare qualsiasi cosa su qualsiasi cosa) • È un principio complementare al Open World Assumption • RDF non impedisce a nessuno di creare affermazioni (triple) in conflitto con affermazioni esistenti, o che appaiano prive di significato per qualcuno. RDF accetta tutti i punti di vista e non costituisce un test di veridicità o di qualità C. Bianchini - Dai metadati ai LD
27/05/2014
158
79
27/05/2014
Da RDF a RDF/XML • RDF è un modello di dati per descrivere le risorse nella forma soggetto-predicato-oggetto, rappresentata da un grafo, ma non è un formato di dati. • Il terzo principio dei Linked data stabilisce che i dati devono essere pubblicati in un formato standard. • Il processo di trasformazione dei dati in triple prende il nome di serializzazione • Il W3C ha creato due formati standard per la serializzazione: RDF/XML e RDFa (ma esistono molti altri formati) C. Bianchini - Dai metadati ai LD
27/05/2014
159
27/05/2014
160
Tripla letterale Esempio < http://xmlns.com/foaf/spec/ #term_givenName>
C. Bianchini - Dai metadati ai LD
80
27/05/2014
Tripla in RDF/XML Esempio in RDF/XML http://dbpedia.org/page/Nastassja_Kinski http://xmlns.com/foaf/spec/#term_givenName «Nastassja»
http://dbpedia.org/page/Nastassja_Kinski http://xmlns.com/foaf/spec/#term_givenName «Nastassja»
C. Bianchini - Dai metadati ai LD
27/05/2014
161
Tripla link RDF Esempio
C. Bianchini - Dai metadati ai LD
27/05/2014
162
81
27/05/2014
Tripla link RDF Esempio in RDF/XML [FORMA SINTETICA] < […] xmlns:dbpedia="http://dbpedia.org/page/" xmlns:dbpprop="http://dbpedia.org/property/" … dbpedia:Nastassja_Kinski dbpprop:Starring dbpedia:Paris,_Texas_(film) […] … C. Bianchini - Dai metadati ai LD
27/05/2014
163
Principi dei linked data 1. Usare gli URI come nome per le cose 2. Usare URI HTTP, in modo che quei nomi si possano cercare 3. Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP 4. Inserire collegamenti ad altri URI, in modo che si possano scoprire altre cose collegate
C. Bianchini - Dai metadati ai LD
27/05/2014
164
82
27/05/2014
Collegare ad altre cose • Il quarto principio dei linked data è creare link RDF che colleghino tra loro dati di natura diversa. • In precedenza abbiamo distinto le triple in relazione al loro soggetto (grappoli e catene), oggetto (URI o Literal) e alla provenienza degli URI (stesso namespace o namespaces diversi) • I Link RDF esterni connettono risorse fornite da fonti di linked data diverse (p. es. il soggetto di un libro con altri dati del Web semantico su quel soggetto).
C. Bianchini - Dai metadati ai LD
27/05/2014
165
Collegare ad altre cose • Un link RDF esterno è una tripla nella quale il soggetto ha un URI all’interno di un certo namespace mentre gli URI del predicato e/o dell’oggetto della tripla puntano a namespaces di altri set di dati Esempio • Nastassia Kinsky – èSoggettoDi – Voce di WP inglese
C. Bianchini - Dai metadati ai LD
27/05/2014
166
83
27/05/2014
Triple RDF link esterna Esempio
C. Bianchini - Dai metadati ai LD
27/05/2014
167
Tipi di triple • I collegamenti esterni sono fondamentali per il web dei dati perché sono il collante che collega i «silos dei dati», cioè i namespace in uno spazio globale e unico di dati. • Esse sono di tre tipi: A. relazionali, B. di identità, e C. di vocabolario
C. Bianchini - Dai metadati ai LD
27/05/2014
168
84
27/05/2014
Link relazionali
C. Bianchini - Dai metadati ai LD
27/05/2014
169
Link RDF Relazionali • I link relazionali mettono in relazione risorse registrate in fonti di dati diverse e che hanno qualche aspetto in comune. Per esempio Dante Dolce Stil Novo Daniel Defoe Londra
C. Bianchini - Dai metadati ai LD
27/05/2014
170
85
27/05/2014
Link relazionali • I link RDF relazionali consentono di creare rinvii da risorse descritte in un namespace a risorse descritte in un altro namespace. • Queste ultime, a loro volta, hanno link RDF che si riferiscono a risorse presenti in un terzo insieme di dati, e così via. • Attraverso questi collegamenti senza fine, i link relazionali costituiscono la struttura principale attraverso la quale il web dei dati può diventare un unico gigantesco grafo globale (T. Berners-Lee 2007) C. Bianchini - Dai metadati ai LD
27/05/2014
171
27/05/2014
172
Link di identità
C. Bianchini - Dai metadati ai LD
86
27/05/2014
Link RDF di identità • Nell’ambiente del web aperto è probabile che per oggetti molto famosi (p.e. un luogo o una persona) ci siano molti produttori di informazioni. • Se ciascuno usa un proprio URI per fare riferimento a quella persona o quel luogo, possono esistere molti URI per identificare la stessa risorsa. • I link di identità collegano URI utilizzati da produttori diversi di dati per identificare la stessa «cosa» del mondo reale
C. Bianchini - Dai metadati ai LD
27/05/2014
173
Link RDF di identità 2 Esempio di molti URI per la stessa ‘cosa’ • • • • • • • •
http://ja.dbpedia.org/resource/ベルリン http://ru.dbpedia.org/resource/Берлин http://el.dbpedia.org/resource/Βερολίνο http://it.dbpedia.org/resource/Berlino http://sws.geonames.org/2950159/ http://pt.dbpedia.org/resource/Berlim http://fr.dbpedia.org/resource/Berlin http://de.dbpedia.org/resource/Berlin
C. Bianchini - Dai metadati ai LD
27/05/2014
174
87
27/05/2014
Link RDF di identità 3 • Tutti gli URI che identificano la stessa ‘cosa’ si indicano con il termine alias. • La coerenza logica del web semantico si fonda sul corretto collegamento tra tutti gli alias. • Nel formato standard RDF/XML esiste una proprietà per collegare due alias: http://www.w3.org/2002/07/owl#sameAs C. Bianchini - Dai metadati ai LD
27/05/2014
175
C. Bianchini - Dai metadati ai LD
27/05/2014
176
88
27/05/2014
Scopo dei link di identità I link di identità rispondono a diverse esigenze: 1) Opinioni diverse. Gli URI alias sono molto importanti per il Web dei dati sociale perché dereferenziano (rinviano a) descrizioni della stessa risorsa fornite da editori di dati diversi 2) Tracciabilità. Utilizzare diversi URI consente ai consumatori dei linked data di sapere quello che un particolare editore di dati ha da dire su una specifica entità 3) Assenza di punti centralizzati critici. Se si dovesse usare un unico URI per tutti gli oggetti del mondo, sarebbe necessario creare e gestire un’autorità centrale che assegna i nomi. La complessità del compito creerebbe problemi tali da costituire una barriera notevole allo sviluppo del Web dei Dati C. Bianchini - Dai metadati ai LD
27/05/2014
177
Identità nel Web di dati Da quanto detto sui link di identità, si può notare che il problema dell’identificazione delle identità nel web semantico è stato risolto in modo evolutivo e distribuito; • Evolutivo, perché i link del tipo owl:sameAs possono essere aggiunti progressivamente nel tempo • Distribuito, perché molti editori diversi possono pubblicare dati con un proprio URI e aggiungere un link così lo sforzo complessivo per creare i dati risulta distribuito tra i diversi editori. • [È il modello organizzativo e funzionale del VIAF!] C. Bianchini - Dai metadati ai LD
27/05/2014
178
89
27/05/2014
Link di vocabolario
C. Bianchini - Dai metadati ai LD
27/05/2014
179
Link RDF di vocabolario Oltre a consentire a un client di scoprire nuove fonti di dati seguendo i link tra i dati e a dichiarare l’equivalenza tra URI che identificano la stessa risorsa, i linked data devono permettere di integrare dati provenienti da fonti diverse. L’integrazione tra dati provenienti da fonti diverse è possibile se si creano collegamenti tra i diversi schemi usati per pubblicare i dati sul web
C. Bianchini - Dai metadati ai LD
27/05/2014
180
90
27/05/2014
Schemi di metadati • Nel contesto dei Linked data, uno schema è un «insiemi di elementi e proprietà distinti provenienti da diversi vocabolari RDF e adottati da un’agenzia per pubblicare i propri dati sul web». • Un esempio famoso di schema di metadati è il Dublin Core Metadata Element Set, creato da OCLC per la descrizione delle risorse disponibili in rete
C. Bianchini - Dai metadati ai LD
27/05/2014
181
Esempio di schema: DC L’insieme degli elementi di metadati individuati da DC è stato tradotto in italiano dall’ICCU: Nell’insieme sono compresi quindici elementi: • Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, Rights. Vedi la traduzione in italiano VAI
C. Bianchini - Dai metadati ai LD
27/05/2014
182
91
27/05/2014
Scelta dello schema • Un’agenzia può decidere di usare: A) uno schema che contiene solo termini provenienti da vocabolari conosciuti, come DCMI (Dublin Core Metadata Initiative), FOAF (Friend-of-a-Friend), Music Ontology, BIBO (Bibliographic ontology), oppure B) Uno schema contenente anche termini «proprietari», cioè definiti dall’agenzia sulla base di esigenze specifiche (p. es. «data di creazione»). C. Bianchini - Dai metadati ai LD
27/05/2014
183
Ridurre l’eterogeneità • Se i produttori pubblicano i dati utilizzando schemi di metadati, esistenti o creati ad hoc, nel web si crea una notevole eterogeneità di metadati • Per superare questo problema, il web semantico adotta una duplice strategia: 1. Promuovere il riuso di termini di vocabolari esistenti e largamente diffusi 2. In caso di dati ‘nuovi’, renderli il più autodescrittivi possibile
C. Bianchini - Dai metadati ai LD
27/05/2014
184
92
27/05/2014
Autodescrittività • Nel Web semantico, autodescrittività significa creare termini nuovi mettendo a disposizione tutte le informazioni necessarie perché una macchina li possa tradurre in una rappresentazione (grafo) e li possa interpretare e processare. • Ciò avviene tramite: 1. La mappatura, sotto forma di collegamenti tra termini di vocabolari diversi (noti e nuovi) 2. La dereferenziazione, cioè fornendo descrizioni e definizioni dei nuovi termini.
C. Bianchini - Dai metadati ai LD
27/05/2014
185
I link di vocabolario La mappatura avviene mediante link di vocabolario, che collegano la definizione di un elemento in un certo vocabolario con la definizione dell’elemento corrispondente in un altro vocabolario. Esempio «ISBD:TitleProper» «èUgualeA» «DC:title» SPO
C. Bianchini - Dai metadati ai LD
27/05/2014
186
93
27/05/2014
La proprietà del link di vocabolario SPO • Le proprietà (link RDF di vocabolario) che possono essere usate nella mappatura dei concetti sono definite, a seconda dei casi, in schemi diversi, che hanno capacità espressive differenti. Per esempio: • RDF Schema (RDFS) • Web Ontology Language (OWL) • Simple Knowledge Organization System (SKOS) C. Bianchini - Dai metadati ai LD
27/05/2014
187
Mappatura OWL. Esempi Nello schema OWL (Web Ontology Language) sono previste molte proprietà che possono essere usate come link di vocabolario (per esempio: owl:equivalentClass oppure owl:equivalentProperty) Per es., se si applica la proprietà owl:equivalentClass, si può ottenere il seguente link di vocabolario: Foaf:person owl:equivalentClass FRBR:person
C. Bianchini - Dai metadati ai LD
27/05/2014
188
94
27/05/2014
Mappatura RDFs. Esempi Nello schema RDF Schema esistono altre proprietà che possono essere usate come link di vocabolario (per esempio: rdfs:subClassOf o rdfs:subPropertyOf) Per esempio, se si applica la proprietà rdfs:subClassOf, si può ottenere il seguente link di vocabolario: ISBD:CollectiveTitle rdfs:subClassOf ISBD:TitleProper
C. Bianchini - Dai metadati ai LD
27/05/2014
189
Mappatura SKOS. Esempi Nello schema SKOS (Simple Knowledge Organization System) esistono proprietà più specifiche da usare come link di vocabolario (per esempio skos:broadMatch oppure skos:narrowMatch) Per es., se si applica la proprietà skos:broadMatch, si può ottenere il seguente link di vocabolario: NS:Spade skos:broadMatch NS:Katane
C. Bianchini - Dai metadati ai LD
27/05/2014
190
95
27/05/2014
Nuovo Soggettario in SKOS
C. Bianchini - Dai metadati ai LD
27/05/2014
191
27/05/2014
192
NS: Emicrania
C. Bianchini - Dai metadati ai LD
96
27/05/2014
NS: Emicrania (SKOS) Emicrania 2011-03-30 Nevralgia sopraorbitaria […] C. Bianchini - Dai metadati ai LD
27/05/2014
193
27/05/2014
194
Parte 5 Pubblicare i dati nel web semantico
C. Bianchini - Dai metadati ai LD
97
27/05/2014
Pubblicare i dati nel web Un progetto di pubblicazione di dati bibliografici nel web semantico deve considerare molti aspetti. Possiamo esaminarne in particolare tre: 1) Perché pubblicare i dati delle biblioteche? 2) Quali sono i requisiti per pubblicare i dati delle biblioteche come linked data? 3) Quali sono le fasi del processo di pubblicazione?
C. Bianchini - Dai metadati ai LD
27/05/2014
195
Parte 5.1 Perché pubblicare i dati nel web semantico
C. Bianchini - Dai metadati ai LD
27/05/2014
196
98
27/05/2014
LLD XG del W3C • Nel maggio 2011, il World Wide Web Consortium ha incaricato un gruppo di lavoro di studiare nuovi modi per • «favorire l’aumento dell’interoperabilità globale dei dati bibliografici sul web, facendo collaborare persone coinvolte nelle attività del web semantico nella comunità bibliotecaria»
C. Bianchini - Dai metadati ai LD
27/05/2014
197
Rapporto del LLD XG • Il rapporto finale indica come utilizzare gli standard del Web Semantico e i principi dei linked data per rendere più visibili e riutilizzabili nel web aperto le preziose raccolte di informazioni create e curate dalle biblioteche. • In particolare, l’interesse del web semantico si indirizza verso la disponibilità di: 1. dati bibliografici, 2. dati di autorità e 3. schemi concettuali. C. Bianchini - Dai metadati ai LD
27/05/2014
198
99
27/05/2014
Raccomandazioni chiave • Che i responsabili delle biblioteche identifichino gli insiemi di dati potenzialmente idonei a essere tradotti per primi sotto forma di linked data; inoltre promuovano il dibattito sull’apertura dei dati e dei relativi diritti • Che gli enti di standardizzazione bibliografica • a) promuovano la partecipazione delle biblioteche alla standardizzazione del Web semantico e gli standard per dati bibliografici compatibili con i LD e • b) diffondano le migliori pratiche di progettazione di modelli adatti ai linked data bibliografici; C. Bianchini - Dai metadati ai LD
27/05/2014
199
Raccomandazioni chiave • Che i progettisti dei sistemi e dei dati sviluppino servizi avanzati per l’utente basati sui LD, creino URI per gli oggetti dei dataset, promuovano politiche di gestione dei vocabolari RDF e dei relativi URI e pubblichino i dati bibliografici riutilizzando vocabolari già esistenti o mappando i nuovi termini; • Che i bibliotecari, archivisti e curatori dei musei conservino gli element sets e i vocabolari dei LD bibliografici e applichino l’esperienza delle biblioteche nella cura e nella conservazione a lungo termine degli element sets dei LD C. Bianchini - Dai metadati ai LD
27/05/2014
200
100
27/05/2014
I dati delle biblioteche • I Library linked data che si possono derivare dalle registrazioni bibliografiche esistenti, costruite in base a standard internazionali e condivisi, sono molto importanti per il web semantico per ragioni di quantità e di qualità. • Riguardano molte delle risorse disponibili che interessano gli utenti del web semantico. • L’aspetto più importante è rappresentato dai principi usati nella costruzione dei data bibliografici
C. Bianchini - Dai metadati ai LD
27/05/2014
201
Principi per i linked data Nel nostro linguaggio professionale, potremmo definire i principi indicati da Tim Berners-Lee per realizzare i linked data, con il termine funzioni: 1. 2.
3.
4.
Usare gli URI come nome per le cose Usare degli URI HTTP, in modo che quei nomi si possano cercare Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP Inserire collegamenti ad altri URI, in modo che si possano scoprire altre cose collegate
C. Bianchini - Dai metadati ai LD
1. Identificare i dati 2. Rendere accessibili i dati 3. Giustificare i dati 4. Collegare i dati
27/05/2014
202
101
27/05/2014
Principi per i linked data In FRAD le stesse funzioni sono state formalmente definite come funzioni utente, e corrispondono largamente ai principi dei linked data: 1. 2. 3. 4.
Identificare i dati Rendere accessibili i dati Giustificare i dati Collegare i dati
2. Identificare 1. Trovare 4. Giustificare 3. Contestualizzare
nel web C. Bianchini - Dai metadati ai LD
27/05/2014
203
I dati delle biblioteche 2 • Il legame e la corrispondenza tra i principi dei Linked Data e le funzioni di FRAD dimostrano che i dati creati dalle biblioteche per il controllo di autorità, che riguardano persone, enti, luoghi, soggetti e altri aspetti sono molto importanti per la costruzione del web e possono interessare anche al di fuori dell’ambito bibliografico puro.
C. Bianchini - Dai metadati ai LD
27/05/2014
204
102
27/05/2014
Parte 5.2 Come pubblicare i dati nel web semantico
C. Bianchini - Dai metadati ai LD
27/05/2014
205
Linked (Open) Data • Come avviene per la pubblicazione di informazioni nel web dei documenti, la pubblicazione dei dati sul web delle biblioteche sul web si può realizzare con diversi gradi di apertura e di interoperabilità. • L’apertura si riferisce alle politiche di pubblicazione con licenze d’uso gratuite e all’uso di formati aperti anziché formati proprietari • L’interoperabilità si all’uso di modalità tecniche di pubblicazione che rendano sempre più facile la condivisione, il riuso e la modularità. C. Bianchini - Dai metadati ai LD
27/05/2014
206
103
27/05/2014
Pubblicare in 5 passi Il diverso grado di apertura e di interoperabilità è stato espresso da Tim Berners Lee mediante una scala contrassegnata da un numero crescente di stelle (da 1 a 5) * Licenza. I dati sono disponibili sul web (in qualunque formato) ma con una licenza aperta ** Dati strutturati. i dati sono disponibili come dati strutturati leggibili da una macchina (e.g. una tabella in Excel invece che sotto forma di immagine) C. Bianchini - Dai metadati ai LD
27/05/2014
207
Pubblicare in 5 passi *** Formato. i dati sono disponibili come al punto 2 ma in un formato non proprietario (es. CSV invece che Excel) **** Dereferenziazione. Per identificare le cose si usano URI HTTP, in modo che si possano identificare le cose e ottenere informazioni utili in formato standard ***** Linked data. i dati sono disponibili come ai punti precedenti, più link esterni ai dati di altre fonti per fornire il contesto più adatto. C. Bianchini - Dai metadati ai LD
27/05/2014
208
104
27/05/2014
Parte 5.3 Il processo di pubblicazione
C. Bianchini - Dai metadati ai LD
27/05/2014
209
Pubblicare i dati nel web Un insieme di metadati si può considerare come il risultato di cinque componenti fondamentali: 1) Uno schema o element set (gli elementi che si vogliono registrare) 2) Uno o più vocabolari (specifici ‘termini' o ‘valori' che si registrano negli elementi) 3) Un modello concettuale – il modello implicito che descrive come tutte le informazioni e I concetti relativi a una risorsa sono collegati tra loro (p.es. FRBR) 4) Uno standard di contenuto – un codice che descrive come le singole informazioni (p.es. i vocabolari) devono essere inseriti negli elementi dello schema di metadati (p.es. RDA) 5) Un formato di codifica, che si occupa del modo nel quale i metadati vengono presentati (p.es. RDF/XML) C. Bianchini - Dai metadati ai LD
27/05/2014
210
105
27/05/2014
Processo di pubblicazione • Il processo di pubblicazione dei dati dovrebbe avvenire seguendo queste fasi: 1. Si ricercano classi e proprietà già definiti in vocabolari esistenti sul web, che possano essere riutilizzate per rappresentare i propri dati 2. Se i vocabolari disponibili non sono sufficienti, si aggiungono alle classi e le proprietà già disponibili nuove e specifiche classi e proprietà autodescrittive per esprimere il resto dei dati 3. In seguito, si continua a controllare se le nuove classi e proprietà sono state create anche in altri (nuovi) vocabolari e si mappano i termini. C. Bianchini - Dai metadati ai LD
27/05/2014
211
Le ontologie Quando si crea uno schema di metadati che riutilizza elementi diffusi e provenienti da vocabolari esistenti, si devono definire tutti i rapporti tra i vari elementi. • L’insieme delle triple, e il relativo grafo RDF, che descrive a livello generale lo schema dei metadati, si chiama ontologia. • L’ontologia fornisce una rappresentazione formale della struttura dei dati in termini di classi e proprietà. • L’ontologia è lo strumento che consente all’elaboratore di ‘dedurre’ nuove triple.
C. Bianchini - Dai metadati ai LD
27/05/2014
212
106
27/05/2014
Le ontologie. Esempio • Definiamo un’ontologia semplice
Persona
ÈPadreDi
ÈPadreDi
Persona
ÈPadreDi
ÈFratelloOSorelladi Persona
ÈFratelloOSorelladi Persona
C. Bianchini - Dai metadati ai LD
27/05/2014
213
Le ontologie. Esempio • Applichiamo l’ontologia
Andrea
ÈPadreDi
ÈPadreDi
Alberto
ÈPadreDi
ÈFratelloOSorelladi Aurora
C. Bianchini - Dai metadati ai LD
ÈFratelloOSorelladi Agata
27/05/2014
214
107
27/05/2014
Le ontologie. Esempio 2 • Definiamo un’ontologia con ISBD Proprietà
Risorsa (ISBD)
Ha per titolo proprio (ISBD)
Proprietà SubProprietà Ha per titolo (ISBD)
Title (DC)
EquivaleA C. Bianchini - Dai metadati ai LD
27/05/2014
215
HaPerTitoloProprio Risorsa (ISBD)
HaPerTitolo
«Robinson Crusoe» C. Bianchini - Dai metadati ai LD
«Robinson Crusoe» TitleDC
«Robinson Crusoe» 27/05/2014
216
108
27/05/2014
C. Bianchini - Dai metadati ai LD
27/05/2014
217
Grafo per la pubblicazione dei dati TitoloLibro
NomeAutore
IDAutore
URI DBPedia
C. Bianchini - Dai metadati ai LD
dc:creator
IDLibro
URI Europeana URI Europeana
URI DBPedia 27/05/2014
218
109
27/05/2014
Schemi per i beni culturali • Nel pubblicare i propri dati, un’agenzia deve tenere conto degli schemi già esistenti. • Nell’ambito dei beni culturali, esistono innumerevoli schemi di metadati già disponibili e mappati ad altri schemi. • Una rappresentazione grafica dell’esistenza di questi schemi e dei loro legami (mappature) reciproche è data dalla Linked Open Data Cloud (vai)
C. Bianchini - Dai metadati ai LD
27/05/2014
219
Strumenti per schemi Per realizzare uno schema di metadati per la creazione dei linked data, l’agenzia dovrebbe controllare se un determinato elemento è già definito all’interno di uno schema esistente. A questo scopo può essere utile uno strumento come LOV – Linked Open Vocabularies, che consente di cercare oggetti a livello di vocabolari o di elemento
C. Bianchini - Dai metadati ai LD
27/05/2014
220
110
27/05/2014
C. Bianchini - Dai metadati ai LD
27/05/2014
221
Linked data ‘bibliografici’? • Nel web costituito dai linked data, non esiste più la distinzione tra dati “bibliografici” e dati “di altra natura”; • Subentra la distinzione tra dati connessi e dati non connessi. • Con l’espressione linked data bibliografici (library linked data) si indicano perciò dati pubblicati come linked data e il cui contenuto abbia rilevanza bibliografica • Verso i «cultural heritage linked data»? C. Bianchini - Dai metadati ai LD
27/05/2014
222
111
27/05/2014
Registrazioni bibliografiche? • Quali conseguenze – logiche e pratiche – può avere l’abbandono del concetto di descrizione bibliografica tradizionale (record)? • Non si ha più la redazione di record, ma la definizione dei dati (relativi a un’opera, a un autore, ecc.) formulati per lo più tramite termini estratti da vocabolari e ontologie. • Si assiste al passaggio dal record management all’entity management.
C. Bianchini - Dai metadati ai LD
27/05/2014
223
Registrazioni bibliografiche? Esempio: Robinson Crusoe • • • •
Robinson Crusoe da DBpedia inglese Robinson Crusoe da DBpedia italiana Robinson Crusoe da WorldCat Robinson Crusoe da data.bnf.fr
C. Bianchini - Dai metadati ai LD
27/05/2014
224
112
27/05/2014
La funzione di ‘custodia’ • Se le triple originali che descrivono l’ontologia di un oggetto, come la sua etichetta e la sua descrizione, andassero perdute, sarebbe fortemente diminuito il valore e la validità stessa di tutte le altre triple che usano quegli URI e sarebbe potenzialmente a rischio anche l’integrità del web semantico • I professionisti MAB hanno la responsabilità di conservare i propri dati ma anche tutti gli insiemi di dati e vocabolari di rilevanza culturale.
C. Bianchini - Dai metadati ai LD
27/05/2014
225
Grazie! Carlo Bianchini Dipartimento di Musicologia e beni culturali (Cremona) Università degli studi di Pavia carlo(dot)bianchini(at)unipv(dot)it
C. Bianchini - Dai metadati ai LD
27/05/2014
226
113
27/05/2014
Bibliografia consigliata • Berners-Lee, Tim (2007), Giant Global Graph, Retrieved from http://dig.csail.mit.edu/breadcrumbs/node/215 • Bianchini, C. (2010). Futuri scenari: RDA, REICAT e la granularità dei cataloghi. Bollettino AIB, 50(3), 219–238. Retrieved from http://bollettino.aib.it/article/view/5319/5082 • Bianchini, C. (2012a). Dagli OPAC ai Library Linked Data: come cambiano le risposte ai bisogni degli utenti. AIB Studi, 52(3), 303–323. doi:10.2426/aibstudi-8597 • Bianchini, C. (2012b). Il Library Linked Data Incubator Group e il futuro delle biblioteche. Disponibile a http://eprints.rclis.org/16886/ • Bizer, C., Heath, T., & Berners-Lee, T. (2009). Linked data. The story so far. International Journal of Semantic Web Inf. Syst., 5(3), 1–22. C. Bianchini - Dai metadati ai LD
27/05/2014
227
Bibliografia consigliata • Cossham, A. F. (2013). Bibliographic records in an online environment. Information Research, 18(3). Retrieved from informationr.net/ir/18-3/colis/paperC42.html • Davis, I., & Heath, T. (2009). The thirty minute guide to RDF and Linked Data. Retrieved September 30, 2012, from http://www.slideshare.net/iandavis/30-minute-guide-to-rdfand-linked-data • Decker, S., Hausenblas, M., Schneider, J., & Lopes, N. (2012). Linked Data in the Digital Humanities. lodlam.net. Retrieved September 30, 2012, from http://lodlam.net/2012/10/27/linkeddata-in-the-digital-humanities/ • Dunsire, G., Hillmann, D., & Phipps, J. (2012). Reconsidering Universal Bibliographic Control in Light of the Semantic Web. Journal of Library Metadata, 12(2-3), 164–176. doi:10.1080/19386389.2012.699831 C. Bianchini - Dai metadati ai LD
27/05/2014
228
114
27/05/2014
Bibliografia consigliata • Dunsire, G., & Willer, M. (2011). Standard library metadata models and structures for the Semantic Web. Library Hi Tech News, 28(3), 1–12. doi: http://dx.doi.org/10.1108/07419051111145118 • Dunsire, G., & Willer, M. (2011). UNIMARC and Linked Data. Relazione presentata a IFLA 2011, Puerto Rico. Retrieved from http://conference.ifla.org/past/2011/187-dunsire-en.pdf • Guerrini, M., Crupi, G., & Peruginelli, G. (2013). Global interoperability and linked data in libraries: special issue. JLIS.it, 4(1), 452. Retrieved from http://leo.cilea.it/index.php/jlis/issue/view/536 • Guerrini, M., & Possemato, T. (2012). Linked data: un nuovo alfabeto del web semantico. Biblioteche oggi, 30(3), 7–15. Retrieved from http://www.bibliotecheoggi.it/content/201200300701.pdf C. Bianchini - Dai metadati ai LD
27/05/2014
229
Bibliografia consigliata • Heath, T., & Bizer, C. (2011). Linked Data: Evolving the Web into a Global Data Space. Synthesis Lectures on the Semantic Web: Theory and Technology, 1(1), 1–136. doi:10.2200/S00334ED1V01Y201102WBE001 • Hyvönen, E. (2012). Publishing and Using Cultural Heritage Linked Data on the Semantic Web. Synthesis Lectures on the Semantic Web: Theory and Technology, 2(1), 1–159. doi:doi: 10.2200/S00452ED1V01Y201210WBE003 • Tillett, Barbara B. 2011. “Looking to the future with RDA.” www.loc.gov 40. Retrieved (http://www.loc.gov/aba/rda/source/Looking_to_the_future_ with_RDA_English.ppt ). • Willer, M., Dunsire, G., & Bosancic, B. (2010). ISBD and the Semantic Web. JLIS.it, 1(2), 213–236. Retrieved from http://leo.cilea.it/indexphp/jlis/article/view/4536 C. Bianchini - Dai metadati ai LD
27/05/2014
230
115
27/05/2014
Siti web • • • • •
• •
http://dublincore.org/documents/library-application-profile/ Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/ Richard Wallis, Why schema.org for libraries?, http://www.slideshare.net/rjw/why-schemaorg Educational Curriculum for the usage of Linked Data, http://www.euclid-project.eu/ Lee Feigenbaum, Sparql by example, http://www.cambridgesemantics.com/semantic-university/sparql-byexample Bong [Motore di ricerca per LD] http://toolserver.org/~magnus/bong.php Precision search and find [motore di ricerca per LD], http://dbpedia.org/fct/
C. Bianchini - Dai metadati ai LD
27/05/2014
231
116