27/05/2014

Dai metadati bibliografici ai linked data: un’introduzione di Carlo Bianchini Corso di aggiornamento professionale CEDOC – Centro di Documentazione Modena, 26 maggio 2014

Prefazione

C. Bianchini - Dai metadati ai LD

27/05/2014

2

1

27/05/2014

Le biblioteche in crisi • La diffusione del web e l’enorme disponibilità di contenuti in rete sembra rendere marginale e forse obsoleto il ruolo delle biblioteche • Le nuove abitudini degli utenti hanno creato distanza tra i desideri percepiti e i servizi offerti, tra i modelli di ricerca di informazioni seguiti dai lettori e gli strumenti messi a disposizione dal servizio bibliotecario • Si è creato squilibrio tra raccolte, strumenti di mediazione e utenti C. Bianchini - Dai metadati ai LD

27/05/2014

3

I dati delle biblioteche • Milioni di dati bibliografici conservati negli opac delle biblioteche di tutto il mondo non sono raggiungibili dai motori di ricerca; • I dati delle biblioteche rimangono invisibili alla maggior parte degli utenti (84%) che cercano informazioni sulla rete a partire dai motori di ricerca

C. Bianchini - Dai metadati ai LD

27/05/2014

4

2

27/05/2014

I dati delle biblioteche Se oggi cerchiamo un’opera tramite un motore otteniamo risposte dai cataloghi di vendita di libri in commercio e di antiquariato. I cataloghi delle biblioteche, invece, la cui redazione ha richiesto l’elaborazione di normative, competenze professionali e consistenti finanziamenti pubblici, non forniscono risposte ai motori di ricerca.

C. Bianchini - Dai metadati ai LD

27/05/2014

5

I dati della PA • Lo sviluppo del web non ha lasciato indietro solo il mondo delle biblioteche • Moltissimi dati delle istituzioni che hanno sviluppato banche dati con formati specifici (archivi anagrafici, geografici, statistici, giuridici ecc.) sono invisibili dai motori e dalla rete • Ciò accade perché gli archivi sono prodotti con modelli e formati di dati specifici (silos) e non secondo standard interoperabili con il web.

C. Bianchini - Dai metadati ai LD

27/05/2014

6

3

27/05/2014

I dati delle biblioteche 3 Ci sono eccezioni, anche italiane, come il catalogo delle Biblioteche Civiche Torinesi

C. Bianchini - Dai metadati ai LD

27/05/2014

7

C. Bianchini - Dai metadati ai LD

27/05/2014

8

4

27/05/2014

Il mercato di Google Secondo il sito Searchenginewatch.com i primi tre siti elencati nelle risposte di una ricerca su Google ricevono una media del 58,4% delle visite (clickthrough rate – CRT) da parte di chi ha fatto la ricerca: o 36,4% primo classificato o 12,5% visite al secondo classificato o 9,5% visite al terzo classificato C. Bianchini - Dai metadati ai LD

27/05/2014

9

I dati delle biblioteche 3 Ci sono eccezioni, anche italiane, come il catalogo delle Biblioteche Civiche Torinesi. Queste eccezioni si basano su applicazioni specifiche costruite su misura per alcuni silos ma si può (e si deve) fare MOLTO di più

C. Bianchini - Dai metadati ai LD

27/05/2014

10

5

27/05/2014

Interoperabilità • È necessario rendere i dati interoperabili, non solo tra istituzioni culturali (MAB), ma tra i silos culturali e qualsiasi altro produttore di dati esterno – pubblico e privato – attraverso il web aperto. • Per riuscirci, è necessario registrare e pubblicare i dati (bibliografici e non) con modalità che consentano agli elaboratori o di individuarli, o di comprendere che tra di essi esistono relazioni e o di stabilire che tipo di relazioni sono C. Bianchini - Dai metadati ai LD

27/05/2014

11

Descrivere le risorse • Malgrado molti detrattori, il catalogo – inteso come complesso di dati per l’accesso e la gestione delle risorse – rimane il core business delle biblioteche • Senza i dati non funzionano la ricerca, la consultazione, la circolazione, il reference, le acquisizioni, la conservazione, l’aggiornamento … • Ma soprattutto: i lettori, non trovando i nostri dati con i motori di ricerca, ignorano semplicemente le biblioteche e tutti i loro servizi.

C. Bianchini - Dai metadati ai LD

27/05/2014

12

6

27/05/2014

Come superare la crisi? Le biblioteche non sono rimaste immobili nel corso del tempo. Hanno cercato di adeguare il proprio servizio seguendo (almeno) due percorsi: 1. Rinnovamento di principi, modelli, standard e regole di descrizione e accesso 2. Rinnovamento degli strumenti di ricerca e navigazione bibliografica

Le nuove regole e i nuovi strumenti di ricerca si sono rivelati efficienti ed efficaci? Esistono altri percorsi? Se si, come si conciliano con quanto è stato realizzato finora? C. Bianchini - Dai metadati ai LD

27/05/2014

13

Indice generale 1. Breve storia dei metadati 2. Rinnovamento di principi, modelli, standard e codici di catalogazione 3. Evoluzione degli opac 4. Linked data. Definizione e principi 5. Pubblicare i dati C. Bianchini - Dai metadati ai LD

27/05/2014

14

7

27/05/2014

Parte 1 Storia (breve) dei metadati

C. Bianchini - Dai metadati ai LD

27/05/2014

15

I metadati • La comune definizione di metadati è «dati sui dati», cioè dati che servono a fornire il contesto o ulteriori informazioni su altri dati

C. Bianchini - Dai metadati ai LD

27/05/2014

16

8

27/05/2014

Metadati. Definizione Karen Coyle offre una definizione di metadati più chiara e più utile nel nostro contesto: “Dati costruiti per risolvere un problema o per svolgere una funzione.” (Coyle 2010)

C. Bianchini - Dai metadati ai LD

27/05/2014

17

Dati e tecnologia • Le trasformazioni tecnologiche del catalogo sono state determinate dalla necessità di svolgere nuove funzioni. • Nel tempo, per realizzare nuove funzioni si è progressivamente modificata la struttura del catalogo e, di conseguenza, è stato necessario rendere sempre più espliciti i metadati.

C. Bianchini - Dai metadati ai LD

27/05/2014

18

9

27/05/2014

‘Nascita’ dei metadati • L’espressione metadati nasce e diventa di uso comune in biblioteca quando si passa dal loro uso implicito alla loro formalizzazione logica, per disporre di un modello concettuale necessario alla realizzazione di programmi di gestione dei dati bibliografici.

C. Bianchini - Dai metadati ai LD

27/05/2014

19

Catalogo a libro • Nel catalogo a libro i metadati erano di norma impliciti: in quel contesto tecnologico semplice, i dati svolgono una funzione di base, ovvero rappresentare, surrogare, i documenti. • Nel catalogo manoscritto e nel catalogo a stampa, non c’è alcun bisogno di rendere espliciti i metadati.

C. Bianchini - Dai metadati ai LD

27/05/2014

20

10

27/05/2014

Catalogo a libro In questi due esempi

MILL, JOHN S.. On liberty; 3rd Ed. Boston; 1864, 16mo.

la tecnologia utilizzata per esplicitare il tipo e la funzione dei dati consiste nella sequenza ordinata e nella presentazione tipografico utilizzate. I metadati sono nel contesto (e nel lettore). C. Bianchini - Dai metadati ai LD

27/05/2014

21

Seconda funzione. Interpolazione dei dati • I metadati cambiano quando alla funzione originaria (la rappresentazione dei documenti) si aggiunge una seconda funzione: l’interpolazione e lo scambio dei dati bibliografici. • L’unità di descrizione della raccolta, rappresentata fino a quel momento dal catalogo nel suo complesso (catalogo a libro), deve essere spezzata in sottounità (schede), che possono essere scambiate, riordinate, sostituite, interpolate. C. Bianchini - Dai metadati ai LD

27/05/2014

22

11

27/05/2014

Seconda funzione. Interpolazione dei dati 2 • Nel passaggio dal catalogo a libro al catalogo a schede, p. es., il trattino lungo che indicava la medesima intestazione è sostituito dal dato esplicito dell’intestazione della scheda. • Infatti il contesto non è più sufficientemente chiaro per usare il trattino lungo

C. Bianchini - Dai metadati ai LD

27/05/2014

23

Catalogo a schede MILL, JOHN S.. Utilitarianism. London; 1863, 8vo. MILL, JOHN S.. On liberty; 3d Ed. Boston; 1864, 16mo. Utilitarismo MILL, JOHN S.. Utilitarianism. London; 1863, 8vo.

C. Bianchini - Dai metadati ai LD

27/05/2014

24

12

27/05/2014

Granularità • La maggiore articolazione dei dati (registrati su schede) richiede una maggiore esplicitazione dei metadati, cioè una maggiore granularità. • Il termine granularità indica il livello di dettaglio logico e tecnico con il quale si registrano i dati all’interno del sistema.

C. Bianchini - Dai metadati ai LD

27/05/2014

25

Granularità 2 • È possibile formulare un principio che governa la granularità dei dati del catalogo? Ipotesi

Ogni unità informativa deve essere completa e autoesplicativa

C. Bianchini - Dai metadati ai LD

27/05/2014

26

13

27/05/2014

Terza funzione. Normalizzazione dei dati • Nel passaggio al catalogo elettronico si aggiunge la funzione di normalizzazione dei dati: • Riduzione della ridondanza dei dati • Authority control • Scambio internazionale dei dati

C. Bianchini - Dai metadati ai LD

27/05/2014

27

Terza funzione. Normalizzazione dei dati • Si creano archivi separati per o le descrizioni bibliografiche o le registrazioni di autorità e o i dati gestionali (di copia)

• Si crea una sintassi che sostituisce il contesto del catalogo cartaceo per i dati oggetto di scambio (ISBD) Utilitarianism / by John Stuart Mill. – London : Parker, son, and Bourn, 1863. – 95 p. ; 22 cm

C. Bianchini - Dai metadati ai LD

27/05/2014

28

14

27/05/2014

Terza funzione. Normalizzazione dei dati • In questo passaggio, aumenta la granularità dei cataloghi, cioè il dettaglio logico e tecnico di registrazione dei dati (in archivi separati) • Di conseguenza aumenta la necessità di esplicitare i metadati, per consentire allo strumento tecnologico in uso (software) di riconoscere i dati e ricostruire correttamente l’unità di ciascuna descrizione bibliografica. • Si conferma il principio: ogni unità deve essere completa e autoesplicativa C. Bianchini - Dai metadati ai LD

27/05/2014

29

Terza funzione. Struttura delle relazioni • In questa fase, devono essere rese esplicite anche le relazioni tra i dati che fanno parte di un’unica descrizione e sono registrati in archivi diversi • La sintassi del linguaggio documentario, utile per la comprensione da parte del lettore, non è più sufficiente perché tali relazioni siano gestite anche dalle macchine • Anche per le relazioni sono necessari i metadati

C. Bianchini - Dai metadati ai LD

27/05/2014

30

15

27/05/2014

Terza funzione. Struttura delle relazioni • È questo il livello logico dei DB relazionali oggi esistenti e in uso, a partire da SBN.

C. Bianchini - Dai metadati ai LD

27/05/2014

31

Attuali cataloghi (dal ’70 a oggi) Intestazione/i uniforme/i Persona/Ente

Intestazione/i uniforme/i Persona/Ente

Intestazione/i uniforme/i Soggetto/Classe

Descrizione bibliografica: (Pubblicazioni e documenti d’altro genere)

Registr. copia/localizzaz. C. Bianchini - Dai metadati ai LD

Registr. copia/localizzaz. 27/05/2014

32

16

27/05/2014

Terza funzione. Struttura delle relazioni • È questo il livello logico dei DB relazionali oggi esistenti e in uso, a partire da SBN • Ciascuna registrazione richiede l’esplicitazione e l’uso di metadati appropriati • È valido il principio che ogni unità deve essere completa e autoesplicativa

C. Bianchini - Dai metadati ai LD

27/05/2014

33

Crisi dei cataloghi attuali La struttura dei cataloghi attuali non è soddisfacente: • dal punto di vista dell’efficienza, perché i costi di produzione dei cataloghi sono troppo alti (FRBR e modelli derivati) • dal punto di vista dei lettori, perché non garantisce in modo adeguato la funzione di navigazione (Svenonius, 2000)

C. Bianchini - Dai metadati ai LD

27/05/2014

34

17

27/05/2014

Parte 2 Rinnovamento di principi, modelli, standard e codici

C. Bianchini - Dai metadati ai LD

27/05/2014

35

ICP dell’IFLA I Principi internazionali di Catalogazione dell’IFLA • Pubblicati da Saur nel 2009 • Traduzione italiana a cura dell’ICCU e di un gruppo di esperti • Disponibili in linea e a stampa

C. Bianchini - Dai metadati ai LD

27/05/2014

36

18

27/05/2014

Principi internazionali di catalogazione

http://www.ifla.org/files/assets/cata loguing/icp/icp_2009-it.pdf

C. Bianchini - Dai metadati ai LD

27/05/2014

37

Elementi di novità • ICP recepisce il modello FRBR e adatta i principi al nuovo contesto: p. es. un paragrafo (§ 3) è dedicato a Entità, Attributi e Relazioni • Introduce la funzione di navigare, nuova anche rispetto a FRBR • ICP si concentra sui dati piuttosto che sulle registrazioni bibliografiche, che sono considerate un insieme di dati. • Anche le “intestazioni” diventano dati che assumono un ruolo particolare (fungono da punti di accesso) C. Bianchini - Dai metadati ai LD

27/05/2014

38

19

27/05/2014

Elementi di novità ICP contiene importanti novità terminologiche, che hanno rilevanza concettuale: o Unità bibliografica  Manifestazione o Intestazione  Punto di accesso autorizzato/controllato o Rinvio  Forma variante del nome o Titolo uniforme  Punto di accesso autorizzato, Forma autorizzata del nome, Nome

C. Bianchini - Dai metadati ai LD

27/05/2014

39

Elementi di novità ICP contiene importanti novità terminologiche, che hanno rilevanza concettuale: o Unità bibliografica  Manifestazione (istanza) o Intestazione  Punto di accesso autorizzato/controllato o Rinvio  Forma variante del nome o Titolo uniforme  Punto di accesso autorizzato, Forma autorizzata del nome, Nome

Il focus si sposta dalla tecnologia alla funzione C. Bianchini - Dai metadati ai LD

27/05/2014

40

20

27/05/2014

VIAF • Il Virtual International Authority File costituisce una soluzione pratica a un problema teorico irrisolto: l’uniformità degli accessi a livello internazionale (Principi di Parigi, 1961) • Nel VIAF non esiste una forma unica del nome di un’entità, ma molte forme equivalenti • Nel VIAF esistono intestazioni “a grappolo”: un insieme di punti di accesso, privo di una forma principale Esempio • http://viaf.org/viaf/32197206/ C. Bianchini - Dai metadati ai LD

27/05/2014

41

FRBR e modelli derivati

C. Bianchini - Dai metadati ai LD

27/05/2014

42

21

27/05/2014

Evoluzione concettuale • IFLA Study Group on the Functional Requirements for Bibliographic Records. 1998. Functional Requirements for Bibliographic Records : Final Report. München: K.G. Saur • IFLA Working Group on Functional Requirements and Numbering of Authority Records (FRANAR). 2009. Functional Requirements for Authority Data : a Conceptual Model : Final Report, December 2008. München: K. G. Saur • Zeng, ML, M Žumer, and A Salaba. 2011. Functional Requirements for Subject Authority Data (FRSAD): A Conceptual Model. Berlin: De Gruiter Saur C. Bianchini - Dai metadati ai LD

27/05/2014

43

Evoluzione concettuale • IFLA Study Group on the Functional Requirements for Bibliographic Records. 1998. Functional Requirements for Bibliographic Records : Final Report. München: K.G. Saur • IFLA Working Group on Functional Requirements and Numbering of Authority Records (FRANAR). 2009. Functional Requirements for Authority Data : a Conceptual Model : Final Report, December 2008. München: K. G. Saur • Zeng, ML, M Žumer, and A Salaba. 2011. Functional Requirements for Subject Authority Data (FRSAD): A Conceptual Model. Berlin: De Gruiter Saur C. Bianchini - Dai metadati ai LD

27/05/2014

44

22

27/05/2014

REICAT e RDA • FRBR ha ispirato la redazione di nuove regole di catalogazione: REICAT e RDA. • I due codici riflettono la necessità – espressa da FRBR – di rappresentare un maggior numero di entità e di relazioni

C. Bianchini - Dai metadati ai LD

27/05/2014

45

RDA • Nell’ottobre 2006, Tom Delsey preparò per il JSC (Joint Steering Committee for Development of RDA, già Joint Steering Committee for Revision of Anglo-American Cataloguing Rules), un documento che descriveva tre possibili scenari (tre contesti) di implementazione per il nuovo codice (Delsey 2007) • Gli scenari descritti da Delsey rappresentano modelli esemplificativi di funzionamento dei database bibliografici e si differenziano per il loro grado di granularità C. Bianchini - Dai metadati ai LD

27/05/2014

46

23

27/05/2014

Scenari RDA • Ogni scenario delineato ospita la stessa quantità e tipologia di dati bibliografici, ma si distingue per o il livello di dettaglio nella distinzione tra i dati, o le strutture previste per l’immagazzinamento degli attributi e delle relazioni tra entità, o il reperimento e la visualizzazione dei dati

• Queste differenze tecnologiche hanno una forte ricaduta sull’efficienza del sistema, sui costi di creazione e di mantenimento dei dati e sulle possibilità di riutilizzo dei dati bibliografici nel loro complesso C. Bianchini - Dai metadati ai LD

27/05/2014

47

Scenari • Barbara B. Tillett, 2012. Looking to the future with RDA, dia 19-24 (basate su Gordon Dunsire)

C. Bianchini - Dai metadati ai LD

27/05/2014

48

24

27/05/2014

Scenario REICAT REGISTRAZIONE BIBLIOGRAFICA Intestazione/i uniforme/i Persona/Ente Tit. uniforme/i (Opera)

Intestazione/i uniforme/i Persona/Ente Tit. uniforme con aggiunte (Espressione)

Descrizione bibliografica: (Pubblicazioni e doc. d’altro genere) Registr. copia/localizzaz. C. Bianchini - Dai metadati ai LD

Registr. copia/localizzaz. 27/05/2014

49

Qual è lo scenario di RDA?

C. Bianchini - Dai metadati ai LD

27/05/2014

50

25

27/05/2014

Flessibilità di RDA • Tra i principi alla base di RDA, è inserita la flessibilità delle regole • Flessibilità significa che i dati dovrebbero funzionare indipendentemente dal formato, dal medium e dal sistema usato per immagazzinare o comunicare i dati • I dati dovrebbero essere adatti all’utilizzo in qualsiasi ambiente (o scenario) Perciò RDA è uno “standard di contenuto”

C. Bianchini - Dai metadati ai LD

27/05/2014

51

Standard di contenuto • Come standard di contenuto, RDA risponde esclusivamente alla domanda «Quali dati devo registrare?» • Con RDA si producono dati che possono essere registrati utilizzando schemi di codifica diversi (per es. MARC 21, MODS, Dublin Core …) • I dati RDA possono essere visualizzati utilizzando convenzioni di visualizzazione diverse (per es. ISBD, formato a bandiera …) • I dati RDA possono essere registrati negli attuali database o in strutture di database di nuova generazione C. Bianchini - Dai metadati ai LD

27/05/2014

52

26

27/05/2014

Granularità in RDA RDA ha un modello di dati (data model) con una maggiore granularità rispetto ai precedenti codici; Ciò significa che RDA prevede: • un element set più esteso, cioè un insieme maggiore di elementi di dati da riconoscere e da registrare • un maggiore dettaglio e precisione nella rappresentazione delle relazioni, che assumono valori prestabiliti registrati nei Vocabularies

C. Bianchini - Dai metadati ai LD

27/05/2014

53

Element sets e Vocabularies • È opportuno chiarire la distinzione tra Element sets e Vocabularies • Esempio (a)Opera – CreataDa – Persona (b) Manifestazione – RegistrataSu – Tipo di supporto

C. Bianchini - Dai metadati ai LD

27/05/2014

54

27

27/05/2014

Element set Nella relazione (tripla) (a) Opera – CreataDa – Persona gli elementi Opera e Persona possono assumere qualsiasi valore per i rispettivi attributi «Titolo» e «Nome» Il valore assunto dagli elementi quindi è aperto

C. Bianchini - Dai metadati ai LD

27/05/2014

55

Vocabularies Nella relazione (tripla) (b) Manifestazione – RegistrataSu – Tipo di Supporto i valori dell’elemento Tipo di supporto (Carrier type) possono variare, ma solo all’interno di un elenco chiuso ed esaustivo, che fornisce tutti e soltanto i tipi di supporto esplicitamente previsti.

C. Bianchini - Dai metadati ai LD

27/05/2014

56

28

27/05/2014

C. Bianchini - Dai metadati ai LD

27/05/2014

57

Element

Vocabulary

C. Bianchini - Dai metadati ai LD

27/05/2014

58

29

27/05/2014

Element sets e vocabularies • La distinzione è utile perché i vocabolari consentono di mantenere un maggiore controllo sulla coerenza e sulla affidabilità dei dati • I vocabolari hanno lo svantaggio di richiedere un aggiornamento costante. • Per esempio l’Appendice D – Designazioni specifiche del materiale delle REICAT non prevede come supporto le chiavette USB o le MicroSD C. Bianchini - Dai metadati ai LD

27/05/2014

59

Entità di RDA • In tutti gli scenari che abbiamo visto, il tipo e gli attributi delle entità e che si possono/devono descrivere sono stabilite dalle regole che si applicano. • L’insieme degli elementi previsti da RDA è definito in appositi registri chiamati RDA element sets. Per esempio: • FRBR entities for RDA (14 entità) • RDA Group 1: 469 elementi • RDA Group 2: 62 elementi • RDA Group 3: 19 elementi C. Bianchini - Dai metadati ai LD

27/05/2014

60

30

27/05/2014

Relazioni di RDA • Anche il valore delle relazioni deve essere definito in modo esplicito. • RDA ha inserito in un apposito registro RDA 508 elementi, cioè possibili valori delle RDA Relationships for Works, Expressions, Manifestations, Items. Per esempio sono state previste le relazioni: • «basato su» (Opera-Opera) • «adattamento di» (Opera-Opera) • «adattamento radiofonico di» (Opera-Opera) • «commento di» (Opera-Opera)

C. Bianchini - Dai metadati ai LD

27/05/2014

61

RDA: dal record ai dati • Due parti principali organizzate in 10 sezioni • • • • • • • • • •

Sezione 1. Registrare gli attributi delle manifestazioni e degli item Sezione 2. Registrare gli attributi delle opere e delle espressioni Sezione 3. Registrare gli attributi di persone, famiglie ed enti Sezione 4. Registrare gli attributi di concetto, oggetto, evento e luogo Sezione 5. Registrare le relazioni primarie tra opera, espressione, manifestazione e item Sezione 6. Registrare le relazioni con persone, famiglie ed enti Sezione 7. Registrare le relazioni con concetti, oggetti, eventi e luoghi Sezione 8. Registrare le relazioni tra opere, espressioni, manifestazioni e item Sezione 9. Registrare le relazioni tra persone, famiglie ed enti Sezione 10. Registrare le relazioni tra concetti, oggetti, eventi e luoghi

C. Bianchini - Dai metadati ai LD

27/05/2014

62

31

27/05/2014

RDA: dal record ai dati • Due parti principali organizzate in 10 sezioni • • • • • • • • • •

Sezione 1. Registrare gli attributi delle manifestazioni e degli item Sezione 2. Registrare gli attributi delle opere e delle espressioni Sezione 3. Registrare gli attributi di persone, famiglie ed enti Sezione 4. Registrare gli attributi di concetto, oggetto, evento e luogo Sezione 5. Registrare le relazioni primarie tra opera, espressione, manifestazione e item Sezione 6. Registrare le relazioni con persone, famiglie ed enti Sezione 7. Registrare le relazioni con concetti, oggetti, eventi e luoghi Sezione 8. Registrare le relazioni tra opere, espressioni, manifestazioni e item Sezione 9. Registrare le relazioni tra persone, famiglie ed enti Sezione 10. Registrare le relazioni tra concetti, oggetti, eventi e luoghi

C. Bianchini - Dai metadati ai LD

27/05/2014

63

RDA: dal record ai dati • Due parti principali organizzate in 10 sezioni • • • • • • • • • •

Sezione 1. Registrare gli attributi delle manifestazioni e degli item Sezione 2. Registrare gli attributi delle opere e delle espressioni Sezione 3. Registrare gli attributi di persone, famiglie ed enti Sezione 4. Registrare gli attributi di concetto, oggetto, evento e luogo Sezione 5. Registrare le relazioni primarie tra opera, espressione, manifestazione e item Sezione 6. Registrare le relazioni con persone, famiglie ed enti Sezione 7. Registrare le relazioni con concetti, oggetti, eventi e luoghi Sezione 8. Registrare le relazioni tra opere, espressioni, manifestazioni e item Sezione 9. Registrare le relazioni tra persone, famiglie ed enti Sezione 10. Registrare le relazioni tra concetti, oggetti, eventi e luoghi

C. Bianchini - Dai metadati ai LD

27/05/2014

64

32

27/05/2014

Parte 3 Evoluzione degli opac

C. Bianchini - Dai metadati ai LD

27/05/2014

65

Tipi di ricerche di informazioni • Ricerca esplorativa (Exploratory Search) o o o o

Ha per scopo ottenere informazioni generali Non si hanno preferenze relative ad aspetti del tema Non si ha familiarità con le parole chiave In genere il lettore ha bisogno di aiuto

• Ricerca consapevole (Known Item research) o Si ha familiarità con parole chiave o termini della ricerca o Si ha una specifica risorsa in mente (rivista, libro ecc.) o Si sa da dove partire (sito web, database ecc.)

(Sweet, 2012) C. Bianchini - Dai metadati ai LD

27/05/2014

66

33

27/05/2014

Comportamento degli utenti OCLC 2008, 2005  L’84% degli utenti non sa da dove iniziare la ricerca  L’84% degli utenti inizia la propria ricerca da un motore di ricerca  [Quale risposta forniscono i motori di ricerca?]  Quale risposta forniscono le biblioteche?

C. Bianchini - Dai metadati ai LD

27/05/2014

67

Esempio 1: Known item search

C. Bianchini - Dai metadati ai LD

27/05/2014

68

34

27/05/2014

Esempio 2: Ricerca esplorativa

? C. Bianchini - Dai metadati ai LD

27/05/2014

69

Le ricerche con i motori • I motori di ricerca: • Sono più efficaci nella ricerca consapevole (known item search) • Forniscono risposte non personalizzate (ma esistono i profiles); • Manipolano (e lasciano manipolare) l’ordinamento delle risposte • Indicizzano una piccolissima porzione di internet (copertura di Google = 0,004%) • Non ‘vedono’ i dati dei nostri opac

C. Bianchini - Dai metadati ai LD

27/05/2014

70

35

27/05/2014

Le ricerche in biblioteca ieri • Il catalogo (soprattutto in passato) risponde bene a ricerche di oggetti conosciuti • Il catalogo in passato era sempre utilizzato nel contesto della biblioteca, nella quale il bibliotecario soddisfaceva direttamente le esigenze delle ricerche esplorative (con gli strumenti di reference o con il servizio di reference) e aiutava a superare il momento critico iniziale della ricerca

C. Bianchini - Dai metadati ai LD

27/05/2014

71

27/05/2014

72

Opac tradizionale

C. Bianchini - Dai metadati ai LD

36

27/05/2014

Evoluzione dell’opac  La complessità d’uso dell’interfacce semplici e avanzate degli opac tradizionali ha spinto a sviluppare interfacce più amichevoli  Negli opac ‘arricchiti’, il software si è ‘arricchito’, con nuove funzioni orientate a rendere più semplici ed efficaci: 1. l’interazione dell’utente con il catalogo; e 2. l’interazione degli utenti tra loro

C. Bianchini - Dai metadati ai LD

27/05/2014

73

27/05/2014

74

Opac arricchiti

C. Bianchini - Dai metadati ai LD

37

27/05/2014

C. Bianchini - Dai metadati ai LD

27/05/2014

75

Problemi aperti Opac tradizionali e opac arricchiti presentano tre importanti problemi dal punto di vista dell’utente: 1. La necessità di ripetere l’interrogazione tante volte quante sono le banche dati (silos) di interesse per la ricerca 2. La scarsa navigabilità dei dati bibliografici 3. La separazione dei dati dell’universo bibliografico (MARC) dai dati del web

C. Bianchini - Dai metadati ai LD

27/05/2014

76

38

27/05/2014

Problema 1 Ricerche separate per silos LIBRI

PERIODICI

CONTENUTI LOCALI

Catalogo

Indici e Abstract

OAI Harverster

Ebooks

Full Text

Sito/Deposito Istituzionale

C. Bianchini - Dai metadati ai LD

27/05/2014

77

Ricerche uniche ‘federate’ LIBRI

PERIODICI

CONTENUTI LOCALI

Catalogo

Indici e Abstract

OAI Harverster

Ebooks

Full Text

Deposito Istituzionale

NEXT GENERATION CATALOGUES

C. Bianchini - Dai metadati ai LD

27/05/2014

78

39

27/05/2014

C. Bianchini - Dai metadati ai LD

27/05/2014

79

Ricerche uniche indicizzate LIBRI

PERIODICI

CONTENUTI LOCALI

Catalogo

Indici e Abstract

OAI Harverster

Ebooks

Full Text

Deposito Istituzionale

INDICE

C. Bianchini - Dai metadati ai LD

DISCOVERY TOOLS

27/05/2014

80

40

27/05/2014

Problema 2 Cataloghi FRBR-izzati

C. Bianchini - Dai metadati ai LD

27/05/2014

81

27/05/2014

82

Problema 2 Cataloghi FRBR-izzati

C. Bianchini - Dai metadati ai LD

41

27/05/2014

Cataloghi FRBR-izzati

C. Bianchini - Dai metadati ai LD

(link)

27/05/2014

83

La struttura degli opac NGC E DISCOVERY TOOLS Indici e Abstract OPAC ARRICCHITI Full Text OPAC TRADIZIONALE

BANCA DATI BIBLIOGRAFICA (MARC) C. Bianchini - Dai metadati ai LD

27/05/2014

84

42

27/05/2014

Problema 3 Separazione biblioteche vs web SITI WEB

LIBRI

BLOGOSFERA PERIODICI E-COMMERCE CONTENUTI LOCALI

C. Bianchini - Dai metadati ai LD

OPEN ACCESS

27/05/2014

85

27/05/2014

86

Soluzioni?

C. Bianchini - Dai metadati ai LD

43

27/05/2014

Parte 4 Linked data

C. Bianchini - Dai metadati ai LD

27/05/2014

87

Il web dei documenti Non solo i dati di MAB hanno problemi di visibilità sul web. Anche i siti web hanno bisogno di un modello diverso da quello attuale per almeno due esigenze: 1. Collegare le informazioni del web in modo più stretto 2. Creare servizi di informazione che si aggiornino in modo automatico

C. Bianchini - Dai metadati ai LD

27/05/2014

88

44

27/05/2014

Creare servizi d’informazione aggiornati

C. Bianchini - Dai metadati ai LD

27/05/2014

89

Aggiornamento del sito Esistono tre possibili modelli di aggiornamento del sito di esempio; i curatori: A. cercano le notizie sul web e aggiornano il proprio sito manualmente; B. cercano le notizie sul web, scrivono un programma per estrarre i dati e poi li inseriscono nel proprio sito; C. tramite apposite API (Application Program Interface), cercano sul web, interpretano e raccolgono i dati rilevanti e inseriscono i dati ottenuti in modo automatico nel proprio sito Tutti questi sistemi richiedono comunque un intervento umano. C. Bianchini - Dai metadati ai LD

27/05/2014

90

45

27/05/2014

Il modello BBC • Utilizza insiemi di dati esterni e pubblici • Per esempio Wikipedia, MusicBrainz …

• Questi siti rendono le proprie informazioni accessibili direttamente in forma di dati o Sui siti non ci sono API per l’estrazione dei dati o I dati possono essere estratti utilizzando richieste con standard o tramite il protocollo HTTP

C. Bianchini - Dai metadati ai LD

27/05/2014

91

Il modello BBC In pratica, la BBC ha scelto di 1. utilizzare i dati distribuiti sul web come un sistema di gestione dei contenuti (Content Management System) 2. avvalersi della comunità della rete, nel suo insieme, come curatrice dei contenuti

C. Bianchini - Dai metadati ai LD

27/05/2014

92

46

27/05/2014

Il modello BBC

C. Bianchini - Dai metadati ai LD

27/05/2014

93

Creare il web dei dati In conclusione, il sito della BBC è un esempio del passaggio dal web dei documenti al web semantico. Affinché ciò avvenga, è necessaria una infrastruttura adatta a costruire una rete di dati (anziché di documenti), nella quale o I dati siano accessibili sul web, tramite tecnologie web standard o I dati siano interconnessi sul web, ovvero possano essere completamente integrati nel web.

Qui entrano in gioco i linked data C. Bianchini - Dai metadati ai LD

27/05/2014

94

47

27/05/2014

4.1 Definizione di linked data

C. Bianchini - Dai metadati ai LD

27/05/2014

95

I linked data • I linked data sono un insieme di principi e di tecnologie per consentire la pubblicazione di dati modulari, condivisibili e riutilizzabili (nel web) • L’espressione linked data si riferisce a dati pubblicati sul web in una modalità leggibile, interpretabile e, soprattutto, utilizzabile (anche) da un elaboratore • Nel web semantico i data pubblicati devono avere un significato esplicito e devono essere collegati ad altri insiemi di dati esterni. • Ogni dato deve essere completo e autoesplicativo C. Bianchini - Dai metadati ai LD

27/05/2014

96

48

27/05/2014

Dai documenti ai dati • Tim Berners Lee ha pensato che si potesse applicare ai linked data la medesima struttura con cui è stato creato il World Wide Web, allo scopo di condividere i dati su scala globale (es. BBC) • Il World Wide Web oggi disponibile, inteso come spazio unico di pubblicazione di documenti, è cresciuto e si è sviluppato grazie a tre strumenti fondamentali

C. Bianchini - Dai metadati ai LD

27/05/2014

97

Dai documenti ai dati Uno strumento di identificazione globale URI – Uniform Resource Identificator Uno strumento di accesso globale HTTP – HyperText Transfer Protocol Uno strumento di formattazione dei contenuti HTML – HyperText Markup Language

C. Bianchini - Dai metadati ai LD

27/05/2014

98

49

27/05/2014

• URI http://www.anaiveneto.org

C. Bianchini - Dai metadati ai LD

27/05/2014

99

Dai documenti ai dati Lo sviluppo e l’uso di standard (HTTP e HTML) consente di superare le differenze tra le architetture tecnologiche con le quali vengono prodotti i documenti I link (HyperLink) che si intrecciano tra i diversi documenti consentono agli utenti di navigare nella rete. I link sono determinanti per la creazione e il mantenimento di un unico spazio di informazioni globale (il docuverso) C. Bianchini - Dai metadati ai LD

27/05/2014

100

50

27/05/2014

4.2 I principi dei linked data

C. Bianchini - Dai metadati ai LD

27/05/2014

101

Principi per i linked data Tim Berners-Lee (2006) ha definito quali devono essere i requisiti dei linked data; questi sono noti come Principi dei linked data 1. Usare gli URI come nome per le cose 2. Usare degli URI HTTP, in modo che i nomi delle cose si possano cercare 3. Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP 4. Inserire collegamenti ad altri URI, in modo che si possano scoprire cose collegate tra loro

C. Bianchini - Dai metadati ai LD

27/05/2014

102

51

27/05/2014

Definizione di URI • URI sta per Uniform Resource Identifier e indica una sequenza sintetica di caratteri che identifica una risorsa fisica o astratta. Esempi • • • •

mailto:[email protected] news:comp.infosystems.www.servers.unix tel:+1-816-5551212 http://dbpedia.org/resource/Karlsruhe C. Bianchini - Dai metadati ai LD

27/05/2014

103

Principi dei linked data 1. Usare gli URI come nome per le cose 2. Usare URI HTTP, in modo che quei nomi si possano cercare 3. Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP 4. Inserire collegamenti ad altri URI, in modo che si possano scoprire altre cose collegate

C. Bianchini - Dai metadati ai LD

27/05/2014

104

52

27/05/2014

URI per l’identificazione • Nel primo principio, l’accento è posto sul termine «cose», per indicare che è necessario identificare non solo documenti o contenuti digitali, ma anche oggetti del mondo reale e concetti astratti o o o o

Persone (es. Leonardo da Vinci, Virgilio) Luoghi (es. Venezia, Genova, Monte Bianco) Oggetti (es. il film Casablanca, una Ditta) Relazioni (es. èRegistaDi, RisiedeA, èAmicoDi)

• L’ambito del web si allarga per includere anche oggetti o concetti, non solo documenti • Il termine utilizzato nell’architettura del web per indicare questi oggetti di interesse è risorse. C. Bianchini - Dai metadati ai LD

27/05/2014

105

Gli URI: un nome Esempi Daniel Defoe

http://dbpedia.org/page/Daniel_Defoe

Berlino

http://it.dbpedia.org/resource/Berlino

Los Angeles Lakers

http://dbpedia.org/resource/Los_Angeles _Lakers

C. Bianchini - Dai metadati ai LD

27/05/2014

106

53

27/05/2014

Principi dei linked data 1. Usare gli URI come nome per le cose 2. Usare URI HTTP, in modo che quei nomi si possano cercare 3. Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP 4. Inserire collegamenti ad altri URI, in modo che si possano scoprire altre cose collegate

C. Bianchini - Dai metadati ai LD

27/05/2014

107

HTTP per l’accesso • Il protocollo HTTP è il meccanismo di accesso universale del web. Gli URI HTTP garantiscono un meccanismo di recupero semplice, trasparente e universale • Il secondo principio dei LD richiede l’uso di URI HTTP per consentire agli utenti di essere dereferenziati, cioè reindirizzati a una descrizione dell’oggetto o del concetto identificato, attraverso il protocollo HTTP C. Bianchini - Dai metadati ai LD

27/05/2014

108

54

27/05/2014

Dereferenziazione • Tutti gli URI HTTP devono essere dereferenziabili, cioè devono consentire che un client HTTP (p. es. un browser) possa cercare l’URI attraverso il protocollo HTTP e trovare la descrizione della risorsa identificata da quell’URI Esempio • http://dbpedia.org/page/Italo_Svevo

C. Bianchini - Dai metadati ai LD

27/05/2014

109

URI dereferenziabili • Creare nomi attraverso gli URI presenta due vantaggi notevoli: 1) È un modo semplice per creare nomi univoci (su scala globale) in modo decentralizzato, dato che qualsiasi proprietario di un sito web può creare nuovi riferimenti URI. 2) Gli URI non sono solo il nome di un oggetto; se sono di tipo HTTP costituiscono anche un punto di accesso alla risorsa e alle relative informazioni

C. Bianchini - Dai metadati ai LD

27/05/2014

110

55

27/05/2014

URI dereferenziabili 2 • Nella catalogazione classica conosciamo da sempre un dispositivo che costituisce il nome di una risorsa e funge da strumento di accesso alla risorsa stessa:

L’INTESTAZIONE • Un URI HTTP e un’intestazione sono equiparabili dal punto di vista funzionale

C. Bianchini - Dai metadati ai LD

27/05/2014

111

Principi dei linked data 1. Usare gli URI come nome per le cose 2. Usare URI HTTP, in modo che quei nomi si possano cercare 3. Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP 4. Inserire collegamenti ad altri URI, in modo che si possano scoprire altre cose collegate

C. Bianchini - Dai metadati ai LD

27/05/2014

112

56

27/05/2014

Fornire informazioni standard • Per garantire che una vasta gamma di applicazioni (architetture h/w e s/w) sia in grado di utilizzare il contenuto del web, è necessario utilizzare formati di contenuto standard. • Perciò, il terzo principio dei LD richiede l’uso di un unico modello di dati per pubblicare sul web dati strutturati in modo standard

C. Bianchini - Dai metadati ai LD

27/05/2014

113

RDF per il contenuto • Per pubblicare linked data è necessario esprimere i dati secondo il modello Resource Description Framework (RDF) • RDF è un modello di dati estremamente semplice e fortemente orientato al web

C. Bianchini - Dai metadati ai LD

27/05/2014

114

57

27/05/2014

Il modello di dati RDF • L’essenza di RDF è definire relazioni tra gli oggetti sotto forma di triple, cioè affermazioni semplici Esempi Una Persona – LavoraPresso – una Ditta Un Maglione – èDiColore – Rosso

C. Bianchini - Dai metadati ai LD

27/05/2014

115

Il modello di dati RDF 2 • Nei linked data si usa lo stesso modello che è alla base della logica aristotelica • L’interpretazione logica di una tripla RDF consiste nel considerarla una frase del tipo: soggetto – predicato – oggetto I promessi sposi – scrittiDa – Alessandro Manzoni Gioconda – èConservataDa – Museo del Louvre

C. Bianchini - Dai metadati ai LD

27/05/2014

116

58

27/05/2014

Il modello di dati RDF 3 • Il modo più semplice e intuitivo per rappresentare graficamente una tripla è un grafo (orientato) Gioconda – èConservataDa – Museo del Louvre Arco

Nodi èConservataDa

Museo del Louvre

Gioconda

C. Bianchini - Dai metadati ai LD

27/05/2014

117

Le triple • Una tripla è una dichiarazione, nella quale si asserisce che una risorsa (o classe) possiede una certa proprietà • In termini FRBR, equivale a dire che una tripla afferma che un’entità ha un certo attributo o relazione Esempi? Un’Opera – HaPerTitolo – De bello Gallico Un’espressione – HaPerTitolo – La guerra gallica De bello Gallico – HaPerAutore – Caio Giulio Cesare C. Bianchini - Dai metadati ai LD

27/05/2014

118

59

27/05/2014

A che servono le triple? • Mediante una concatenazione di triple è possibile esprimere dati molto complessi, in modo che siano leggibili, modulari e riutilizzabili anche da una macchina. Esempio Robinson Crusoe / Daniel Defoe

C. Bianchini - Dai metadati ai LD

27/05/2014

119

Linked Data Triple

Linguaggio naturale

«Daniel Defoe» «èAutoreDi» «Robinson Crusoe» «Robison Crusoe» «è» «un titolo» «Daniel Defoe» «è» «un nome» «Robinson Crusoe» «è il titolo di» «Un’opera» «Daniel Defoe» «è il nome di» «Una persona» «Un titolo» «è una proprietà di» «un’opera» Robinson Crusoe / Daniel Defoe

«Un nome» «è una proprietà di» «una persona» …. ??

C. Bianchini - Dai metadati ai LD

27/05/2014

120

60

27/05/2014

A che servono le triple? • In base alle triple esistenti, un elaboratore può ‘dedurre’ molti dati. Per esempio, è in grado di inferire nuove triple corrette Esempi: «Alberto» «èFiglioDi» «Andrea» «Agata» «èFigliaDi» «Andrea»  «Alberto» «èFratelloDi» «Agata»

C. Bianchini - Dai metadati ai LD

27/05/2014

121

Composizione delle triple Nelle triple RDF: • Il soggetto della tripla è l’URI che identifica la risorsa; l’URI corrisponde infatti al ‘nome univoco’ della risorsa; • Il predicato, al centro, è l’URI che indica un tipo di relazione o una proprietà del soggetto • L’oggetto è un URI che corrisponde a un’altra risorsa in relazione con il soggetto, oppure è un semplice dato.

C. Bianchini - Dai metadati ai LD

27/05/2014

122

61

27/05/2014

Tipi di triple Per comprendere meglio il modello logico che si ottiene con RDF, è opportuno distinguere diversi tipi di triple in base al loro: a) Soggetto b) Oggetto c) URI

C. Bianchini - Dai metadati ai LD

27/05/2014

123

Triple in base al soggetto La distinzione delle triple in base al soggetto consente di rappresentare un insieme di triple con due grafi (rappresentazioni) diversi. Un insieme di triple che hanno il medesimo soggetto si può rappresentare con un grafo a grappolo (cluster). Un insieme di triple che hanno per soggetto l’oggetto della tripla precedente forma un grafo a catena. C. Bianchini - Dai metadati ai LD

27/05/2014

124

62

27/05/2014

Grappoli di triple • Un grappolo è un insieme di affermazioni sulla stessa risorsa, ovvero nel quale ogni tripla ha per soggetto lo stesso URI 1952

Ugo Foscolo HaPerNome

10.000 volumi

Roma

HaPerData HaPerLuogo

Biblioteca Ecc.

http://www.foscolo.it

Piazza Garibaldi

02 555666777 [email protected]

C. Bianchini - Dai metadati ai LD

27/05/2014

125

Catene di triple • Oltre ai grappoli, un altro modo semplice per collegare le triple tra loro è la catena.

• Una catena di triple si può sviluppare se l’URI oggetto della prima tripla diventa soggetto della seconda tripla

C. Bianchini - Dai metadati ai LD

27/05/2014

126

63

27/05/2014

Catene di triple Robinson Crusoe HaPerAutore

Daniel Defoe ÈNatoA

Londra Ecc.

Gran Bretagna

C. Bianchini - Dai metadati ai LD

ÈCapitaleDi

27/05/2014

127

Triple in base all’oggetto Si possono distinguere le triple anche dal punto di vista dell’oggetto, che può essere costituito da A. Un URI di un’altra risorsa collegata in qualche modo al soggetto; o B. Un valore letterale (una stringa alfanumerica, un numero, o una data)

C. Bianchini - Dai metadati ai LD

27/05/2014

128

64

27/05/2014

A. Tripla Link RDF • Nel primo caso, gli URI del soggetto e dell’oggetto della tripla identificano due risorse che sono in relazione • L’URI in posizione di predicato definisce il tipo di relazione sussiste tra le risorse • Nastassia Kinsky – HaRecitatoIn – Paris, Texas (film) • N.B. Tutti e tre gli elementi sono identificati da un URI univoco; perciò il grafo della tripla diventa: C. Bianchini - Dai metadati ai LD

27/05/2014

129

A. Triple link RDF



C. Bianchini - Dai metadati ai LD



27/05/2014

130

65

27/05/2014

B. Tripla letterale • Le triple letterali sono utilizzate per descrivere le risorse, per esempio per indicare il nome, o la data di nascita di una persona, un numero … • Nastassia Kinsky – haPerNome – «Nastassja» • I primi due elementi della tripla sono identificati da un URI univoco; perciò il grafo della tripla diventa:

C. Bianchini - Dai metadati ai LD

27/05/2014

131

27/05/2014

132

B. Tripla letterale Esempio < http://xmlns.com/foaf/spec/ #term_givenName>



C. Bianchini - Dai metadati ai LD



66

27/05/2014

Domanda • Quando l’oggetto di una tripla è un valore letterale (literal), la tripla farà parte di una catena o di un grappolo? < http://xmlns.com/foaf/spec/ #term_givenName>

C. Bianchini - Dai metadati ai LD



27/05/2014

133

Risposta • Il primo principio dei Linked Data afferma che si deve assegnare un URI a ogni cosa. • I valori letterali non hanno un URI; perciò non rispettano un principio dei LD e non possono essere in posizione di soggetto di una tripla. • Perciò se una tripla contiene un literal (una stringa alfanumerica, un numero o una data), la catena si interrompe e la tripla fa parte di un grappolo • Questa limitazione garantisce la coerenza del web semantico, perché la corrispondenza dei valori letterali può essere ambigua (p.es. «Chicago») C. Bianchini - Dai metadati ai LD

27/05/2014

134

67

27/05/2014

C. Bianchini - Dai metadati ai LD

27/05/2014

135

C. Bianchini - Dai metadati ai LD

27/05/2014

136

68

27/05/2014

Triple in base all’URI Si possono raggruppare le triple anche in base alla provenienza degli URI delle risorse che fanno parte della tripla (soggetto, predicato e oggetto); gli URI possono essere stati A. Definiti all’interno di un unico dominio, cioè un’unica fonte di dati (link RDF interni) B. Definiti all’interno di domini diversi, per esempio da diversi produttori di dati (link RDF esterni)

C. Bianchini - Dai metadati ai LD

27/05/2014

137

Link RDF interni • I Link RDF interni connettono risorse all’interno di un’unica fonte di linked data (p. es. il medesimo silos). Si dice che le risorse si trovano all’interno dello stesso namespace.



C. Bianchini - Dai metadati ai LD



27/05/2014

138

69

27/05/2014

Definizione di namespace • Per namespace si intende un insieme di URI assegnati a specifiche risorse RDF che usano lo stesso dominio (la stessa infrastruttura di gestione). • Esempio o o o o o

http://dbpedia.org/page/Nastassja_Kinski http://dbpedia.org/property/starring http://dbpedia.org/page/Paris,_Texas_(film) http://dbpedia.org/... http://dbpedia.org/... etc.

C. Bianchini - Dai metadati ai LD

27/05/2014

139

La semantica di RDF • Il terzo principio dei LD richiede che siano fornite informazioni utili in risposta alle richieste di URI HTTP. • In un namespace si devono trovare le descrizioni [metadati] delle risorse (classi e proprietà) che ne fanno parte. • Le descrizioni sono raccolte in Element Sets (classes) e in Vocabularies (properties), come abbiamo visto succede in RDA. Esempio • http://dbpedia.org/page/Italo_Svevo C. Bianchini - Dai metadati ai LD

[Agent; BirthDate) 27/05/2014

140

70

27/05/2014

Namespace dell’IFLA Anche l’IFLA ha provveduto alla creazione di namespaces per i propri standard, come ISBD, FRBR, FRAD, FRSAD ecc. • • • • • •

http://iflastandards.info/ns http://iflastandards.info/ns/isbd/elements/ http://iflastandards.info/ns/fr/ http://iflastandards.info/ns/fr/frbr/frbrer/ http://iflastandards.info/ns/fr/frad/ http://iflastandards.info/ns/fr/frsad/

C. Bianchini - Dai metadati ai LD

27/05/2014

141

Namespace dell’IFLA 2 • Per identificare gli elementi l’IFLA ha scelto di utilizzare degli URI opachi. Questo garantisce: • Neutralità linguistica • Riconoscimento e promozione del multilinguismo (in linea con la strategia dell’IFLA)

Esempio http://iflastandards.info/ns/isbd/elements/P1004 • È l’URI della proprietà (predicato) ISBD “has title proper” (Eng) ed è la stessa URI per “tiene título propiamente dicho” (Spa) C. Bianchini - Dai metadati ai LD

27/05/2014

142

71

27/05/2014

Element sets: FRBRer

C. Bianchini - Dai metadati ai LD

27/05/2014

143

27/05/2014

144

Vocabularies: ISBD

C. Bianchini - Dai metadati ai LD

72

27/05/2014

Esempio • Proviamo a costruire una tripla utilizzando Element Sets e Vocabularies pubblicati dall’IFLA, in particolare ISBD. Dobbiamo esprimere questa relazione: Una risorsa ha per titolo «Robinson Crusoe» • http://iflastandards.info/ns/isbd/elements/C2001 [Resource] • http://iflastandards.info/ns/isbd/elements/P1012 [Has title] • «Robinson Crusoe» C. Bianchini - Dai metadati ai LD

27/05/2014

145

Grafo dell’esempio Esempio



C. Bianchini - Dai metadati ai LD



27/05/2014

146

73

27/05/2014

I vantaggi di RDF • Il modello logico RDF presenta numerosi vantaggi, alcuni dei quali già messi in evidenza. • I principali benefici che si hanno nell’utilizzare il modello di dati RDF nel contesto dei linked data sono: 1. RDF può essere usato su scala globale e consente a chiunque di creare un legame con qualsiasi oggetto 2. Qualsiasi URI consente di ottenere ulteriori informazioni (catene) e quindi qualsiasi tripla RDF costituisce un punto di partenza per navigare. C. Bianchini - Dai metadati ai LD

27/05/2014

147

I vantaggi di RDF 3. Il modello di dati consente di creare link RDF tra dati provenienti da fonti diverse 4. È possibile creare un grafo unico a partire da due insiemi di triple diverse 5. RDF consente di rappresentare in un unico grafo informazioni in origine espresse mediante diversi modelli, mescolando termini da vocabolari diversi 6. In combinazione con linguaggi di schemi (p.e. RDFSchema e OWL) il modello di dati lascia liberi di impiegare a preferenza molti o pochi dati

C. Bianchini - Dai metadati ai LD

27/05/2014

148

74

27/05/2014

Un esempio

C. Bianchini - Dai metadati ai LD

27/05/2014

149

Unire linked data diversi Agenzia A

http://xmlns.com/foaf/spec/#term_name

http://purl.org/dc/terms/title

«Robinson Crusoe» «Daniel Defoe»

http://dbpedia.org/ontology/isbn

C. Bianchini - Dai metadati ai LD

27/05/2014

150

75

27/05/2014

Unire linked data diversi Agenzia B «1998»



http://dbpedia.org/property/publisher

«DK Publishing»

http://dbpedia.org/ontology/isbn

C. Bianchini - Dai metadati ai LD

27/05/2014

151

I dati visti dal web







«1998» http://xmlns.com/foaf/spec/#term_name http://dbpedia.org/property/publisher

«Daniel Defoe»

«DK Publishing»

http://dbpedia.org/ontology/isbn

http://purl.org/dc/terms/title

« Robinson Crusoe» C. Bianchini - Dai metadati ai LD

27/05/2014

152

76

27/05/2014

Web semantico • Nel web semantico, i computer hanno accesso a raccolte strutturate di informazioni e a insiemi di regole di inferenza da potere utilizzare per sviluppare un ragionamento automatico. • Se i dati sono pubblicati come linked data, i computer sono in grado di recuperare dati prodotti da agenzie diverse, interpretarli (cioè riconoscere identità e relazioni) e riutilizzarli

C. Bianchini - Dai metadati ai LD

27/05/2014

153

Esempio RelFinder http://www.visualdataweb.org/relfinder.php

C. Bianchini - Dai metadati ai LD

27/05/2014

154

77

27/05/2014

Esempio Wikidata http://www.wikidata.org/wiki/Q1339 http://tools.wmflabs.org/reasonator/?q=Q1339 http://toolserver.org/~magnus/ts2/geneawiki/

C. Bianchini - Dai metadati ai LD

27/05/2014

155

Creazione delle triple • Una caratteristica fondamentale dei linked data è che sono modulari. • Modularità significa che è possibile creare nuove triple e aggiungerle alle triple esistenti con la certezza che si integrino perfettamente. • Per la creazione delle triple esistono due assunti di base del web semantico o Open world assumption o AAA principle

C. Bianchini - Dai metadati ai LD

27/05/2014

156

78

27/05/2014

Open World Assumption • Il web semantico si basa sull’assunto che l’assenza di una tripla RDF è una prova che la relativa affermazione non è ancora stata fatta (non che è falsa) • In pratica, si ritiene che l’insieme delle triple relative a un soggetto (cluster) è sempre incompleto, e si possono sempre aggiungere nuove triple

C. Bianchini - Dai metadati ai LD

27/05/2014

157

AAA principle • AAA sta per «Anyone can say anything about anything» (Chiunque può affermare qualsiasi cosa su qualsiasi cosa) • È un principio complementare al Open World Assumption • RDF non impedisce a nessuno di creare affermazioni (triple) in conflitto con affermazioni esistenti, o che appaiano prive di significato per qualcuno. RDF accetta tutti i punti di vista e non costituisce un test di veridicità o di qualità C. Bianchini - Dai metadati ai LD

27/05/2014

158

79

27/05/2014

Da RDF a RDF/XML • RDF è un modello di dati per descrivere le risorse nella forma soggetto-predicato-oggetto, rappresentata da un grafo, ma non è un formato di dati. • Il terzo principio dei Linked data stabilisce che i dati devono essere pubblicati in un formato standard. • Il processo di trasformazione dei dati in triple prende il nome di serializzazione • Il W3C ha creato due formati standard per la serializzazione: RDF/XML e RDFa (ma esistono molti altri formati) C. Bianchini - Dai metadati ai LD

27/05/2014

159

27/05/2014

160

Tripla letterale Esempio < http://xmlns.com/foaf/spec/ #term_givenName>



C. Bianchini - Dai metadati ai LD



80

27/05/2014

Tripla in RDF/XML Esempio in RDF/XML http://dbpedia.org/page/Nastassja_Kinski http://xmlns.com/foaf/spec/#term_givenName «Nastassja»

http://dbpedia.org/page/Nastassja_Kinski http://xmlns.com/foaf/spec/#term_givenName «Nastassja»

C. Bianchini - Dai metadati ai LD

27/05/2014

161

Tripla link RDF Esempio



C. Bianchini - Dai metadati ai LD



27/05/2014

162

81

27/05/2014

Tripla link RDF Esempio in RDF/XML [FORMA SINTETICA] < […] xmlns:dbpedia="http://dbpedia.org/page/" xmlns:dbpprop="http://dbpedia.org/property/" … dbpedia:Nastassja_Kinski dbpprop:Starring dbpedia:Paris,_Texas_(film) […] … C. Bianchini - Dai metadati ai LD

27/05/2014

163

Principi dei linked data 1. Usare gli URI come nome per le cose 2. Usare URI HTTP, in modo che quei nomi si possano cercare 3. Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP 4. Inserire collegamenti ad altri URI, in modo che si possano scoprire altre cose collegate

C. Bianchini - Dai metadati ai LD

27/05/2014

164

82

27/05/2014

Collegare ad altre cose • Il quarto principio dei linked data è creare link RDF che colleghino tra loro dati di natura diversa. • In precedenza abbiamo distinto le triple in relazione al loro soggetto (grappoli e catene), oggetto (URI o Literal) e alla provenienza degli URI (stesso namespace o namespaces diversi) • I Link RDF esterni connettono risorse fornite da fonti di linked data diverse (p. es. il soggetto di un libro con altri dati del Web semantico su quel soggetto).

C. Bianchini - Dai metadati ai LD

27/05/2014

165

Collegare ad altre cose • Un link RDF esterno è una tripla nella quale il soggetto ha un URI all’interno di un certo namespace mentre gli URI del predicato e/o dell’oggetto della tripla puntano a namespaces di altri set di dati Esempio • Nastassia Kinsky – èSoggettoDi – Voce di WP inglese

C. Bianchini - Dai metadati ai LD

27/05/2014

166

83

27/05/2014

Triple RDF link esterna Esempio





C. Bianchini - Dai metadati ai LD

27/05/2014

167

Tipi di triple • I collegamenti esterni sono fondamentali per il web dei dati perché sono il collante che collega i «silos dei dati», cioè i namespace in uno spazio globale e unico di dati. • Esse sono di tre tipi: A. relazionali, B. di identità, e C. di vocabolario

C. Bianchini - Dai metadati ai LD

27/05/2014

168

84

27/05/2014

Link relazionali

C. Bianchini - Dai metadati ai LD

27/05/2014

169

Link RDF Relazionali • I link relazionali mettono in relazione risorse registrate in fonti di dati diverse e che hanno qualche aspetto in comune. Per esempio Dante  Dolce Stil Novo Daniel Defoe  Londra

C. Bianchini - Dai metadati ai LD

27/05/2014

170

85

27/05/2014

Link relazionali • I link RDF relazionali consentono di creare rinvii da risorse descritte in un namespace a risorse descritte in un altro namespace. • Queste ultime, a loro volta, hanno link RDF che si riferiscono a risorse presenti in un terzo insieme di dati, e così via. • Attraverso questi collegamenti senza fine, i link relazionali costituiscono la struttura principale attraverso la quale il web dei dati può diventare un unico gigantesco grafo globale (T. Berners-Lee 2007) C. Bianchini - Dai metadati ai LD

27/05/2014

171

27/05/2014

172

Link di identità

C. Bianchini - Dai metadati ai LD

86

27/05/2014

Link RDF di identità • Nell’ambiente del web aperto è probabile che per oggetti molto famosi (p.e. un luogo o una persona) ci siano molti produttori di informazioni. • Se ciascuno usa un proprio URI per fare riferimento a quella persona o quel luogo, possono esistere molti URI per identificare la stessa risorsa. • I link di identità collegano URI utilizzati da produttori diversi di dati per identificare la stessa «cosa» del mondo reale

C. Bianchini - Dai metadati ai LD

27/05/2014

173

Link RDF di identità 2 Esempio di molti URI per la stessa ‘cosa’ • • • • • • • •

http://ja.dbpedia.org/resource/ベルリン http://ru.dbpedia.org/resource/Берлин http://el.dbpedia.org/resource/Βερολίνο http://it.dbpedia.org/resource/Berlino http://sws.geonames.org/2950159/ http://pt.dbpedia.org/resource/Berlim http://fr.dbpedia.org/resource/Berlin http://de.dbpedia.org/resource/Berlin

C. Bianchini - Dai metadati ai LD

27/05/2014

174

87

27/05/2014

Link RDF di identità 3 • Tutti gli URI che identificano la stessa ‘cosa’ si indicano con il termine alias. • La coerenza logica del web semantico si fonda sul corretto collegamento tra tutti gli alias. • Nel formato standard RDF/XML esiste una proprietà per collegare due alias: http://www.w3.org/2002/07/owl#sameAs C. Bianchini - Dai metadati ai LD

27/05/2014

175

C. Bianchini - Dai metadati ai LD

27/05/2014

176

88

27/05/2014

Scopo dei link di identità I link di identità rispondono a diverse esigenze: 1) Opinioni diverse. Gli URI alias sono molto importanti per il Web dei dati sociale perché dereferenziano (rinviano a) descrizioni della stessa risorsa fornite da editori di dati diversi 2) Tracciabilità. Utilizzare diversi URI consente ai consumatori dei linked data di sapere quello che un particolare editore di dati ha da dire su una specifica entità 3) Assenza di punti centralizzati critici. Se si dovesse usare un unico URI per tutti gli oggetti del mondo, sarebbe necessario creare e gestire un’autorità centrale che assegna i nomi. La complessità del compito creerebbe problemi tali da costituire una barriera notevole allo sviluppo del Web dei Dati C. Bianchini - Dai metadati ai LD

27/05/2014

177

Identità nel Web di dati Da quanto detto sui link di identità, si può notare che il problema dell’identificazione delle identità nel web semantico è stato risolto in modo evolutivo e distribuito; • Evolutivo, perché i link del tipo owl:sameAs possono essere aggiunti progressivamente nel tempo • Distribuito, perché molti editori diversi possono pubblicare dati con un proprio URI e aggiungere un link così lo sforzo complessivo per creare i dati risulta distribuito tra i diversi editori. • [È il modello organizzativo e funzionale del VIAF!] C. Bianchini - Dai metadati ai LD

27/05/2014

178

89

27/05/2014

Link di vocabolario

C. Bianchini - Dai metadati ai LD

27/05/2014

179

Link RDF di vocabolario Oltre a consentire a un client di scoprire nuove fonti di dati seguendo i link tra i dati e a dichiarare l’equivalenza tra URI che identificano la stessa risorsa, i linked data devono permettere di integrare dati provenienti da fonti diverse. L’integrazione tra dati provenienti da fonti diverse è possibile se si creano collegamenti tra i diversi schemi usati per pubblicare i dati sul web

C. Bianchini - Dai metadati ai LD

27/05/2014

180

90

27/05/2014

Schemi di metadati • Nel contesto dei Linked data, uno schema è un «insiemi di elementi e proprietà distinti provenienti da diversi vocabolari RDF e adottati da un’agenzia per pubblicare i propri dati sul web». • Un esempio famoso di schema di metadati è il Dublin Core Metadata Element Set, creato da OCLC per la descrizione delle risorse disponibili in rete

C. Bianchini - Dai metadati ai LD

27/05/2014

181

Esempio di schema: DC L’insieme degli elementi di metadati individuati da DC è stato tradotto in italiano dall’ICCU: Nell’insieme sono compresi quindici elementi: • Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, Rights. Vedi la traduzione in italiano VAI

C. Bianchini - Dai metadati ai LD

27/05/2014

182

91

27/05/2014

Scelta dello schema • Un’agenzia può decidere di usare: A) uno schema che contiene solo termini provenienti da vocabolari conosciuti, come DCMI (Dublin Core Metadata Initiative), FOAF (Friend-of-a-Friend), Music Ontology, BIBO (Bibliographic ontology), oppure B) Uno schema contenente anche termini «proprietari», cioè definiti dall’agenzia sulla base di esigenze specifiche (p. es. «data di creazione»). C. Bianchini - Dai metadati ai LD

27/05/2014

183

Ridurre l’eterogeneità • Se i produttori pubblicano i dati utilizzando schemi di metadati, esistenti o creati ad hoc, nel web si crea una notevole eterogeneità di metadati • Per superare questo problema, il web semantico adotta una duplice strategia: 1. Promuovere il riuso di termini di vocabolari esistenti e largamente diffusi 2. In caso di dati ‘nuovi’, renderli il più autodescrittivi possibile

C. Bianchini - Dai metadati ai LD

27/05/2014

184

92

27/05/2014

Autodescrittività • Nel Web semantico, autodescrittività significa creare termini nuovi mettendo a disposizione tutte le informazioni necessarie perché una macchina li possa tradurre in una rappresentazione (grafo) e li possa interpretare e processare. • Ciò avviene tramite: 1. La mappatura, sotto forma di collegamenti tra termini di vocabolari diversi (noti e nuovi) 2. La dereferenziazione, cioè fornendo descrizioni e definizioni dei nuovi termini.

C. Bianchini - Dai metadati ai LD

27/05/2014

185

I link di vocabolario La mappatura avviene mediante link di vocabolario, che collegano la definizione di un elemento in un certo vocabolario con la definizione dell’elemento corrispondente in un altro vocabolario. Esempio «ISBD:TitleProper» «èUgualeA» «DC:title» SPO

C. Bianchini - Dai metadati ai LD

27/05/2014

186

93

27/05/2014

La proprietà del link di vocabolario SPO • Le proprietà (link RDF di vocabolario) che possono essere usate nella mappatura dei concetti sono definite, a seconda dei casi, in schemi diversi, che hanno capacità espressive differenti. Per esempio: • RDF Schema (RDFS) • Web Ontology Language (OWL) • Simple Knowledge Organization System (SKOS) C. Bianchini - Dai metadati ai LD

27/05/2014

187

Mappatura OWL. Esempi Nello schema OWL (Web Ontology Language) sono previste molte proprietà che possono essere usate come link di vocabolario (per esempio: owl:equivalentClass oppure owl:equivalentProperty) Per es., se si applica la proprietà owl:equivalentClass, si può ottenere il seguente link di vocabolario: Foaf:person owl:equivalentClass FRBR:person

C. Bianchini - Dai metadati ai LD

27/05/2014

188

94

27/05/2014

Mappatura RDFs. Esempi Nello schema RDF Schema esistono altre proprietà che possono essere usate come link di vocabolario (per esempio: rdfs:subClassOf o rdfs:subPropertyOf) Per esempio, se si applica la proprietà rdfs:subClassOf, si può ottenere il seguente link di vocabolario: ISBD:CollectiveTitle rdfs:subClassOf ISBD:TitleProper

C. Bianchini - Dai metadati ai LD

27/05/2014

189

Mappatura SKOS. Esempi Nello schema SKOS (Simple Knowledge Organization System) esistono proprietà più specifiche da usare come link di vocabolario (per esempio skos:broadMatch oppure skos:narrowMatch) Per es., se si applica la proprietà skos:broadMatch, si può ottenere il seguente link di vocabolario: NS:Spade skos:broadMatch NS:Katane

C. Bianchini - Dai metadati ai LD

27/05/2014

190

95

27/05/2014

Nuovo Soggettario in SKOS

C. Bianchini - Dai metadati ai LD

27/05/2014

191

27/05/2014

192

NS: Emicrania

C. Bianchini - Dai metadati ai LD

96

27/05/2014

NS: Emicrania (SKOS) Emicrania 2011-03-30 Nevralgia sopraorbitaria […] C. Bianchini - Dai metadati ai LD

27/05/2014

193

27/05/2014

194

Parte 5 Pubblicare i dati nel web semantico

C. Bianchini - Dai metadati ai LD

97

27/05/2014

Pubblicare i dati nel web Un progetto di pubblicazione di dati bibliografici nel web semantico deve considerare molti aspetti. Possiamo esaminarne in particolare tre: 1) Perché pubblicare i dati delle biblioteche? 2) Quali sono i requisiti per pubblicare i dati delle biblioteche come linked data? 3) Quali sono le fasi del processo di pubblicazione?

C. Bianchini - Dai metadati ai LD

27/05/2014

195

Parte 5.1 Perché pubblicare i dati nel web semantico

C. Bianchini - Dai metadati ai LD

27/05/2014

196

98

27/05/2014

LLD XG del W3C • Nel maggio 2011, il World Wide Web Consortium ha incaricato un gruppo di lavoro di studiare nuovi modi per • «favorire l’aumento dell’interoperabilità globale dei dati bibliografici sul web, facendo collaborare persone coinvolte nelle attività del web semantico nella comunità bibliotecaria»

C. Bianchini - Dai metadati ai LD

27/05/2014

197

Rapporto del LLD XG • Il rapporto finale indica come utilizzare gli standard del Web Semantico e i principi dei linked data per rendere più visibili e riutilizzabili nel web aperto le preziose raccolte di informazioni create e curate dalle biblioteche. • In particolare, l’interesse del web semantico si indirizza verso la disponibilità di: 1. dati bibliografici, 2. dati di autorità e 3. schemi concettuali. C. Bianchini - Dai metadati ai LD

27/05/2014

198

99

27/05/2014

Raccomandazioni chiave • Che i responsabili delle biblioteche identifichino gli insiemi di dati potenzialmente idonei a essere tradotti per primi sotto forma di linked data; inoltre promuovano il dibattito sull’apertura dei dati e dei relativi diritti • Che gli enti di standardizzazione bibliografica • a) promuovano la partecipazione delle biblioteche alla standardizzazione del Web semantico e gli standard per dati bibliografici compatibili con i LD e • b) diffondano le migliori pratiche di progettazione di modelli adatti ai linked data bibliografici; C. Bianchini - Dai metadati ai LD

27/05/2014

199

Raccomandazioni chiave • Che i progettisti dei sistemi e dei dati sviluppino servizi avanzati per l’utente basati sui LD, creino URI per gli oggetti dei dataset, promuovano politiche di gestione dei vocabolari RDF e dei relativi URI e pubblichino i dati bibliografici riutilizzando vocabolari già esistenti o mappando i nuovi termini; • Che i bibliotecari, archivisti e curatori dei musei conservino gli element sets e i vocabolari dei LD bibliografici e applichino l’esperienza delle biblioteche nella cura e nella conservazione a lungo termine degli element sets dei LD C. Bianchini - Dai metadati ai LD

27/05/2014

200

100

27/05/2014

I dati delle biblioteche • I Library linked data che si possono derivare dalle registrazioni bibliografiche esistenti, costruite in base a standard internazionali e condivisi, sono molto importanti per il web semantico per ragioni di quantità e di qualità. • Riguardano molte delle risorse disponibili che interessano gli utenti del web semantico. • L’aspetto più importante è rappresentato dai principi usati nella costruzione dei data bibliografici

C. Bianchini - Dai metadati ai LD

27/05/2014

201

Principi per i linked data Nel nostro linguaggio professionale, potremmo definire i principi indicati da Tim Berners-Lee per realizzare i linked data, con il termine funzioni: 1. 2.

3.

4.

Usare gli URI come nome per le cose Usare degli URI HTTP, in modo che quei nomi si possano cercare Fornire informazioni utili in forma standard (RDF) in risposta alle richieste HTTP Inserire collegamenti ad altri URI, in modo che si possano scoprire altre cose collegate

C. Bianchini - Dai metadati ai LD

1. Identificare i dati 2. Rendere accessibili i dati 3. Giustificare i dati 4. Collegare i dati

27/05/2014

202

101

27/05/2014

Principi per i linked data In FRAD le stesse funzioni sono state formalmente definite come funzioni utente, e corrispondono largamente ai principi dei linked data: 1. 2. 3. 4.

Identificare i dati Rendere accessibili i dati Giustificare i dati Collegare i dati

2. Identificare 1. Trovare 4. Giustificare 3. Contestualizzare

nel web C. Bianchini - Dai metadati ai LD

27/05/2014

203

I dati delle biblioteche 2 • Il legame e la corrispondenza tra i principi dei Linked Data e le funzioni di FRAD dimostrano che i dati creati dalle biblioteche per il controllo di autorità, che riguardano persone, enti, luoghi, soggetti e altri aspetti sono molto importanti per la costruzione del web e possono interessare anche al di fuori dell’ambito bibliografico puro.

C. Bianchini - Dai metadati ai LD

27/05/2014

204

102

27/05/2014

Parte 5.2 Come pubblicare i dati nel web semantico

C. Bianchini - Dai metadati ai LD

27/05/2014

205

Linked (Open) Data • Come avviene per la pubblicazione di informazioni nel web dei documenti, la pubblicazione dei dati sul web delle biblioteche sul web si può realizzare con diversi gradi di apertura e di interoperabilità. • L’apertura si riferisce alle politiche di pubblicazione con licenze d’uso gratuite e all’uso di formati aperti anziché formati proprietari • L’interoperabilità si all’uso di modalità tecniche di pubblicazione che rendano sempre più facile la condivisione, il riuso e la modularità. C. Bianchini - Dai metadati ai LD

27/05/2014

206

103

27/05/2014

Pubblicare in 5 passi Il diverso grado di apertura e di interoperabilità è stato espresso da Tim Berners Lee mediante una scala contrassegnata da un numero crescente di stelle (da 1 a 5) * Licenza. I dati sono disponibili sul web (in qualunque formato) ma con una licenza aperta ** Dati strutturati. i dati sono disponibili come dati strutturati leggibili da una macchina (e.g. una tabella in Excel invece che sotto forma di immagine) C. Bianchini - Dai metadati ai LD

27/05/2014

207

Pubblicare in 5 passi *** Formato. i dati sono disponibili come al punto 2 ma in un formato non proprietario (es. CSV invece che Excel) **** Dereferenziazione. Per identificare le cose si usano URI HTTP, in modo che si possano identificare le cose e ottenere informazioni utili in formato standard ***** Linked data. i dati sono disponibili come ai punti precedenti, più link esterni ai dati di altre fonti per fornire il contesto più adatto. C. Bianchini - Dai metadati ai LD

27/05/2014

208

104

27/05/2014

Parte 5.3 Il processo di pubblicazione

C. Bianchini - Dai metadati ai LD

27/05/2014

209

Pubblicare i dati nel web Un insieme di metadati si può considerare come il risultato di cinque componenti fondamentali: 1) Uno schema o element set (gli elementi che si vogliono registrare) 2) Uno o più vocabolari (specifici ‘termini' o ‘valori' che si registrano negli elementi) 3) Un modello concettuale – il modello implicito che descrive come tutte le informazioni e I concetti relativi a una risorsa sono collegati tra loro (p.es. FRBR) 4) Uno standard di contenuto – un codice che descrive come le singole informazioni (p.es. i vocabolari) devono essere inseriti negli elementi dello schema di metadati (p.es. RDA) 5) Un formato di codifica, che si occupa del modo nel quale i metadati vengono presentati (p.es. RDF/XML) C. Bianchini - Dai metadati ai LD

27/05/2014

210

105

27/05/2014

Processo di pubblicazione • Il processo di pubblicazione dei dati dovrebbe avvenire seguendo queste fasi: 1. Si ricercano classi e proprietà già definiti in vocabolari esistenti sul web, che possano essere riutilizzate per rappresentare i propri dati 2. Se i vocabolari disponibili non sono sufficienti, si aggiungono alle classi e le proprietà già disponibili nuove e specifiche classi e proprietà autodescrittive per esprimere il resto dei dati 3. In seguito, si continua a controllare se le nuove classi e proprietà sono state create anche in altri (nuovi) vocabolari e si mappano i termini. C. Bianchini - Dai metadati ai LD

27/05/2014

211

Le ontologie Quando si crea uno schema di metadati che riutilizza elementi diffusi e provenienti da vocabolari esistenti, si devono definire tutti i rapporti tra i vari elementi. • L’insieme delle triple, e il relativo grafo RDF, che descrive a livello generale lo schema dei metadati, si chiama ontologia. • L’ontologia fornisce una rappresentazione formale della struttura dei dati in termini di classi e proprietà. • L’ontologia è lo strumento che consente all’elaboratore di ‘dedurre’ nuove triple.

C. Bianchini - Dai metadati ai LD

27/05/2014

212

106

27/05/2014

Le ontologie. Esempio • Definiamo un’ontologia semplice

Persona

ÈPadreDi

ÈPadreDi

Persona

ÈPadreDi

ÈFratelloOSorelladi Persona

ÈFratelloOSorelladi Persona

C. Bianchini - Dai metadati ai LD

27/05/2014

213

Le ontologie. Esempio • Applichiamo l’ontologia

Andrea

ÈPadreDi

ÈPadreDi

Alberto

ÈPadreDi

ÈFratelloOSorelladi Aurora

C. Bianchini - Dai metadati ai LD

ÈFratelloOSorelladi Agata

27/05/2014

214

107

27/05/2014

Le ontologie. Esempio 2 • Definiamo un’ontologia con ISBD Proprietà

Risorsa (ISBD)

Ha per titolo proprio (ISBD)

Proprietà SubProprietà Ha per titolo (ISBD)

Title (DC)

EquivaleA C. Bianchini - Dai metadati ai LD

27/05/2014

215

HaPerTitoloProprio Risorsa (ISBD)

HaPerTitolo

«Robinson Crusoe» C. Bianchini - Dai metadati ai LD

«Robinson Crusoe» TitleDC

«Robinson Crusoe» 27/05/2014

216

108

27/05/2014

C. Bianchini - Dai metadati ai LD

27/05/2014

217

Grafo per la pubblicazione dei dati TitoloLibro

NomeAutore

IDAutore

URI DBPedia

C. Bianchini - Dai metadati ai LD

dc:creator

IDLibro

URI Europeana URI Europeana

URI DBPedia 27/05/2014

218

109

27/05/2014

Schemi per i beni culturali • Nel pubblicare i propri dati, un’agenzia deve tenere conto degli schemi già esistenti. • Nell’ambito dei beni culturali, esistono innumerevoli schemi di metadati già disponibili e mappati ad altri schemi. • Una rappresentazione grafica dell’esistenza di questi schemi e dei loro legami (mappature) reciproche è data dalla Linked Open Data Cloud (vai)

C. Bianchini - Dai metadati ai LD

27/05/2014

219

Strumenti per schemi Per realizzare uno schema di metadati per la creazione dei linked data, l’agenzia dovrebbe controllare se un determinato elemento è già definito all’interno di uno schema esistente. A questo scopo può essere utile uno strumento come LOV – Linked Open Vocabularies, che consente di cercare oggetti a livello di vocabolari o di elemento

C. Bianchini - Dai metadati ai LD

27/05/2014

220

110

27/05/2014

C. Bianchini - Dai metadati ai LD

27/05/2014

221

Linked data ‘bibliografici’? • Nel web costituito dai linked data, non esiste più la distinzione tra dati “bibliografici” e dati “di altra natura”; • Subentra la distinzione tra dati connessi e dati non connessi. • Con l’espressione linked data bibliografici (library linked data) si indicano perciò dati pubblicati come linked data e il cui contenuto abbia rilevanza bibliografica • Verso i «cultural heritage linked data»? C. Bianchini - Dai metadati ai LD

27/05/2014

222

111

27/05/2014

Registrazioni bibliografiche? • Quali conseguenze – logiche e pratiche – può avere l’abbandono del concetto di descrizione bibliografica tradizionale (record)? • Non si ha più la redazione di record, ma la definizione dei dati (relativi a un’opera, a un autore, ecc.) formulati per lo più tramite termini estratti da vocabolari e ontologie. • Si assiste al passaggio dal record management all’entity management.

C. Bianchini - Dai metadati ai LD

27/05/2014

223

Registrazioni bibliografiche? Esempio: Robinson Crusoe • • • •

Robinson Crusoe da DBpedia inglese Robinson Crusoe da DBpedia italiana Robinson Crusoe da WorldCat Robinson Crusoe da data.bnf.fr

C. Bianchini - Dai metadati ai LD

27/05/2014

224

112

27/05/2014

La funzione di ‘custodia’ • Se le triple originali che descrivono l’ontologia di un oggetto, come la sua etichetta e la sua descrizione, andassero perdute, sarebbe fortemente diminuito il valore e la validità stessa di tutte le altre triple che usano quegli URI e sarebbe potenzialmente a rischio anche l’integrità del web semantico • I professionisti MAB hanno la responsabilità di conservare i propri dati ma anche tutti gli insiemi di dati e vocabolari di rilevanza culturale.

C. Bianchini - Dai metadati ai LD

27/05/2014

225

Grazie! Carlo Bianchini Dipartimento di Musicologia e beni culturali (Cremona) Università degli studi di Pavia carlo(dot)bianchini(at)unipv(dot)it

C. Bianchini - Dai metadati ai LD

27/05/2014

226

113

27/05/2014

Bibliografia consigliata • Berners-Lee, Tim (2007), Giant Global Graph, Retrieved from http://dig.csail.mit.edu/breadcrumbs/node/215 • Bianchini, C. (2010). Futuri scenari: RDA, REICAT e la granularità dei cataloghi. Bollettino AIB, 50(3), 219–238. Retrieved from http://bollettino.aib.it/article/view/5319/5082 • Bianchini, C. (2012a). Dagli OPAC ai Library Linked Data: come cambiano le risposte ai bisogni degli utenti. AIB Studi, 52(3), 303–323. doi:10.2426/aibstudi-8597 • Bianchini, C. (2012b). Il Library Linked Data Incubator Group e il futuro delle biblioteche. Disponibile a http://eprints.rclis.org/16886/ • Bizer, C., Heath, T., & Berners-Lee, T. (2009). Linked data. The story so far. International Journal of Semantic Web Inf. Syst., 5(3), 1–22. C. Bianchini - Dai metadati ai LD

27/05/2014

227

Bibliografia consigliata • Cossham, A. F. (2013). Bibliographic records in an online environment. Information Research, 18(3). Retrieved from informationr.net/ir/18-3/colis/paperC42.html • Davis, I., & Heath, T. (2009). The thirty minute guide to RDF and Linked Data. Retrieved September 30, 2012, from http://www.slideshare.net/iandavis/30-minute-guide-to-rdfand-linked-data • Decker, S., Hausenblas, M., Schneider, J., & Lopes, N. (2012). Linked Data in the Digital Humanities. lodlam.net. Retrieved September 30, 2012, from http://lodlam.net/2012/10/27/linkeddata-in-the-digital-humanities/ • Dunsire, G., Hillmann, D., & Phipps, J. (2012). Reconsidering Universal Bibliographic Control in Light of the Semantic Web. Journal of Library Metadata, 12(2-3), 164–176. doi:10.1080/19386389.2012.699831 C. Bianchini - Dai metadati ai LD

27/05/2014

228

114

27/05/2014

Bibliografia consigliata • Dunsire, G., & Willer, M. (2011). Standard library metadata models and structures for the Semantic Web. Library Hi Tech News, 28(3), 1–12. doi: http://dx.doi.org/10.1108/07419051111145118 • Dunsire, G., & Willer, M. (2011). UNIMARC and Linked Data. Relazione presentata a IFLA 2011, Puerto Rico. Retrieved from http://conference.ifla.org/past/2011/187-dunsire-en.pdf • Guerrini, M., Crupi, G., & Peruginelli, G. (2013). Global interoperability and linked data in libraries: special issue. JLIS.it, 4(1), 452. Retrieved from http://leo.cilea.it/index.php/jlis/issue/view/536 • Guerrini, M., & Possemato, T. (2012). Linked data: un nuovo alfabeto del web semantico. Biblioteche oggi, 30(3), 7–15. Retrieved from http://www.bibliotecheoggi.it/content/201200300701.pdf C. Bianchini - Dai metadati ai LD

27/05/2014

229

Bibliografia consigliata • Heath, T., & Bizer, C. (2011). Linked Data: Evolving the Web into a Global Data Space. Synthesis Lectures on the Semantic Web: Theory and Technology, 1(1), 1–136. doi:10.2200/S00334ED1V01Y201102WBE001 • Hyvönen, E. (2012). Publishing and Using Cultural Heritage Linked Data on the Semantic Web. Synthesis Lectures on the Semantic Web: Theory and Technology, 2(1), 1–159. doi:doi: 10.2200/S00452ED1V01Y201210WBE003 • Tillett, Barbara B. 2011. “Looking to the future with RDA.” www.loc.gov 40. Retrieved (http://www.loc.gov/aba/rda/source/Looking_to_the_future_ with_RDA_English.ppt ). • Willer, M., Dunsire, G., & Bosancic, B. (2010). ISBD and the Semantic Web. JLIS.it, 1(2), 213–236. Retrieved from http://leo.cilea.it/indexphp/jlis/article/view/4536 C. Bianchini - Dai metadati ai LD

27/05/2014

230

115

27/05/2014

Siti web • • • • •

• •

http://dublincore.org/documents/library-application-profile/ Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/ Richard Wallis, Why schema.org for libraries?, http://www.slideshare.net/rjw/why-schemaorg Educational Curriculum for the usage of Linked Data, http://www.euclid-project.eu/ Lee Feigenbaum, Sparql by example, http://www.cambridgesemantics.com/semantic-university/sparql-byexample Bong [Motore di ricerca per LD] http://toolserver.org/~magnus/bong.php Precision search and find [motore di ricerca per LD], http://dbpedia.org/fct/

C. Bianchini - Dai metadati ai LD

27/05/2014

231

116

20140526 Dai metadati bibliografici ai linked data CEDOC DEF.pdf ...

There was a problem loading this page. 20140526 Dai metadati bibliografici ai linked data CEDOC DEF.pdf. 20140526 Dai metadati bibliografici ai linked data ...

4MB Sizes 3 Downloads 191 Views

Recommend Documents

20131104 Dai metadati bibliografici ai linked data SARDEGNA.pdf ...
Please enter this document's password to view it. Password incorrect. Please try again. Submit. 20131104 Dai metadati bibliografici ai linked data SARDEGNA.pdf. 20131104 Dai metadati bibliografici ai linked data SARDEGNA.pdf. Open. Extract. Open with

20131104 Dai metadati bibliografici ai linked data SARDEGNA.pdf ...
20131104 Dai metadati bibliografici ai linked data SARDEGNA.pdf. 20131104 Dai metadati bibliografici ai linked data SARDEGNA.pdf. Open. Extract. Open with.

Exploiting Linked Data Francisco Javier Cervigon Ruckauer.pdf ...
Exploiting Linked Data Francisco Javier Cervigon Ruckauer.pdf. Exploiting Linked Data Francisco Javier Cervigon Ruckauer.pdf. Open. Extract. Open with.

Linked Data Query Processing Strategies
Recently, processing of queries on linked data has gained at- ... opment is exciting, paving new ways for next generation applications on the Web. ... In Sections 3 & 4 we present our approach to stream-based query ..... The only “interesting”.

How Google is using Linked Data Today and ... - Semantic Scholar
3 DERI, NUI Galway IDA Business Park, Lower Dangan Galway, Ireland, ... The Web is the seminal part of the Application Layer of network architectures. Two major trends are currently ... the Social Web (also called Web 2.0). The Web of Data ...

CAMO: Integration of Linked Open Data for ... - Semantic Scholar
1. An example of integrating LOD for multimedia metadata enrichment. A motivating example ... tion, thus creating mappings between their classes and properties is important ... The technical contributions of this paper are threefold: ..... the multim

SIHJoin: Querying Remote and Local Linked Data
problem of Linked Data query processing: to query not only remote, but also local ..... server on the local network so that data can be accessed using URI lookup,.

Linked Lists
while (ptr != NULL). { if (ptr->n == n). { return true;. } ptr = ptr->next;. } return false;. } Page 5. Insertion. 2. 3. 9 head. 1. Page 6. Insertion. 2. 3. 9 head. 1. Page 7 ...

Privacy Concerns of FOAF-Based Linked Data
As it is well-structured linked data, it can be parsed using common RDF processing libraries, like Sesame or Jena. Parsing Axel's. FOAF profile gave us valuable information about his friends and contact information. The next step is to find the seed'

What to do with Linked Data?
The flight of artists from Europe to the United States. Page 28. Changes in imports from Japan to. Finland in the middle 20 th ... Department of. Computer Science. Data woes: Europeana http://labs.europeana.eu/api/linked-open-data-data-downloads. Pag

SIHJoin: Querying Remote and Local Linked Data
are retrieved by a dedicated retrieval thread [6] and their data is pushed directly ..... server on the local network so that data can be accessed using URI lookup,.

LDWPO – A Lightweight Ontology for Linked Data Management.pdf ...
There was a problem previewing this document. Retrying... Download. Connect more apps... Try one of the apps below to open or edit this item. LDWPO – A ...

Data structures part 1 Singly linked list.pdf
Data structures part 1 Singly linked list.pdf. Data structures part 1 Singly linked list.pdf. Open. Extract. Open with. Sign In. Main menu.

Linked Data and Live Querying for Enabling Support ...
Linked Data and Live Querying for Enabling. Support Platforms for Web Dataspaces. Jürgen Umbrich1, Marcel Karnstedt1, Josiane Xavier Parreira1,.

BookSampo - Linked Data in the Service of Fiction ...
globally unique identifiers. -> Relates entities (authors, books, movies, publishers, awards, series, reviews, ...) to each other, manifesting the rich context of fiction literature. -> Allows automatically merging in external information (e.g. from

Linked data in practice in digital humanities projects
Information Services, ProQuest LLC and Gale Cengage. Learning) to produce services. • Often, they also participate in content creation projects, and then hold ...

Top-k Linked Data Query Processing
score bounds (and thus allow an earlier termination) as compared to top-k .... In a pull-based implementation, operators call a next method on their in-.

CORE - A Contextual Reader based on Linked Data
Department of. Computer Science. A Contextual Reader for First World. War Primary Sources. Demonstrative documents: ○ a primary source PDF from the CU-Boulder WWI Collection. Online. ○ a postcard with metadata from the Great War Archive. ○ an e

Cross-linked resins
Dec 1, 1972 - phine oxide, bis-(3-aminophenyl)methylphosphine ox ide, bis-(4-aminophenyl)phenylphosphine oxide, bis-(4 aminophenyl)phenylamine, 1 ...

Linked Open Data and Web Corpus Data for noun ...
Keywords: noun compound bracketing, linked open data, DBpedia, Google Web Ngrams, Google .... and his gold standard has been used in different research.

ai-bike.pdf
We will seek shelter if a storm comes through and can also provide rain jackets if. needed. Generally, we can work around rain. Our staff will be watching the.