Fedora

Post on 29-Jun-2015

63 views 0 download

Tags:

transcript

Fedora

Flexible

Extensible

Digital

Object

Repository

Architecture

Carsten Schulze

AG Metadaten 2009-09-23

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 2

Warum brauchen wir ein Repositorium?

anders gefragt: Warum können wir uns nicht KEIN Repositorium leisten?

Stand der Dinge: alle Digitalisate liegen unverwaltet im Filesystem Beschreibung der Digitalisate durch METS Möglichkeit der Anzeige durch GOOBI-Präsentation, DFG-Viewer

oder Insellösungen (z.B. ZEFYS) kein zentraler Zugriff auf Digitalisate/Metadaten kein zentraler Einstiegspunkt für Nutzerrecherchen/Serviceprovider heterogene Metadatenprofile hoher Mittel- und Personalaufwand für Programmierungen schlechte bis keine Nachnutzbarkeit der Insellösungen Produktion der Metadaten auf „Verdacht“

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 3

Warum brauchen wir ein Repositorium?

Wie könnte es sein? Digitalisate werden zentral verwaltet Versionskontrolle, Rechtemanagement, Langzeitarchivierung Repositorium gibt METS Profil vor, für den Ingest von Daten alle Digitalisierungsprojekte müssen sich nach dem Ingest-Profil

des Repositoriums richten -> einheitliche Metadatenerstellung einheitliche Dissemination-Profiles (z.B. SBB METS-Profil) Interoperabilität durch Bekanntmachung des Metadtenprofils für

die Community (z.B. OAI-Profil, METS Profile Registry) zentraler Zugriff für alle Recherche über alle oder Subsets von Digitalisaten Schnittstellen sind schon im Repositorium vorhanden Nachnutzung von Services für alle Projekte geringer Mittel- und Personalaufwand durch Synergieeffekte

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 4

Warum brauchen wir ein Repositorium?

weitere Vorteile: Definition von Relationen zwischen digitalen Objekten gezieltes Ansprechen von kleinsten Teilen von digitalen Objekten

(z.B. ein Zeitungsartikel) Zitieren von digitalen Objekten (jedes kleinste Teil hat ein URI) Nutzung von Suchmaschinentechnologie für Recherche Einbindung von Ontologien semantische Suche

Mal angenommen jemand hätte eine LZA-Lösung (z.B. DNB) nur über ein Repositorium könnte man sinnvoll (interoperabel) auf

unsere Daten zugreifen

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 5

Vorschlag zur Diskussion

Ein Repositorium baut sich nicht alleine auf: Anpassung und Pflege der Schnittstellen Definition von Ingest und Dissemination Packages Definition Pflege von Services Verknüpfung mit Ontologien Ansprechpartner für alle Digitalisierungsprojekte

Wir brauchen eine Person, die in Vollzeit (zumindest zwei Jahre) das Repositorium aufbaut und anpasst.

danach für die Pflege und Verwaltung eine halbe Stelle

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 6

Angenda

1. Kontext

2. Was macht Fedora einzigartig

3. Was bietet Fedora

4. Wie gelangen meine Digitalisate in Fedora

5. Wie ist ein Fedora Objekt aufgebaut

6. Zugriff auf Fedora Inhalte

7. Zugriffsmodell

8. Services

9. Beziehung von Objekten

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 7

Kontext

hauptverantworliche Organisation: DuraSpace (non-profit)

open source

lizensiert unter der Apache License, Version 2.0

Software zum Speichern Verwalten Zugriff digitale Inhalte jeglicher Art

geeignet für digitale Sammlungen digitale Bibliotheken Archive Langzeitarchivierung und –verfügbarkeit institutionelle Repositorien open access publishing Dokumentenmanagement usw.

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 8

Was macht Fedora einzigartig?

abstrakte Methoden um digitale Objekte zu beschreiben

kann Beziehungen zwischen digitalen Objekten beschreiben

gibt eine Serviceorientierte Architektur (SOA) vor, in die digitalen Objekte eingebunden werden können

eine offene Architektur, die nach eigenen Vorstellungen angepasst und erweitert werden kann

Speichern und Verwalten jeglichen Typen von digitalen Inhalten (Text, Audio, Film, Multimedia etc.)

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 9

Was bietet Fedora?

repository (core) service web-basierter Service mit SOAP/REST APIs (z.B. SRU)

zusätzliche Services Suche mit Suchmaschinentechnologie Triple-Store für semantisches Retrieval (SPARQL) Versionierungs- und Wiederherstellungsmechanismen OAI-PMH Provider Service Service zum (Batch-)Einlesen aus Ordnerstrukturen Trennung von digitalen Objekten bezüglich ihres Inhalts eindeutige Identifizierung beliebiger Datenströme durch URI verschiedene grafische Oberflächen zur Verwaltung (z.B. Fez) erfüllt DINI-Anforderungen (von Softwareseite aus)

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 10

Wie gelangen meine Digitalisate in Fedora?

z.B. durch den Directory IngestService

Ordnerstruktur mit METS und Digitalisaten

Regeln, wie die Ordnerstruktur

ausgelesen werden soll

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 11

Wie ist ein Fedora Objekt aufgebaut?

ein Objekt in Fedora wird mittels FedoraObject XML (FOXML) definiert und verwaltet

Metadaten über das Objekt

verfolgt alle Änderungen am Objekt / wird nur vom System

kontrolliert

Beziehung zu anderen digitalen Objekten

•intern gespeichert oder extern referenziert•Metadaten oder Daten•MIME-Typ•lokaler + globaler Identifier (DOI oder Handle)•Status (gelöscht, aktiv?)•Checksum (MD5, SHA-1...)

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 12

Zugriff auf Fedora Inhalte

für jeden Inhalt (Datastream) hält Fedora ein „access point“ vor

jeder „access point“ wird durch eine URI identifiziert

welche „access points“ bzw. Typen von Datastreams ein Fedora Objekt hat wird durch ein „Content Model Object “ beschrieben

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 13

Zugriffsmodell

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 14

Services

Services, die auf Inhalte angewandt werden können, werden in einem „Service Definition Object“ definiert und über ein „Service Deployment Object“ an das System angepasst

Service Definition Object

Service Deployment Object

23.09.2009 | Carsten Schulze | Zeitungsinformationssystem ZEFYS S. 15

Beziehungen von Objekten

Fedora bietet die Möglichkeit Beziehungen von Objekten zu definieren (z.B. Sammlung <-> Sammlungsstück

Fedora Objektbeziehungen sind in der „Fedora relationship ontology“ definiert

Fedora Objektbeziehungen sind innerhalb eines Objekts als Datastreams verankert

Fedora Objektbeziehungen werden in RDF kodiert

Fedora indiziert automatisch alle Objektbeziehungen in den „RDF-based Resource Index“

Vielen Dank für Ihre Aufmerksamkeit

Carsten Schulze

Zeitungsinformationssytem ZEFYS

carsten.schulze@sbb.spk-berlin.de