Dspace - isidora.cnrs.frisidora.cnrs.fr/IMG/pdf/Dspace.pdf · Introduction qLes initiateurs du...

Post on 14-Oct-2018

215 views 0 download

transcript

Dspace Un Système d’Archivage d’Objets Numériques

Les Archives OuvertesJournées Isidora du 9 & 10 Octobre 2003

Laurence Raphaël & Gerard Clabault (Msh-Alpes)

Introduction

q Les initiateurs du projetu MIT & HP Labs

q Fédération Dspaceu Développement et interopérabilité de Dspace

q Technologieu Java, Tomcat, XML --> services Web

q Statut du logicielu Distribué sous licence ’open source BSD’

q Conformité OAIu OAI-PMH Version 2.0

Les objectifs

q Système d’archivage d’objets numériquesu gestion, distribution et préservation d’objets numériques

q Base de données des métadonnées associéesu création, indexation, recherche…

q Plateforme de production et de distribution depublications électroniquesu gère les étapes du processus d’éditionu met ‘en ligne’ les documents

Le modèle DSpace

Ecoles

Facultés

U.F.R.

Laboratoires

Programmes

Stockage

Métadonnées (Database)

Recherche/Navigation

Interfaces Web

Proc

essu

s de

pub

licat

ion

Système DSpace

Laboratoires

Ecoles Facultés

U.F.R.

Collection

ItemsItemsItems…

COMMUNAUTES

Uti

lisat

eurs

Les aspects fonctionnels

Modèle de données - Métadonnées -E-peoples & Groupes - Autorisation -

Alimentation de l’entrepôt - Workflow -Identifiants permanents - Recherche -

Interfaces Web

Le modèle de données

Système organisationnel

Communauté

Fichier Dublin Core

Format Bitstream

Item

Bundle

Collection

Bitstream

q Les types d’objets numériquesu Accepte tous types de documents

l Articles (Préprints, e-prints) ; Rapports techniques ;Communications de congrès ; Ouvrages ; Thèses ;Programmes informatiques ; Audio ; Vidéo ; Images ;Cours...

q Les statuts de Bitstreamsu 3 niveaux de préservation à déterminer

l Supportedl Known

l Unsupported

Le modèle de données (2)

q Métadonnées Dublin Core qualifiéesu Basées sur!!’Library Application Profile’ (LAP)

l Saisies lors de la soumission / Générées automatiquementpar le système / Gérées par l!’administrateur

l Valeurs par défaut ou listes de valeurs possiblesdéfinissables pour chaque collection

l Métadonnées descriptives, ‘administratives’, ‘structurelles’

q Autres métadonnéesu Bitstreams associés à l!’Item

Les métadonnées

q E-peoplesu Inscription, Soumission, Édition

l Adresse mail, Nom, Mot de passe, Certificat, Adresse IP...

u Constitution de groupes de e-peoplesl Soumissionl Édition

q Groupesu Définition des autorisations par communautés

l Qui peut : éditer la page d!’accueil, créer des collections,soumettre dans 1 collection, etc.

E-peoples et groupes

q Associer des actions à des objets et à des listesde personnes pouvant les effectuer

q Sur e-peoples ou sur groupes de e-peoplesu Read : lectureu Write : écritureu Add : Ajoutu Remove : Suppressionu Default_Item_Read : lecture de l!’itemu Default_Bitstream_Read : lecture du Bitstream

Les autorisations

q Procédure automatisée (batch)u Métadonnées XML + fichiers

q Soumissionu Dépôt via une interface webu Dans une ou plusieurs collectionsu Possibilité de corrections, d’arrêt et reprise de

la soumission, d’annulationu Vérification de l’intégrité des fichiersu Accusé de réception par mail sur l’état de la

soumission

Alimentation de l’entrepôt

q Gestion du workflowu Processus d’édition propre aux collectionsu Attribution des tâches par alertes e-mailu Intervention via une interface web

q Les étapes d’édition & les actionsu 1 - Acceptation ou rejet de la soumissionu 2 - Édition des métadonnées - Acceptation ou rejet de la

soumissionu 3 - Édition des métadonnées - Transmission pour

stockage et mise en ligne

Le workflow

Les identifiants permanents

q Identifiant unique et permanentu Pour les items, collections et communautésu Faire face au temps

l arrêt, reconfiguration, évolution du service, etc.l Point de référence stable (citations)

q Utilise le système Handle (CNRI)u Résolution de noms :

l <Handle>::=<Handle Naming Authority> ”/” <Handle LocalName>

l http://hdl.handle.net/1801/23 OU hdl: 1801/23

q Utilisation d’un autre système

La recherche

qMoteur de recherche : Lucene Jakartau Recherche par champs

l Auteurs, Titre, Date, Mots-clés, Identifiant,etc.l Dans tout Dspace ou dans une communauté

u Fonctionnalitésl Opérateurs booléens, parenthésage, troncature droite,

masque de caractère, lemmatisation, recherched!’expression, mots vides

q Parcouriru Auteurs, Titre, Dateu Tout Dspace, par Communauté, par Collection

q 3 interfacesu Lecteur (end-user : identifié / anonyme)u Contributeur (soumission, workflow)u Administrateur

q My Dspaceu Abonnementsu Items soumisu Items en cours de soumissionu Tâches à accomplir

Les interfaces web

Aspects informatiques

Architecture - Couche stockage -Couche applications - Couche gestion

L!’architecture

API Publiques DSpace

API de stockage

Couche de Gestion

Couche de Stockage

Couche Applications11: CNRI Handle server 22. OAI Metadata ProvidingService

33. Search(Lucerne wrapper)

4

4. Handle Manager

5

5. Workflow Manager

6

6. E-people / Group Manager

77. Bitstream Storage Manager

88. PostgreSQL

Couche stockage

q Système de Gestion de Base de DonnéesRelationnelle --> PostgresQL

l informations concernant l’organisationl métadonnéesl annuaire des e-peoplesl maintenance et sauvegardes

q Stockage des `BitStreams`l API --> Stockage dans un système de fichiersl identificateur interne (38 digits)l checksum

Couche applications

q Interface Web de l!’utilisateurl Java Servlet et Java Server Page --> Tomcatl browser de l!’utilisateurl administration de la plate-formel requêtes HTTP sécurisées

q Récolte des métadonnéesl conforme à l!’Open Archive Initiative Protocol for

Metadata Harvesting (OAI-PMH) version 2.0

q Module d’Importation et d’Exportationl outils utilisant le format d’archive DSpace

Couche gestion

q API gestion du contenul Création des instances des objetsl Manipulation des métadonnéesl Contrôle des processus d’éditionl Cohérence des contenus en mémoire

q Outils d’administrationq Gestionnaire des `E-peoples`q Module d’authentification et de sécurité

Pour finir !

Des utilisateurs - Évolutions - Adresses utiles

Quelques utilisateursq MITq Columbia Universityq Cornell Universityq Massachusetts Institute of Technologyq Ohio State Universityq University of Rochesterq University of Washingtonq University of Toronto (can)q Cambridge University (uk)q Erasmus University Rotterdam (nl)q European University Institute (it)q MSH-Alpes (fr)

Nombre de téléchargements au 26/09/2003 : 5,753

Evolutions

q Version 1.2 attendueu Sous-communautésu Administrateurs de communautés / collectionsu Import/Export d'Items avec les métadonnées METSu Identifiant pour Bitstreamu Indexation et recherche plein texte, etc.

q Traduction française en coursu Msh-Alpes

Les Adressesq Sites Web

u Dspace : http://www.dspace.orgu FAQ : http://dspace.org/faqs/dspace.htmlu Dspace : An Open Source Dynamic Digital Repository

(janvier 2003) Dlib Magazine [Article]http://www.dlib.org/dlib/january03/smith/01smith.html

u OAICat :http://www.oclc.org/research/software/oai/cat.htm

u Jakarta Lucene : http://jakarta.apache.org/luceneu Library Application Profile :

http://www.dublincore.org/documents/2001/08/08/library-application-profile/

qListe de discussionu Dspace-tech :

http://lists.sourceforge.net/lists/listinfo/dspace-tech

Et maintenant

…Une petite démonstration ?