Dspace Un Système d’Archivage d’Objets Numériques
Les Archives OuvertesJournées Isidora du 9 & 10 Octobre 2003
Laurence Raphaël & Gerard Clabault (Msh-Alpes)
Introduction
q Les initiateurs du projetu MIT & HP Labs
q Fédération Dspaceu Développement et interopérabilité de Dspace
q Technologieu Java, Tomcat, XML --> services Web
q Statut du logicielu Distribué sous licence ’open source BSD’
q Conformité OAIu OAI-PMH Version 2.0
Les objectifs
q Système d’archivage d’objets numériquesu gestion, distribution et préservation d’objets numériques
q Base de données des métadonnées associéesu création, indexation, recherche…
q Plateforme de production et de distribution depublications électroniquesu gère les étapes du processus d’éditionu met ‘en ligne’ les documents
Le modèle DSpace
Ecoles
Facultés
U.F.R.
Laboratoires
Programmes
Stockage
Métadonnées (Database)
Recherche/Navigation
Interfaces Web
Proc
essu
s de
pub
licat
ion
Système DSpace
Laboratoires
Ecoles Facultés
U.F.R.
Collection
ItemsItemsItems…
COMMUNAUTES
Uti
lisat
eurs
Les aspects fonctionnels
Modèle de données - Métadonnées -E-peoples & Groupes - Autorisation -
Alimentation de l’entrepôt - Workflow -Identifiants permanents - Recherche -
Interfaces Web
Le modèle de données
Système organisationnel
Communauté
Fichier Dublin Core
Format Bitstream
Item
Bundle
Collection
Bitstream
q Les types d’objets numériquesu Accepte tous types de documents
l Articles (Préprints, e-prints) ; Rapports techniques ;Communications de congrès ; Ouvrages ; Thèses ;Programmes informatiques ; Audio ; Vidéo ; Images ;Cours...
q Les statuts de Bitstreamsu 3 niveaux de préservation à déterminer
l Supportedl Known
l Unsupported
Le modèle de données (2)
q Métadonnées Dublin Core qualifiéesu Basées sur!!’Library Application Profile’ (LAP)
l Saisies lors de la soumission / Générées automatiquementpar le système / Gérées par l!’administrateur
l Valeurs par défaut ou listes de valeurs possiblesdéfinissables pour chaque collection
l Métadonnées descriptives, ‘administratives’, ‘structurelles’
q Autres métadonnéesu Bitstreams associés à l!’Item
Les métadonnées
q E-peoplesu Inscription, Soumission, Édition
l Adresse mail, Nom, Mot de passe, Certificat, Adresse IP...
u Constitution de groupes de e-peoplesl Soumissionl Édition
q Groupesu Définition des autorisations par communautés
l Qui peut : éditer la page d!’accueil, créer des collections,soumettre dans 1 collection, etc.
E-peoples et groupes
q Associer des actions à des objets et à des listesde personnes pouvant les effectuer
q Sur e-peoples ou sur groupes de e-peoplesu Read : lectureu Write : écritureu Add : Ajoutu Remove : Suppressionu Default_Item_Read : lecture de l!’itemu Default_Bitstream_Read : lecture du Bitstream
Les autorisations
q Procédure automatisée (batch)u Métadonnées XML + fichiers
q Soumissionu Dépôt via une interface webu Dans une ou plusieurs collectionsu Possibilité de corrections, d’arrêt et reprise de
la soumission, d’annulationu Vérification de l’intégrité des fichiersu Accusé de réception par mail sur l’état de la
soumission
Alimentation de l’entrepôt
q Gestion du workflowu Processus d’édition propre aux collectionsu Attribution des tâches par alertes e-mailu Intervention via une interface web
q Les étapes d’édition & les actionsu 1 - Acceptation ou rejet de la soumissionu 2 - Édition des métadonnées - Acceptation ou rejet de la
soumissionu 3 - Édition des métadonnées - Transmission pour
stockage et mise en ligne
Le workflow
Les identifiants permanents
q Identifiant unique et permanentu Pour les items, collections et communautésu Faire face au temps
l arrêt, reconfiguration, évolution du service, etc.l Point de référence stable (citations)
q Utilise le système Handle (CNRI)u Résolution de noms :
l <Handle>::=<Handle Naming Authority> ”/” <Handle LocalName>
l http://hdl.handle.net/1801/23 OU hdl: 1801/23
q Utilisation d’un autre système
La recherche
qMoteur de recherche : Lucene Jakartau Recherche par champs
l Auteurs, Titre, Date, Mots-clés, Identifiant,etc.l Dans tout Dspace ou dans une communauté
u Fonctionnalitésl Opérateurs booléens, parenthésage, troncature droite,
masque de caractère, lemmatisation, recherched!’expression, mots vides
q Parcouriru Auteurs, Titre, Dateu Tout Dspace, par Communauté, par Collection
q 3 interfacesu Lecteur (end-user : identifié / anonyme)u Contributeur (soumission, workflow)u Administrateur
q My Dspaceu Abonnementsu Items soumisu Items en cours de soumissionu Tâches à accomplir
Les interfaces web
Aspects informatiques
Architecture - Couche stockage -Couche applications - Couche gestion
L!’architecture
API Publiques DSpace
API de stockage
Couche de Gestion
Couche de Stockage
Couche Applications11: CNRI Handle server 22. OAI Metadata ProvidingService
33. Search(Lucerne wrapper)
4
4. Handle Manager
5
5. Workflow Manager
6
6. E-people / Group Manager
77. Bitstream Storage Manager
88. PostgreSQL
Couche stockage
q Système de Gestion de Base de DonnéesRelationnelle --> PostgresQL
l informations concernant l’organisationl métadonnéesl annuaire des e-peoplesl maintenance et sauvegardes
q Stockage des `BitStreams`l API --> Stockage dans un système de fichiersl identificateur interne (38 digits)l checksum
Couche applications
q Interface Web de l!’utilisateurl Java Servlet et Java Server Page --> Tomcatl browser de l!’utilisateurl administration de la plate-formel requêtes HTTP sécurisées
q Récolte des métadonnéesl conforme à l!’Open Archive Initiative Protocol for
Metadata Harvesting (OAI-PMH) version 2.0
q Module d’Importation et d’Exportationl outils utilisant le format d’archive DSpace
Couche gestion
q API gestion du contenul Création des instances des objetsl Manipulation des métadonnéesl Contrôle des processus d’éditionl Cohérence des contenus en mémoire
q Outils d’administrationq Gestionnaire des `E-peoples`q Module d’authentification et de sécurité
Pour finir !
Des utilisateurs - Évolutions - Adresses utiles
Quelques utilisateursq MITq Columbia Universityq Cornell Universityq Massachusetts Institute of Technologyq Ohio State Universityq University of Rochesterq University of Washingtonq University of Toronto (can)q Cambridge University (uk)q Erasmus University Rotterdam (nl)q European University Institute (it)q MSH-Alpes (fr)
Nombre de téléchargements au 26/09/2003 : 5,753
Evolutions
q Version 1.2 attendueu Sous-communautésu Administrateurs de communautés / collectionsu Import/Export d'Items avec les métadonnées METSu Identifiant pour Bitstreamu Indexation et recherche plein texte, etc.
q Traduction française en coursu Msh-Alpes
Les Adressesq Sites Web
u Dspace : http://www.dspace.orgu FAQ : http://dspace.org/faqs/dspace.htmlu Dspace : An Open Source Dynamic Digital Repository
(janvier 2003) Dlib Magazine [Article]http://www.dlib.org/dlib/january03/smith/01smith.html
u OAICat :http://www.oclc.org/research/software/oai/cat.htm
u Jakarta Lucene : http://jakarta.apache.org/luceneu Library Application Profile :
http://www.dublincore.org/documents/2001/08/08/library-application-profile/
qListe de discussionu Dspace-tech :
http://lists.sourceforge.net/lists/listinfo/dspace-tech
Et maintenant
…Une petite démonstration ?