+ All Categories
Home > Documents > HumanitéDigitMaghreb : rapport scientifique

HumanitéDigitMaghreb : rapport scientifique

Date post: 20-Jan-2023
Category:
Upload: u-bordeaux3
View: 0 times
Download: 0 times
Share this document with a friend
85
Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique HumanitéDigitMaghreb 2012-2013 Juin 2013 Mokhtar BEN HENDA Coordinateur du projet Rapport scientifique
Transcript

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

HumanitéDigitMaghreb

2012-2013

Juin 2013

Mokhtar BEN HENDA Coordinateur du projet

Rapport scientifique

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

Fiche signalétique du projet Titre HumanitésDigitMaghreb

Ordonnateur ISCC/CNRS

Durée Juin 2012 - Juin 2013

Structure d’accueil Laboratoire MICA-EA 4426, Université Michel de

Montaigne Bordeaux3

Coordinateur Mokhtar BEN HENDA

Contact +33.660143387 / [email protected]

Nombre de partenaires institutionnels

16

Nombre de partenaires individuels

19

Nombre de pays membres

05

Synopsis Recherche-action sur l’appropriation collégiale de réalisation et d’analyse pluridisciplinaire de corpus multilingues euro-méditerranéens conformes aux bonnes pratiques des Humanités digitales et de la TEI

Mots clés Humanités digitales ; Text Encoding Initiative (TEI), bibliothèques numériques ; normalisation

Objectif Conception de modèles de structures de documents numériques multilingues en SHS par les spécifications des TEI Guidelines P5

Site web http://www.hudima.org/

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

1

Table des matières 1. CADRE GÉNÉRAL ................................................................................................................. 3 2. LE PROJET HUMANITÉDIGITMAGHREB .............................................................................. 3

2.1. ÉTUDE ÉPISTÉMOLOGIQUE DU PROJET ................................................................................... 4

2.1.1. Marquer le périmètre multilingue du projet ........................................................ 4 2.1.2. Poser des vraies questions de recherche .............................................................. 5 2.1.3. Définir un périmètre de réflexion ......................................................................... 6 2.1.4. Tracer une méthodologie de travail ..................................................................... 7 2.1.5. Évaluer les résultats .............................................................................................. 8

2.2. APPROPRIATION DES HUMANITÉS DIGITALES DANS LE CONTEXTE MAGHRÉBIN ................................ 9

3. COMPOSITION DE L’ÉQUIPE ............................................................................................. 10

3.1. LA MULTIDISCIPLINARITÉ DES PROFILS DANS LE PROJET ............................................................ 11 3.2. UNE DIMENSION INTERNATIONALE : PARTENARIAT FRANCO-MAGHRÉBIN .................................... 14

4. MÉTHODOLOGIE DE MISE EN ŒUVRE ............................................................................. 16

5. PLANIFICATION ................................................................................................................. 17 5.1. PREMIÈRE PHASE : APPROPRIATION (SEPTEMBRE 2012 – DÉCEMBRE 2012) .............................. 17

5.2. DEUXIÈME PHASE : DÉVELOPPEMENT/PRODUCTION (JANVIER 2013 – AVRIL 2013) ..................... 17 5.3. TROISIÈME PHASE : ÉVALUATION (AVRIL 2013 – JUIN 2013) .................................................. 18

6. IDENTIFICATION DES PROFILS .......................................................................................... 18

6.1. DES SPÉCIALISTES EN SHS POUR LA STRUCTURATION LOGIQUE DES MODÈLES DE DOCUMENTS

NUMÉRIQUES ............................................................................................................................ 19 6.2. DES INFORMATICIENS POUR INSTALLER ET PARAMÉTRER L’ENVIRONNEMENT TECHNOLOGIQUE DES

APPLICATIONS INFORMATIQUES DU PROJET ..................................................................................... 19

6.3. DES DOCUMENTALISTES POUR RÉFÉRENCER LES DOCUMENTS TEI ET GÉRER LES COLLECTIONS DU

CORPUS NUMÉRIQUE .................................................................................................................. 20 7. RÉPARTITION DES TÂCHES ............................................................................................... 20

7.1. ENSEMBLE 1 : COORDINATION, ANALYSE FONCTIONNELLE ET PILOTAGE DU PROJET ...................... 20 7.2. ENSEMBLE 2 : ORIENTATIONS SCIENTIFIQUES ET CONTRÔLE ÉPISTÉMOLOGIQUE ........................... 21

7.3. ENSEMBLE 3 : CONTRÔLE PÉDAGOGIQUE ET ÉVALUATION ....................................................... 21 7.4. ENSEMBLE 4 : CONTRÔLE TECHNIQUE ET RÉSEAUTIQUE .......................................................... 22 7.5. ENSEMBLE 5 : DÉVELOPPEMENT DE CORPUS ET CONTRÔLE RÉDACTIONNEL ................................. 22

7.6. ENSEMBLE 6 : FORMATION ............................................................................................... 23

8. REGROUPEMENTS ET ACTIVITÉS CONNEXES ................................................................... 24 8.1. LES REGROUPEMENTS PROGRAMMÉS DU PROJET ................................................................... 24

8.1.1. Premier regroupement : septembre 2012 – mise en route ................................ 24

8.1.2. Deuxième regroupement : décembre 2012 – recadrage des activités ............... 24 8.1.3. Troisième regroupement : février 2013 - formation .......................................... 25

8.1.4. Quatrième regroupement : février 2013 - formation ......................................... 26

8.1.5. Cinquième regroupement : février 2013 - formation ......................................... 27

8.1.6. Sixième regroupement : avril 2013 - évaluation ................................................ 27

8.2. LES ACTIVITÉS CONNEXES, EXTERNES AU PROJET .................................................................... 28 8.2.1. Un regroupement d’appropriation des outils numériques : 09 février 2013 ..... 28 8.2.2. Un stage d’initiation à l’encodage XML/TEI des textes patrimoniaux (imprimés et manuscrits). Université François Rabelais, Tours : 23-30 janvier 2013........................ 29 8.2.3. Un stage d’initiation à l’encodage MEI des textes patrimoniaux (imprimés et manuscrits). Université François Rabelais, Tours : 23-30 janvier 2013 ............................ 29

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

2

8.2.4. Séminaire « technologies numériques dans l’art et les sciences humaine, Gabès, Tunisie : mars 2013........................................................................................................... 30 8.2.5. The Music Encoding Conference 2013. Mayence, Allemagne ............................ 31

8.2.6. 2éme rencontre internationale : « La linguistique du corpus : recueil, annotation, exploitation et diffusion », Tizi-Ouzou, Algérie : juin 2013........................... 31

8.2.7. TEI Conference and members meeting, Rome : octobre 2013 ........................... 32

9. DESCRIPTION TECHNIQUE DU PROJET ............................................................................. 33

9.1. TEI ET DOCUMENTS STRUCTURÉS ....................................................................................... 33

9.1.1. Structure physique Vs structure logique............................................................. 33 9.1.2. Les schémas de structuration de la TEI P5 ......................................................... 35

9.2. MONTAGE TECHNIQUE DU PROJET HUMANITÉDIGITMAGHREB ................................................ 36

9.2.1. <oXygen/>, outil de production des ressources numériques normalisé TEI ....... 36 9.2.2. Omeka : un CMS open source ............................................................................. 40

9.2.3. L’organisation des ressources produites sur Omeka .......................................... 42

10. Perspectives................................................................................................................... 48 11. LES ANNEXES .................................................................................................................... i

11.1. ANNEXE 1 : LISTE DÉFINITIVE DES MEMBRES DE L’ÉQUIPE ....................................................... i 11.2. ANNEXE 2 : EXTRAITS DE RESSOURCES PRODUITES PAR L’ÉQUIPE DU PROJET .............................. v

11.3. ANNEXE 3 : PRODUCTIVITÉ CONNEXE AU PROJET .............................................................. xvi 11.4. ANNEXE 4 : GLOSSAIRE DES HUMANITÉS DIGITALES ........................................................ xxiii 11.5. ANNEXE 5 : ACRONYMES DES HUMANITÉS DIGITALES .................................................... xxviii 11.6. ANNEXE 6 : CARTOGRAPHIE DES HUMANITÉS DIGITALES .................................................. xxix

11.7. ANNEXE 7 : BIBLIOGRAPHIE SÉLECTIVE DES HUMANITÉS DIGITALES ...................................... xxx

11.8. ANNEXE 8 : URLS INSTITUTIONNELS UTILES .................................................................. xxxii 11.9. ANNEXE 9 : PROJETS EN HUMANITÉS DIGITALES UTILISANT LA TEI .................................... xxxiii

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

3

1. CADRE GÉNÉRAL Les Humanités peinent encore à emboîter le pas des disciplines des sciences expérimentales et sciences exactes qui se sont organisées depuis longtemps en collégialités numériques, dynamiques et participatives. Les Lettres, les Arts et les Sciences humaines et sociales ont pourtant déjà entrepris des projets encyclopédiques de numérisation comme les archives ouvertes ou les bibliothèques numériques. Cependant, elles sont trop souvent traitées, indexées, référencées et répertoriées dans des collections, des fonds et des corpus numériques sur la base de leurs architectures matérielles et numériques beaucoup plus que leurs structurations sémantiques et intellectuelles. Or, dans l'interdisciplinarité convergente qui se généralise aujourd'hui autour de la sémantique des réseaux, beaucoup de nouvelles initiatives ont contribué à faire des SHS un champ disciplinaire ouvert aux pratiques innovantes, normatives et convergentes. Le concept des Humanités digitales, relativement récent en Europe non anglophone, est un vieux concept introduit depuis les années 1980. Les Humanités digitale ont pour ambition de transformer radicalement les habitus de recherche en Arts lettres et sciences sociales en installant une collégialité numérique interdisciplinaire mais surtout une interopérabilité coopérative entre les chercheurs. Cela a été rendu possible grâce aux initiatives d’institutions et de chercheurs qui agissent en consortium fédérant des collèges disciplinaires1. Des projets ont été montés, des publications théorisant ces nouvelles méthodes ont été produites, des outils pour la recherche-action ont été conçus et déployés et des normes de très hauts niveaux ont été définies et mises en place. A l’échelle internationale, les Humanités digitales sont désormais organisées autour de communautés de pratiques très mobilisées et bien structurées. Mais le concept n'est entré en France que très récemment. Il est repris par des chercheurs et des universitaires en SHS dans la perspective d'en faire un axe mobilisateur autour d'une nouvelle culture du numérique et des processus de transformation des habitus académiques confrontés aux nouveaux paradigmes technologiques. C’est précisément dans cet esprit que l’équipe du projet HumanitéDigitMaghreb a répondu à l’appel à projet de l’ISCC/CNRS de 2012 afin de se constituer en groupe de travail transdisciplinaire, international et multilingue et de conduire un travail à la fois épistémologique et expérimental autour des corpus numériques en SHS dans le contexte multiculturel et multidisciplinaire euro-méditerranéen. 2. LE PROJET HUMANITÉDIGITMAGHREB

Le projet HumanitéDigitMaghreb a des vocations multiples. C’est d’abord un cadre pour que se développe et s’amplifie une épistémologie comparative des SHS. C’est aussi un projet prévu comme contribution au renforcement du potentiel d’appropriation culturelle raisonnée du patrimoine littéraire, artistique et des SHS dans les pays du Sud, notamment au Maghreb. Il pourrait même s’élargir à d’autres extensions méditerranéennes éventuelles. C’est aussi un environnement de recherche-action dans le domaine des Humanités digitales pour la conception de mécanismes permettant d’analyser, voire de mettre à disposition un 1 Au début prioritairement les études littéraires (poésie, théâtre, prose), l’étude des manuscrits et la linguistique (notamment corpus oraux)

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

4

héritage culturel et scientifique par les technologies numériques. Il y a donc bien une synergie cohérente dans le choix du thème du projet, définie d’abord à partir d’une facette épistémologique, puis d’une facette d’appropriation des Humanités digitales dans le contexte maghrébin, et enfin d’une facette de recherche-action pour la création d’amorces de corpus, de mise en place d’équipes et de création d’un consortium HumanitéDigitMaghreb avec une problématisation, une méthodologie d’action et une évaluation des résultats qui commence dès cette période de fin du projet à générer d’autres projets en devenir que nous aimerions plus ambitieux.

2.1. ÉTUDE ÉPISTÉMOLOGIQUE DU PROJET Le mobile scientifique premier qui nous a réunis autour de ce projet est d’abord la mise en œuvre d’un cadre conceptuel de recherche dans lequel nous étions amenés à conduire des observations et des études des stratégies d'appropriation par les acteurs, de potentiels d'usage des Humanités Digitales dans le contexte académique franco-maghrébin. Plusieurs opérations ont été nécessaires. 2.1.1. Marquer le périmètre multilingue du projet

Nous sommes partis du constat que depuis des siècles, la région du Maghreb connait une hybridation linguistique importante qui impacte lentement sur son patrimoine culturel. Au-delà des strates libyques, latines, ottomanes, se sont accumulées des quantités non négligeables de ressources dans plusieurs cultures linguistiques dérivées de l’arabe classique (dialectes régionaux), ou dans divers dialectes berbères (kabyle par exemple). Plusieurs ressources sont même composées simultanément en plusieurs langues d’usage courant ou réservé (arabe littéraire, arabe dialectal, français, anglais, berbère) comme les journaux, l’imprimerie de ville, les supports publicitaires, la littérature populaire, les contes, les manuels d’apprentissage des langues parlées, etc. Ces documents sont souvent écrits dans une graphie hybride combinant à la fois l’arabe classique et vernaculaire, ou des formes de translittération latin-arabe, arabe-latin, berbère-latin, berbère-arabe voire aussi en tifinagh (écriture berbère traditionnelle). Pour la langue arabe, contrairement à beaucoup de ressources textuelles classiques (documents conventionnels imprimés et manuscrits médiévaux), il n’existe pas aujourd’hui de vaste corpus de textes en dialectes locaux. La langue arabe peut s’écrire pourtant en caractères arabes (accentués ou non) mais aussi se translitérer en écriture latine. Les langues berbères connaissent aussi depuis longtemps la même situation plurielle : translittération de textes berbères en écriture arabe depuis plusieurs siècles (notamment au M’Zab) ; translitération latine depuis le milieu du 19e Siècle ; écriture traditionnelle en écriture tifinagh qui existe dans des traces pétrographiques libyques et d’inscription rupestres sahariennes, mais qui est resté une culture écrite vivante chez les Touaregs2 et qui a été revivifiée de façon récente (notamment au Maroc) avec une forte dynamique parallèle de culture berbère numérique (notamment un effort important d’enseignement à distance qui permet au population de langue maternelle berbère de s’approprier leur langue à l’écrit).

2 Avec, fait notable, une transmission traditionnelle de l’écriture prise en charge par les femmes dans ces sociétés matriarcales.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

5

Par contre, nous n’avons pas encore repéré des corpus numériques significatifs dans d’autres écritures que les transcriptions berbères en tifinagh. Les langues berbères ont plus intéressé les ethnolinguistes (mais aussi les militaires et les missionnaires) comme un enjeu scientifique, stratégique (les Berbères campagnards et rebelles à la colonisation) et missionnaire. De ce fait, aux 19e et 20e siècles, ont été accumulés des corpus ethnolinguistiques berbère translittérés en écriture latine aménagée, une forme d’écriture largement répandue chez les intellectuels berbères (proposée au Bac berbère en France par exemple, et dans de nombreuses revues savantes étudiant aussi les sources libyques). Ces corpus berbères en écriture latine, comme d’ailleurs les Annales du Baccalauréat français dans les langues berbères (plusieurs sous options correspondant aux différentes langues berbères) constituent autant d’opportunités de ressources linguistiques qui constituent d’ailleurs l’objectif du Projet de la BNFB3 auquel HumanitéDigitMaghreb s’est associé. Notre hypothèse est que la découverte progressive de cette diversité des ressources aurait pour effet d’augmenter de façon exponentielle et dans un proche avenir le nombre de chercheurs susceptibles de s’intéresser au recueil des fonds anciens classiques et des corpus oraux et à l’étude de ces littératures plurielles. Le format de codage standard que constitue la TEI, présente une opportunité unique, celle de créer ces ressources en garantissant leur intégration dans le patrimoine culturel mondial et leur réutilisabilité avec une flexibilité technique maximale. Le projet « HumanitéDigitMaghreb » a pour objet d’étudier la faisabilité et l’appropriation de méthodes permettant de répondre à plusieurs aspects de ces hypothèses de recherche. 2.1.2. Poser d’importantes questions de recherche

Le projet cible à la fois les corpus oraux mais aussi les riches ressources écrites dans la région du Maghreb. Il se focalise notamment sur la permanence pendant plus de 12 siècles d’un arabe classique aujourd’hui encore vivant et sur l’extrême hybridation des langues vernaculaires entretenues par la richesse des sources libyques, romaines, hébraïques, ottomanes auxquelles s’ajoutent encore les ressources françaises, espagnoles et italiennes. Bref, le Maghreb est un lieu d’études textuelles extrêmement foisonnant et très inexploité. Ce projet nous permet des visions comparées qui permettent de comprendre comment transformer la TEI, conçue à l’origine pour les langues européennes modernes et classiques (latin, langues médiévales, etc...), pour travailler sur les corpus en arabe littéraire, en berbère ou en langues et écritures hybrides. Par exemple, comment des chercheurs du Maghreb qui s’investissent dans l’étude de la métrique française et en comprennent complètement le balisage TEI, peuvent ensuite comprendre la subtilité du balisage métrique berbère ou arabe ? Comment développent-ils en langues locales des exemples de balisage et donner, quand c’est possible, des équivalents terminologiques de la description métrique anglaise ou française ? Comment peuvent-ils voir s’il y a réellement des concepts structurels « spécifiquement » locaux et proposer alors les balises appropriées ? Ces questions fournissent de véritables cas d’études rendus d’autant plus intéressants par deux types de facteurs :

3 Bibliothèque Numérique franco-Berbère, projet financé par l’OIF

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

6

(a) la diversité des ressources :

- des études de littératures qu’elles soient classiques ou contemporaines, écrites ou orales, poétiques, théâtrales, contes, romans (en arabe, français ou berbère) ;

- des études linguistiques notamment les corpus oraux ; - des études de manuscrits anciens ou contemporains (en toutes langues :

arabe et français, voire espagnol, napolitain), les manuscrits d’auteurs littéraires contemporains ou classiques (on pense par exemple à Flaubert pour Salammbô mais aussi à des romanciers maghrébins actuels écrivant en français ou en arabe ou les deux à la fois) ;

- des études lexicographiques et terminologiques ; - des études musicales ou ethnomusicales ; - des études d’Arts.

(b) La palette des modèles applicatifs de la TEI, inter-compatibles collégialement dans

un méta-modèle cohérent des TEI Guidelines et qui peuvent répondre de façon rigoureuse à cette diversité de ressources : TEIverse, TEIperformance texts, TEIdictionary, TEImanuscripts description, TEI apparatus, TEI/MEI etc. (cf. 9.1.2 ci-dessous).

Nous n’ignorons pas bien sûr que des recherches similaires sont entreprises dans d’autres langues et cultures : coréen, chinois, japonais... ; des expériences d’adaptation et d’appropriation de la TEI qui nous serons éminemment utiles. 2.1.3. Définir un périmètre de réflexion

Or, l’usage de la TEI dans le Maghreb et le Moyen-Orient est encore timide et disparate. Il est essentiellement concentré sur l’étude des manuscrits et des livres rares. Cette focalisation s’expliquerait d’abord par l’existence de grandes collections de manuscrits orientaux dans les fonds numériques occidentaux qui pratiquent depuis longtemps l’encodage TEI. Elle s’explique ensuite par l’urgence ressentie au sein d’instances culturelles maghrébines pour accélérer la préservation d’un patrimoine culturel en risque de délabrement. La TEI P5 a de ce fait relativement profité d’éclairages apportés par des expériences et projets d’encodage de manuscrits et de ressources locales. Cependant, pour élargir son périmètre d’action, il lui manquerait des pans entiers de données d’autres natures propres à d’autres types de ressources et à d’autres formes de complexités (notamment linguistiques et structurelles) du patrimoine culturel maghrébin. Les questions qui nous mobilisent ici s’attarderont peu sur la légitimité de la pertinence de la digitalisation des sciences humaines et des études littéraires et linguistiques en général (largement étudiées depuis quelques années), mais nous nous focalisons plutôt sur des hypothèses plus spécifiques : comprendre en quoi la complexité de ce patrimoine culturel relève de tel ou tel modèle applicatif de la TEI ? À l’inverse, en quoi cette diversité d’étude de patrimoines maghrébins serait en situation d’élargir les domaines d’études de la communauté TEI et de participer à la vocation d’universalité implicite pour les Humanités et a fortiori pour les Humanités digitales confrontées au défi de la globalisation numérique des Sciences et de la Culture ?

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

7

2.1.4. Tracer une méthodologie de travail

Dans le projet « HumanitéDigitMaghreb » nous nous sommes focalisés particulièrement sur les méthodes de mise en œuvre de la TEI pour traiter des cas spécifiques de la structuration de corpus multilingues. Nous donnerons quelques résultats de nos travaux dans la suite de ce rapport, mais nous examinerons surtout les enjeux concrets et prospectifs de très grands corpus linguistiquement structurés de façon normative qui permettront de constituer pour toute communauté linguistique (et pour ce qui nous concerne le monde maghrébin) le référentiel de contexte indispensable pour interagir avec les outils de traductique et d’e-sémantique du futur. Sur ce dernier point, tant pour les corpus écrits que pour les corpus oraux (versus sonore ou versus transcription), il est indispensable que la communauté des chercheurs arabes et berbères se mobilisent pour parvenir sans retard à doter ces langues de leur modernité digitale. Pour y parvenir, trois stades sont à franchir : 1. Un premier stade - au-delà des limites de notre projet « HumanitéDigitMaghreb » - passe inéluctablement par un travail d’analyse linguistique et socioculturel du contexte maghrébin pour définir comment la TEI, dans ses versions actuelles et futures, permettrait d’encoder le patrimoine culturel arabe et berbère, de dépasser le seul niveau de son catalogage par les normes en vigueur (MARC, ISBD, AACR2, Dublin Core) et surtout de normaliser les différentes approches de sa lecture savante. Dans son évolution constante, et le besoin de renforcer sa facette d’internationalisation, la communauté TEI s’enrichirait sans doute de ces spécificités culturelles et linguistiques, ce qui exigerait bien sûr que cette même communauté s’organise pour proposer des formats de codage standard adéquats pour représenter un large éventail de données textuelles linguistiquement hétérogènes. Nous pouvons imaginer ici par exemple les besoins d'encoder des textes électroniques en dialectes arabes profondément parsemés d’incises translittérées ou en caractères différents. Ces textes sont potentiellement très complexes. En plus de relier très souvent ce matériel à d'autres, éventuellement des données parallèles (bilinguisme fréquent), ils constituent d’autres niveaux de complexité inhérents à l'utilisation de jeux de caractères et de systèmes multiples de transcription non standard (différents de l’Alphabet Phonétique International) ainsi qu’à la nécessité de tenir compte de la transcription de la parole dans une société primordialement orale, ce qui pose des problèmes d’enregistrement, de transcription et d'encodage souvent réalisés avec des méthodologies et des outils numériques disparates mais pour lesquels la TEI propose un niveau d’interopérabilité parfaitement opératoire. 2. Le deuxième stade, inscrit quant à lui dans les priorités directes de nos actions, consiste à produire des référentiels normatifs de la TEI dans les langues locales et les faire valoir auprès des communautés académiques et professionnelles. Ces référentiels aideraient à traiter des cas de complexité spécifiques comme l’hybridation linguistique (dialectes locaux) des ressources numériques et la conservation d’une richesse culturelle orale et artistique millénaire. À ce titre, le problème des jeux de caractères n'est pas sans conséquence pour représenter les dialectes locaux, en grande partie parce que beaucoup de leurs aspects culturels n'ont pas été pris en compte dans l'élaboration de normes existantes (transcription des chiffres et des symboles, certaines formes de ligatures, diplomatique et alphabets anciens). Il existe, par exemple, de nombreuses propriétés de la langue arabe ou berbère,

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

8

comme les propriétés tonales, la synonymie régionale et la voyellation classique (écriture notariale) qui exigent des traitements spéciaux. Les normes en vigueur, en particulier la norme Unicode et encore moins les normes ISO 8859, ne tiennent pas compte de nombreux de ces aspects. Pour ce qui est des codes de langues, les référentiels de codification ISO sont suffisamment efficaces à condition de ne pas se contenter des niveaux de codification globale mais d’accepter que toutes les ressources soient codées en tenant comptes des codes de dialecte et de parler, de coder de façon distincte écriture et langue, de codifier des niveaux de langue ancienne, de prévoir des vocabulaires de codification pour enregistrer des « mains d’écritures manuscrites » comme cela est possible dans « TEImanuscrit ». 3. Le troisième stade - dans lequel nous sommes aussi engagés - est la création d’une communauté de pratique spécialisée dans le traitement des ressources spécifiques. Notons que la plupart de ces ressources sont potentiellement complexes et certaines de leurs caractéristiques nécessitent sans doute des modalités de balisage spécifiques. Cela signifie qu’un environnement dynamique est nécessaire pour la spécification de l'encodage de ces documents - un environnement dans lequel il est simple d’encoder des structures simples, mais dont les structures plus complexes peuvent aussi être encodées. Par conséquent, il est important d'avoir des spécifications qui peuvent être facilement étendues dès lors que de nouvelles fonctions intéressantes sont identifiées. Ce qui nous intéresse dans la TEI c’est précisément sa dynamique collégiale ouverte sur la diversité linguistique non européenne (Japon, Chine, Corée), son éclectisme des disciplines de recherche (littérature, manuscrit, corpus oraux, recherche en art, linguistique…), mais aussi sa rigueur pour maintenir, enrichir et documenter des directives ouverts sur la diversité mais à même d’assurer une interopérabilité de toutes les ressources produites. 2.1.5. Évaluer les résultats

Les résultats de nos travaux sont reflétés à travers un site qui recense une collection d’échantillons de ressources encodés en TEI dans des domaines comme la musique, la poétique arabe, les contes et les corpus oraux kabyles. Pour y parvenir, nous avons eu une première phase assez rapide d’appropriation de la TEI. La deuxième phase (faisant suite au projet actuel stricto sensu) serait l’appropriation de la TEI par une communauté d’utilisateurs maghrébins plus large incluant dans les faits, des dizaines de thésards mais surtout pouvoir s’associer des savants de ces domaines non encore persuadés aujourd’hui de l’intérêt d’une TEI maghrébine. Il s’agit par exemple des spécialistes de la poétique arabe, des spécialistes de la linguistique berbère, des musicologues, des spécialistes du conte… Pour y parvenir, la traduction en français et en arabe de la TEI P5, mais aussi le développement d’exemples et la mise en chantier d’une terminologie ou d’un glossaire TEI multilingue anglais/français/arabe/berbère nous paraît nécessaire. Nous pensons aussi ouvrir des perspectives de recherche-action au sein de nouvelles communautés agissant sur le plan national et régional en synergie totale avec la dynamique internationale de la TEI. Nous l’avons déjà concrétisé par notre engagement dans un projet ayant pour objectif la production de ressources numériques franco-berbères, le projet de la Bibliothèque Numérique Franco-Berbère à financement francophone et un partenariat franco-maghrébin. Nous pensons aussi élargir les liens académiques en direction du Liban.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

9

Bref, en nous inscrivant dans l’école de pensée des Humanités digitales et de la TEI, nous voulons explicitement donner non seulement une réalité tangible et numérique à nos travaux mais les rendre facilement échangeables, cumulables, améliorables, modifiables partout dans le monde. Nous voulons aussi sur un plan plus spécifique que nos travaux soient déjà facilement échangeables et cumulables entre nous et avec nos trois langues partenaires maghrébines (arabe, français, berbère) auxquelles il conviendrait de rajouter d’abord l’anglais, mais aussi l’espagnol, l’italien et d’autres langues modernes ou anciennes. Il est évident que, hormis les questions sur les enjeux émergents du traitement et de la mise en patrimoine numérique, normalisé et interopérable, nous avons également cherché à comprendre comment ces enjeux peuvent bénéficier d'une appropriation concrète de la TEI par un panel académique, ou comment observe-t-on des résultats de parité « gagnant/gagnant » Nord-Sud méditerranéen pour apporter des similitudes d'enjeux entre un monde anglophone inventeur de la TEI et des Humanité Digitales, un monde francophone qui s'approprie cette nouvelle proposition – notamment en France et au Québec – puis un monde maghrébin qui s’engage dans une appropriation contextualisée pour des potentiels de déploiements futurs. Il était de ce fait, nécessaire d’assurer une méthode de suivi et d’évaluation en continu de l’avancement des différentes tâches et du rendu de délivrables répartis sur le déroulé du projet. 2.2. APPROPRIATION DES HUMANITÉS DIGITALES DANS LE CONTEXTE MAGHRÉBIN En termes d’appropriation des Humanités digitales, le projet HumanitéDigiMaghreb a permis de mettre en place une stratégie d’action à base d’outils informatiques, de procédures techniques, de méthodes d’organisation et surtout de référentiels normatifs connus. Il a été possible dès lors de mobiliser autour de cette stratégie d’action des partenaires français, maghrébins et canadiens animés par un objectif commun : produire des modèles de structures de documents numériques en sciences humaines et sociales en utilisant les normes internationales en vigueur, particulièrement la TEI (Text Encoding Initiative). Les spécificités techniques des outils et des logiciels déployés pour conduire le projet sont discutées plus en avant. C’est surtout le référentiel normatif que nous évoquons ici comme pilier fondamental sur lequel l’essentiel du projet a été défini. Il s’agit du choix de faire de la TEI l’instrument principal du projet pour structurer et baliser les ressources numériques traitées par les acteurs du projet. Voici quelques points de présentation des objectifs généraux de l’usage de la TEI dans le projet HumanitéDigitMaghreb. : 1. HumanitéDigitMaghreb vise à faciliter une appropriation de la TEI (Text Encoding

Initiative) entre différents partenaires francophones et plus précisément entre l’Europe francophone (notamment la France) et le Maghreb. Cela implique de fait une attention particulière au multilinguisme maghrébin franco-arabo-berbère ;

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

10

2. La TEI est une technique, tout autant qu’un des premiers réseaux numériques de collégialité bien avant les réseaux sociaux actuels. Cette facette de la collégialité collaborative et interdisciplinaire a été particulièrement mise en œuvre et observée durant le projet : il est important de créer des catégories fonctionnelles et disciplinaires de chercheurs et de définir leurs rôles et droits respectifs dans le réseau car c’est ce mécanisme de réseau qui définit le « relai » des tâches de prise en compte des documents sur leur chaîne de numérisation et de traitement savant ;

3. La TEI a été fondée et conçue par 3 communautés fermement décidées à œuvrer pour une approche conforme à la démarche des Humanités. Cette démarche implique donc avant tout une instrumentation numérique des démarches propres aux études et à la recherche littéraires, à la recherche et à l’histoire de l’Art, mais aussi à toutes les SHS (linguistique, sociologie, anthropologie, sciences politiques et économiques, archéologie, traductologie, terminologie, lexicographie, linguistique, muséographie, etc…), mais encore aux sciences et pratiques auxiliaires de l’ingénierie des documents (bibliothéconomie, documentation, ingénierie linguistique et traductique). Il était donc primordial de déterminer ces modèles de traitement spécifiques aux langues maghrébines des documents (poésie, conte, musique, corpus oraux, performance) et de les proposer dans une version de modélisation sommaire (draft) pour qu’ils soient améliorés plus tard par les partenaires du Sud dans leurs cadres professionnels et disciplinaires respectifs ;

4. Les travaux avec la TEI ont couvert des exemples multilingues franco-arabo-berbères. Ces éléments ont été discutés en profondeur pendant les regroupements de coordination du projet qui ont eu lieu en septembre et décembre 2012 puis en avril 2013. Ils seront discutés plus en avant dans ce rapport. Ils ont également permis de mener des actions hors cadre du projet HumanitéDigitMaghreb comme l’animation d’ateliers avec des universités du Sud (Gabès, Tunisie en mai 2013) ou la participation à des projets et des manifestations scientifiques portant sur les Humanités digitales : journée IHDB4 à Bordeaux en avril 2013 ; rencontre de la MEI (Musique Encoding Initiative) à Mayence en Allemagne ; colloque sur les corpus oraux à Tizi-Ouzou en Algérie ; colloque de la TEI à Rome en octobre 2013. 3. COMPOSITION DE L’ÉQUIPE L’équipe du projet était constituée d’abord de 13 participants de France, Canada et du Maghreb. Certains ont cependant préféré se retirer, notamment par manque de temps, et d’autres ont exprimé leur volonté de se joindre au groupe en proposant de travailler sur des disciplines connexes comme la musique et les manuscrits musicaux. L’équipe a fini par se stabiliser autour de 19 participants (cf. Tableau 1).

Nom Domaines de spécialité

1. BEN HENDA Mokhtar SIC TIC

2. BEZZAZI Kader Littérature Semio

3. BORDE Jean Michel TIC

4. BURNARD Lou SIC TIC

5. CHAMOU Abdellah TIC Littérature

6. GHRAB Anas Musicologie

4 IHDB : Institut des Humanités Digitales de Bordeaux

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

11

7. HUDRISIER Henri SIC TIC Semio

8. IAZZI El Mehdi Littérature

9. MAIGNIEN Yannick SIC TIC

10. MARTINDEGUISE Sylvaine SIC Musique

11. OILLO Didier SIC TIC

12. PERRIAULT Jacques Épist. SIC

13. SAADI Hocine SIC TIC linguistique Maths

14. SELLAH Soraya SIC

15. TIGZIRI Noura linguistique Semio

16. VAUCELLE Alain SIC TIC

17. YACINE Tassadit Littérature linguistique Semio

18. ZGHIBI Rachid SIC TIC

19. ZGHIDI Sihem SIC TIC

NB : voir profils des participants dans les Annexes. Tableau 1 : Participants / disciplines

3.1. LA MULTIDISCIPLINARITÉ DES PROFILS DANS LE PROJET Le ralliement en cours de route de partenaires supplémentaires au projet a consolidé l’interdisciplinarité du projet. C’est dans l’esprit interdisciplinaire des Humanités que ceci nous a été utile. Les Humanités digitales le sont encore plus par les croisements forts entre des disciplines variées en sciences sociales et techniques. Les SHS associées aux technologies ont donné lieu à des disciplines hybrides comme la linguistique computationnelle, le traitement automatisé des langues, la traductique, les technologies de l’information et de la communication, etc. Le projet a tenté de fédérer autant que possible des profils d’acteurs venant de plusieurs disciplines relevant tant des Humanités que des sciences techniques. La représentativité disciplinaire des Humanités était assurée par des spécialistes de littérature, de linguistique et de musique auxquels ont été associés des spécialistes des sciences de l’information et de la communication (SIC) puis des technologies de l’information et de la communication (TIC) (cf. Figure 1). Les croisements et les complémentarités des compétences dans la recherche-action au sein du projet ont été consolidés par un effort constant de cadrage épistémologique.

Figure 1 : Répartition des spécialités des membres du projet

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

12

Chacune des disciplines, représentées par un ou plusieurs membres de l’équipe, a joué un rôle particulier dans la réalisation du projet. Chaque discipline a permis de définir les rôles des uns et des autres, comme elle a permis de définir les modalités à mettre en place pour traiter un type particulier de ressources (choix des types de structures, de métadonnées descriptives, de profondeur d’analyse et de référentiels normatifs associés). - L’épistémologie : le cadre conceptuel structurant

Dans sa vocation première, le projet est fondamentalement une recherche-action. Il s’agit simultanément de former des acteurs universitaires à s’approprier des nouveaux habitus de recherches sur des textes, à maîtriser une mise en corpus interopérable pour favoriser la synergie de coopération d’étude mondialisée sur ces patrimoines, mais aussi d’étudier les processus d’appropriations, les déplacements d’approches et donc les redéfinitions épistémologiques qui sont de ce fait induites. La plus-value fondamentale a été sans doute de démontrer comment la recherche-action, associée à l’épistémologie, permet à des dispositifs et des disciplines différentes de développer, dans leurs divergences, des référentiels communs pour transformer des ressources aujourd’hui inexploitées ou dispersées en patrimoines numériques mondialement globalisés réutilisables.

L’action épistémologique a notamment pris forme de réflexions et d’écrits de textes scientifiques (colloques, synthèses et recommandations) qui ont traité de questionnements spécifiques entre autres :

- comment les Humanités digitales participent au « vivre ensemble » ? - comment rapprocher les sciences humaines et les sciences exactes pour dialoguer

ensemble ? - comment le numérique intervient pour faciliter l’échange ? - Les SIC : la conception du système d’information

Pour répondre aux objectifs du projet, fondés essentiellement sur la manipulation et l’organisation de modèles de ressources d’information en SHS, la conception d’un système d’information était incontournable. Par système d’information, nous entendons la mise en place d’un ensemble de procédures, de démarches et de mécanismes permettant la structuration, l’organisation, le référencement et l’exploitation des données collectées et traitées. C’est la tâche attribuée aux spécialistes des sciences de l’information et de la communication qui ont discuté la nature du système de travail à mettre en place (cf. Figure 4). Ces tâches, autant que celles des autres acteurs, sont décrites plus loin dans ce rapport. - Les TIC : la construction de l’environnement technique et applicatif

La plus large part d’un système d’information est concentrée sur le dispositif technologique qui, à son tour, a nécessité la mise en place d’une infrastructure informatique idoine et des applications spécialisées convenables au projet. Des compétences en technologies de l’information et de la communication étaient donc nécessaires. Ces compétences ont été apportées d’une part, par la double compétence de certains membres du projet (notamment dans le développement applicatif et la formation sur les usages des

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

13

TIC) et d’autre part grâce aux performances des services d’opérateurs professionnels externes qui ont installé les dispositifs technologiques du projet (notamment la plate-forme Omeka). - La littérature : au cœur des Humanités digitales

Le projet HumanitéDigitMaghreb n’aurait pas eu lieu sans la participation de spécialistes des SHS qui sont au cœur des Humanités digitales. Or, le domaine des SHS est très vaste et ses croisements sont multiples. La recherche en littérature constitue sans doute l’un de ses piliers historiques les plus essentiels. La littérature est riche par ses genres littéraires (roman, poésie, théâtre, conte, correspondance, discours oratoire, etc.) et leurs subdivisions fines en sous classes topologiques (interview, poésie lyrique, psaume, roman courtois, satire, sonnet, etc.). Chacun de ces genres littéraires dispose d’un ensemble de spécificités propres dans la forme et le contenu qui en font l’objet d’un domaine de spécialisation. Devant la prolifération de ces genres littéraires, le projet n’aurait pas pu prétendre à l’exhaustivité. L’équipe a par contre compté sur l’expertise de certains de ses membres dans les domaines du conte oral, des discours oraux et du roman. Par un souci de multidisciplinarité, d’autres genres littéraires (poésie, fable) ont été traités de manière collégiale par des membres non-spécialistes. Le traitement en était limité aux caractéristiques génériques accessibles à une compréhension générale. Les modèles génériques de la TEI (Performance, verse, speech) ont servi de guide pour traiter ces exemples. - La linguistique : la convergence multilingue, multiculturelle

La linguistique est fortement présente dans les travaux des membres de l’équipe. Le multilinguisme numérique et la diversité linguistique étant l’un des enjeux du projet, les travaux ont été focalisés sur un équilibre linguistique entre le français, l’arabe et le berbère. À plusieurs niveaux du travail accompli, les spécificités linguistiques d’une langue comme d’une autre ont été au cœur des débats pour trouver les meilleurs consensus autour des choix de la matière traitée. La TEI propose dans ce sens des solutions de traitement de corpus multilingues (choix des jeux de caractères, attribution de langues à des segments de texte, liaison et mise en parallèle de textes multilingues) qu’il fallait découvrir et intégrer dans les choix de développement des modèles de ressources numériques du projet.

Un autre questionnement reste à ce jour insuffisamment traité dans notre projet : celui de l’intégration numérique convergente et normalisée des outils de saisie directe du son, des plates-formes d’analyse semi-automatique du discours oral et de la transcription normalisée par la TEI. Ce chantier ambitieux mais primordial est à ce jour une ambition d’HumanitéDigitMaghreb dans une phase ultérieure. - La musique : au croisement de la sonorité et de l’oralité

Sans doute l’un des domaines les mieux structurés et les plus normalisés, la musique a occupé une bonne partie des travaux de l’équipe. La publication récente de la norme MEI (Music Encoding Initiative) a eu pour effet que l’apport de la musique aux humanités digitales est devenu plus structuré et mieux organisé.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

14

Dans le projet HumanitéDigitMaghreb, la musique a été traitée sur deux aspects. Le plus évident c’est celui de la numérisation de chansons en trois volets : paroles (poème), partitions musicales (notation), et sonorité (musique). Des modèles de musique arabe ont été traités et numérisés selon les spécifications de la MEI. Dans un deuxième aspect, la musique a fait l’objet d’une étude historique dans un travail de compilation catalographique des œuvres musicales au Moyen-Orient depuis le Moyen-âge. Entre le modèle de traitement des manuscrits et le référencement de ressources du genre musical, cet aspect de traitement numérique a constitué une plus-value importante par la réalisation d’apparats critiques sur des manuscrits musicaux arabes. Il faut d’ailleurs noter que cette compétence en étude des manuscrits et des apparats critiques propre à la musique a eu un effet (et aura des effets ultérieurs) sur l’appropriation de cette compétence d’étude des manuscrits en général au niveau maghrébin. Enfin, c’est un des enjeux majeurs de la MEI. Elle élargit l’aspect strictement textuel des partitions musicales dans ses dimensions structurelles, sémantiques et sonores en faisant le lien avec les fichiers MIDI, ce qui permet de traiter la facette sonore de la musique à un niveau beaucoup plus riche que la seule présentation d’un fichier sonore hors possibilité de traitement. 3.2. UNE DIMENSION INTERNATIONALE : PARTENARIAT FRANCO-MAGHRÉBIN

Dans un souci de partenariat international multilingue et multiculturel, le projet a été

construit dans une synergie de complémentarité avec d’autres projets de recherche comme le BNFB (Bibliothèque Numérique Franco-Berbère) retenu en 2010 dans l’appel à projets de l’OIF-FFI (Organisation Internationale Francophonie, Fonds Francophone des Inforoutes). Il a hérité ainsi d’un noyau de chercheurs venant de plusieurs pays francophones (France, Algérie, Maroc) pour constituer son premier noyau. Le réseau a été ensuite élargi pour accueillir des compétences supplémentaires de participants venant d’institutions de recherche de Tunisie et du Canada.

Les institutions d’enseignement et de recherche représentées dans le projet sont

signalées dans le tableau suivant : (cf.Tableau 2)

Institution Pays

1. Agence Universitaire de la Francophonie Francophonie

2. Chaire expérimentale internationale « Innovation, Transmission, Edition Numériques » (ITEN) à la Fondation Maison des Sciences de l’Homme (HH)

France

3. TGE-Adonis France

4. Digital Visuel France

5. École des Hautes Études en Sciences Sociales, Laboratoire d’Anthropologie Sociale (LAS), Paris

France

6. Faculté des Lettres et des Sciences Humaines, Université Ibn Zohr, Agadir

Maroc

7. Institut Francophone de l’Information et de la Communication, Tunis Francophonie

8. Institut Supérieur de Documentation, Université La Manouba Tunisie

9. Institut Supérieur de musique, université de Sousse Tunisie

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

15

10. ISCC/CNRS France

11. Laboratoire « Aménagement et enseignement de la langue amazighe » LAELA. Faculté de lettres et langues, Université Mouloud Mammeri de Tizi-Ouzou

Algérie

12. Laboratoire Paragraphe Paris 8 (EA349), MSH Paris Nord, Saint-Denis, France

13. Laboratoire TACTIC EA 1738 Université Paris Ouest Nanterre La Défense. France

14. MICA-E4432, Université Michel de Montaigne Bordeaux 3 France

15. TELECOM SudParis / Département ARTEMIS, Institut TELECOM, Paris France

16. Université Mohamed Premier, faculté des Lettres, Centre Universitaire de Langues et Communication, Oujda

Maroc

17. Université Paris Ouest Nanterre La Défense France

18. Université d’Evry, Labo Maths France

19. LEDEN5, Maison des Sciences de l’Homme Paris Nord France Tableau 2 : Liste des institutions représentées dans le projet

Le projet a permis ainsi de mettre en place un cadre de partenariat entre les deux rives de la méditerranée (cf. Figure 2).

Figure 2 : Géolocalisation des partenaires du projet

Or, dans l’esprit des Humanités digitales aujourd’hui et sous l’impulsion d’une dynamique internationale grandissante, le projet pourrait constituer un socle initial pour un partenariat méditerranéen et international plus large avec des représentativités disciplinaires et linguistiques plus ouvertes. Avec le français comme langue pivot (cf. Figure 3), le projet a pu créer une synergie régionale. Il pourrait de ce fait servir de tremplin pour des alliances méditerranéennes et internationales plus diversifiées.

5 LEDEN (Laboratoire d’Évaluation et de Développement pour la création Numérique) MSH Paris Nord.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

16

Figure 3 : Taux de participation par pays

4. MÉTHODOLOGIE DE MISE EN ŒUVRE L'organisation concrète du projet nous a conduits à consacrer un temps important pour garantir :

a) une bonne notation du projet par les évaluateurs externes de l'appel d'offre, b) l'inscription du projet dans les axes de finalité de l'ISCC, c) une réponse correcte aux objectifs sur lesquels nous avons proposé le projet et

auquel nous avons répondu par une recherche-action. En même temps que de donner des pistes, il fallait aussi définir des rôles et distribuer des tâches entre les participants pour la coordination et le suivi, la production et l’évaluation, la veille et le contrôle (scientifique et technique) à tout moment du déroulement du projet. Nous nous étions donc partagés ces tâches dans un esprit de travail collaboratif et de responsabilités partagées pour atteindre l’objectif final, celui de construire des mini-corpus et d’échantillons d'analyse TEI très complètement et très méthodiquement traités et explorés dans toutes les options et avec toutes les méthodes possibles. Malgré les limites de notre projet (de temps et de moyens), nous n’avons pas oublié non plus d'explorer, de présenter (et éventuellement d'exemplifier) des pistes de scénarios méthodologiques minimum, médium et maximum (aussi bien pour les corpus que pour les traitements d'échantillon). Nous envisageons prolonger cette expérience vers des horizons plus élargies que nous détaillerons à la fin de ce rapport. Bien sûr, au préalable nous étions conscients qu’il fallait se former pour parvenir rapidement à un niveau de prérequis de traitement TEI partagé par tous et une visibilité sur l'ensemble de ce que nous avions à faire en terme de méthode, d'objectifs et de production. Les regroupements périodiques et les actions menées en marges du projet (cf. 8.2 ci-dessous) ont tous servi à échanger nos points de vue et à partager nos expériences pour faire converger au mieux nos différentes conceptions de travail chacun selon sa spécialité. L’idée était de parvenir à une capacité de consensus entre tous pour fixer un scénario méthodologique assez minimum, mais suffisamment médium pour laisser ouvert les possibilités de traitement avec des options d’ouverture et d’élargissement.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

17

5. PLANIFICATION Conduire un projet c’est surtout planifier des phases de réalisation avec des objectifs bien tracés et des tâches bien définies. Le projet a été conduit globalement sur 3 phases : 5.1. PREMIÈRE PHASE : APPROPRIATION (SEPTEMBRE 2012 – DÉCEMBRE 2012)

• Objectifs/tâches :

− Définition de modèles de structure de corpus numérique en SHS fondés sur des typologies de documents (genres littéraires) proposés par les partenaires du projet dans des disciplines Sciences humaines et techniques multiples ;

− prise en main et description des rôles :

o échange électronique entre membres du projet pour expliquer les concepts clés du projet, ses zones d’ombre pour certains, les tâches, les résultats, les échéances, les modes de contribution, etc. ;

o distribution d’une documentation de base pour le démarrage du projet (documents de synthèse, stratégies d’étapes, documents techniques, référentiels, etc.) ;

o présentation des outils de travail, particulièrement le CMS Omeka (version démo : voir descriptif en annexe) et les modalités d’accès et de saisie des données.

5.2. DEUXIÈME PHASE : DÉVELOPPEMENT/PRODUCTION (JANVIER 2013 – AVRIL 2013)

• Objectifs/tâches :

− regroupement régional (au Maghreb) pour un atelier d’appropriation et de mise en route du travail collaboratif ;

− production d’un environnement applicatif de conception de corpus SHS normalisé TEI (dispositif CMS) :

o montage de l’environnement réel de production sous Omeka (version complète) et préparation de la documentation technique

o ajouts d’extensions nécessaires à Omeka pour les besoins du projet (extensions TEI surtout)

o création de comptes et distribution d’un manuel d’utilisation de l’application.

− production de prototypes de documents :

o discussion par voies électroniques sur les types de documents à structurer par spécialité : DTD commune (métadonnées Dublin Core) et DTD spécifiques (métadonnées personnalisées) ;

o identification et acquisition des outils de production de ressources numériques SHS (<oXygen/>, Oxgarage, Roma) ;

o production et mise en ligne d’échantillons expérimentaux de documents TEI multidisciplinaires et multilingues.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

18

− compilation de ressources SHS numérisées pour constituer un mini-corpus sur Omeka. 5.3. TROISIÈME PHASE : ÉVALUATION (AVRIL 2013 – JUIN 2013)

− test des modèles de structuration sur une large variété de documents numériques (par spécialité) ;

− organisation de journées scientifiques à Paris pour :

o un compte rendu d’expérience des membres du projet ; o présenter les rapports de fin de projet ; o discuter des perspectives d’usage et d’extension des produits du projet.

− exposition du corpus produit aux épreuves du référencement OAI-MPH et la mutualisation par la recherche en ligne ;

− mise au point du projet et prospection des formes d’ouverture et d’extension (en direction de l’AUF, ISO, IFIC, BNFB…) ;

− validation et rédaction du compte rendu.

6. IDENTIFICATION DES PROFILS Le projet s’inscrit dans les orientations de recherche des Humanités digitales. Ces deux termes indiquent clairement que la communauté de pratique des HD est grosso modo de deux types : des spécialistes en Sciences Humaines et sociales (Humanités) et des spécialistes d’informatique et des technologies de l’information et de la communication (Digitales). C’est dans la complémentarité entre ces profils d’intervenants que les HD trouvent leur force mobilisatrice d’enseignants chercheurs multidisciplinaires y compris ceux travaillant dans les domaines scientifiques et techniques. Les tâches dans le projet ont été définies selon 3 profils : spécialistes de domaines en SHS, informaticiens spécialistes de matériel et de logiciel, documentalistes spécialistes du référencement (cf. Figure 4). À plusieurs moments du projet, les trois profils se sont rejoints sur des aspects de production et de diffusion dans un esprit de complémentarité collégiale.

Figure 4 : modèle de production de corpus numériques dans tout projet en humanités digitales

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

19

Notons de plus que les spécialistes qui se distribuent sur ces trois profils répondent de plus à des compétences linguistiques diverses : français, arabe, kabyle, tarifit (ou rifain), tachelhit (ou chleuh). À ces compétences linguistiques maternelles s’associent des compétences en anglais (fondamentales au niveau technique et pour prévoir un aménagement international du projet ou dans les tâches de traduction et d’adaptation des TEI Guidelines en français et en arabe qui constituent un enjeu conséquent d’HumanitéDigitMaghreb). Notons encore des compétences en espagnol très utile du fait des liens étroits tant historiques qu’actuels avec l’Espagne. Précisons encore qu’il est utile de signaler la plus ou moins large compétence des différents acteurs du projet pour maitriser trois systèmes d’écriture : latin, arabe et tifinagh et mieux encore les experts dans la maitrise informatique multi-écriture. Il faut noter toutefois que les trois profils ne font pas l’objet d’une distinction nette au niveau des compétences et des individus et encore moins au niveau des tâches à accomplir6. Une même personne, disposant de compétences nécessaires, peut s’acquitter à la fois des tâches de la segmentation logique des documents ainsi que des tâches de manipulation technique des outils informatiques. L’une des recommandations du projet est que chacun s’approprie la logique de la TEI et de ses modes opératoires par les techniques du balisage et des logiciels appropriés. La finalité, enfin de compte, est de créer des pôles d’excellence TEI dans les pays et les institutions partenaires qui sauront gérer par eux-mêmes l’extension du projet à leurs propres échelles. 6.1. DES SPÉCIALISTES EN SHS POUR LA STRUCTURATION LOGIQUE ET SAVANTE DES MODÈLES DE

DOCUMENTS NUMÉRIQUES Les spécialistes en SHS (linguistes, spécialistes du roman, du théâtre, de la poésie, etc.) ont eu la tâche de proposer des modèles de structures de documents dans leurs spécialités respectives ou dans des spécialités connexes dans lesquelles ils ont une connaissance avancée. Un spécialiste de la littérature française, par exemple, pouvait traiter des documents de la littérature arabe ou berbère. Un spécialiste du roman, pouvait, s’il a les connaissances nécessaires, traiter des poèmes et inversement. Des exemples seront donnés dans les parties suivantes pour illustrer ce type d’action. 6.2. DES INFORMATICIENS POUR INSTALLER ET PARAMÉTRER L’ENVIRONNEMENT TECHNOLOGIQUE DES

APPLICATIONS INFORMATIQUES DU PROJET Des intervenants ayant une expertise informatique ont commencé par mettre en place les outils de travail qui ont été utilisés par l’ensemble des membres du projet. Deux types d’environnement ont été prévus :

1. <oXygen/> : logiciel de production de corpus numérique en SHS. Ce logiciel dispose des caractéristiques techniques nécessaires pour saisir le travail des spécialistes en

6 Certains de ces profils ont été assurés grâce à des vocations premières des participants. D’autres ont été le résultat d’adaptations à des disciplines connexes dans une tentative de pallier le manque de spécialistes dans tous les domaines des SHS. Dans le projet, des spécialistes de littérature ont, par exemple, pu se charger des textes de poésie ou de théâtre ; des spécialistes de l’information et de la communication se sont chargés de tâches informatiques et parfois littéraires, etc.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

20

SHS selon la norme TEI. Des licences ont été acquises (notamment grâce à notre collaboration avec le projet 2R2INormTIC de la MSH Paris Nord) et distribuées pour chaque pôle partenaire (par pays) avec les explications techniques d’installation et d’usage en réseau.

2. OMEKA : logiciel du type CMS (gestionnaire de contenu). Omeka a été déployé par une société privée pour fournir au projet un environnement de conservation et de diffusion des corpus de documents produits par les spécialistes en SHS et traités par les spécialités de la TEI. C’est un environnement où les documentalistes sont intervenus pour organiser les collections et les référencer.

6.3. DES DOCUMENTALISTES POUR RÉFÉRENCER LES DOCUMENTS TEI ET GÉRER LES COLLECTIONS DU CORPUS

NUMÉRIQUE Les documentalistes ont eu un rôle de référencement tant au niveau de la structuration interne des documents (produits et saisis en TEI sous <oXygen/>) qu’au niveau des collections gérées sur la plate-forme OMEKA. Ils se sont chargés de saisir et de vérifier les parties « en-tête » (Header) des documents balisés par les spécialistes en SHS. Ils ont vérifié également le référencement des documents et des collections constituées par les métadonnées Dublin Core. 7. RÉPARTITION DES TÂCHES Pour assurer le suivi du projet dans ses différentes phases et aboutir à ses objectifs, l’équipe du projet a été répartie dans des sous-groupes chargés de six ensembles de tâches : 7.1. ENSEMBLE 1 : COORDINATION, ANALYSE FONCTIONNELLE ET PILOTAGE DU PROJET

Coordinateur - Mokhtar Ben Henda

Partenaires impliqués

- Tous les membres du projet ; Laboratoire MICA, Bordeaux 3

Date de début - juin 2012

Date de fin - juin 2013

Objectifs et prérequis

- Cette catégorie de tâches couvre la coordination entre les acteurs du projet, l’organisation logistique des activités et le suivi de la consommation budgétaire du projet.

Tâches - Coordination générale du projet, - Contrôle budgétaire avec l’ordonnateur financier du projet, - Suivi de la conformité des actions avec les affinités du projet, - Suivi de la rédaction des documents techniques du projet.

Délivrables - Documents de cadrage du projet, - Documents techniques divers, - Un rapport final d’évaluation.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

21

7.2. ENSEMBLE 2 : ORIENTATIONS SCIENTIFIQUES ET CONTRÔLE ÉPISTÉMOLOGIQUE

Coordinateur - Jacques Pérriault

Partenaires impliqués

- Yannick Maignien, Didier Oillo, Henri Hudrisier, Soraya Sellah

Date de début - janvier 2013

Date de fin - juin 2013

Objectifs et prérequis

- Cet ensemble de tâches concerne le contrôle des orientations épistémologiques du projet et la conformité de sa réalisation avec l’énoncé initial proposé à l’ISCC.

Tâches - Émettre des commentaires d’orientation et des directives d’ordre scientifique et épistémologique par rapport aux actions et aux délivrables proposés,

- Valider la conformité des rapports avec les orientations scientifiques et épistémologique annoncées.

- Coordonner un module de contribution épistémologique*. - Participer à un module de contribution sur les usages,

l’appropriation des Humanités digitales et les scénarios d’évolution potentielles au Maghreb (en collaboration étroite avec des contributions thématiques et géographiques demandées à TOUS les partenaires de contenus*.

Délivrables - Des brèves d’évaluation scientifique, - Des commentaires sur les rapports élaborés, - Une lecture épistémologique du projet pour l’évaluation

finale.

* En collaboration avec l’Ensemble 3

7.3. ENSEMBLE 3 : CONTRÔLE PÉDAGOGIQUE ET ÉVALUATION

Coordinateur - Yannick Maignien

Partenaires impliqués

- Soraya Sellah, Henri Hudrisier, Mokhtar Ben Henda

Date de début - janvier 2013

Date de fin - juin 2013

Objectifs et prérequis

- Le contrôle pédagogique et l’évaluation consistent à surveiller les orientations des équipes et des individus pour rester dans les mêmes orientations du projet.

Tâches - Jouer le rôle de relai entre les équipes et les acteurs pour un meilleur échange d’expériences et de coordination de leurs actions respectives,

- Rappeler en permanence les objectifs de court, moyen et

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

22

long terme du projet, - Coordination d’un module de contribution

épistémologique*. - Participation à un module de contribution sur les usages,

l’appropriation des Humanités digitales et les scénarios d’évolution potentielles au Maghreb (en collaboration étroite avec des contributions thématiques et géographiques demandées à TOUS les partenaires de contenus*.

Délivrables - Comptes rendus et appréciations des travaux effectués, - Contributions au rapport final d’évaluation

* En collaboration avec l’Ensemble 2

7.4. ENSEMBLE 4 : CONTRÔLE TECHNIQUE ET RÉSEAUTIQUE

Coordinateur - Alain Vaucelle

Partenaires impliqués

- Mokhtar Ben Henda, Abdellah Chamou

Date de début - janvier 2013

Date de fin - juin 2013

Objectifs et prérequis

- L’équipe du contrôle technique et de la réseautique veille au bon fonctionnement des ressources technologiques du projet composées d’un éditeur TEI/XML mis en réseau et d’un CMS en ligne.

Tâches - Installer et paramétrer un serveur Omeka accessible en ligne pour la création des collections de corpus numériques,

- Installer et paramétrer le logiciel <oXygen/> sur les machines des acteurs selon le nombre des licences disponibles,

- Répondre aux sollicitations d’ordre technique des acteurs du projet

- Accomplir les formes d’exploitation possibles des ressources numériques selon les besoins des acteurs du projet.

Délivrables - Une documentation technique de chaque logiciel utilisé, - Des guides d’utilisation pour les applications installées, - Un rapport de fin de projet pour évaluer les avantages et les

inconvénients de chaque outil.

7.5. ENSEMBLE 5 : DÉVELOPPEMENT DE CORPUS ET CONTRÔLE RÉDACTIONNEL

Coordinateurs - Rachid Zghibi, Henri Hudrisier

Partenaires impliqués

- Tous les membres du projet [constitution d’équipes et/ou désignation de responsables éditoriaux par langue, pays ou type de corpus]

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

23

Date de début - janvier 2013

Date de fin - juin 2013

Objectifs et prérequis

- Les équipes sont censées développer des mini-corpus et d’échantillons d'analyse TEI à partir de documents multilingues modèles.

- Ce travail nécessite une coordination rédactionnelle des corpus et des thématiques (en coordination avec chaque langue)

Tâches - Veiller au déroulement synchrone du travail de développement entre les équipes (par langue et par pays),

- Coordonner les échanges par courrier électronique entre les équipes pour une meilleure mutualisation d’expériences,

- Contrôle rédactionnel des corpus.

Délivrables - Des échantillons d’analyse TEI pour plusieurs types de documents dans chaque langue,

- Des mini-corpus de documents traités en TEI qui seront hébergés sur Omeka,

- Des comptes rendus d’expérience pour le regroupement d’avril 2013

7.6. ENSEMBLE 6 : FORMATION

Coordinateur - Abdallah Chamou

Partenaires impliqués

- Alain Vaucelle, Rachid Zghibi, Henri Hudrisier, Mokhtar Ben Henda

Date de début - janvier 2013

Date de fin - avril 2013

Objectifs et prérequis

- Une équipe de formation a veillé à fournir l’aide technique nécessaire aux membres du projet pendant la réalisation de leurs parts de travail. Elle veille aussi à concevoir sur la durée un kit de formation qui servirait aux regroupements de février et d’avril 2013

Tâches - Réagir aux sollicitations des acteurs du projet par rapport à des questions techniques dans l’usage des logiciels employés,

- Concevoir et créer des guides et des manuels d’utilisation des deux logiciels utilisés : <oXygen/> et Omeka,

- Élaborer, selon les besoins, des bouts de méthodes ciblées sur des fonctionnalités précises des deux logiciels,

Délivrables - Un guide d’utilisation d’<oXygen/>, pour les besoins du projet,

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

24

- Un guide d’utilisation d’Omeka, pour les besoins du projet, - Un rapport de fin de projet pour l’évaluation des formations

fournies aux membres du projet.

La réalisation de ces tâches, bien que parfois soumises à des contraintes d’ordre technique ou logistique (paramétrage complexe des applications, contraintes contextuelles dans les pays partenaires), a pu aboutir à des résultats que nous jugeons conformes aux attentes initiales du projet. Les différents moments planifiés pour faire le point de l’avancement des travaux ont pris forme de regroupements locaux et internationaux, dans le cadre des activités programmées du projet ou dans des actions externes en rapport avec le projet. 8. REGROUPEMENTS ET ACTIVITÉS CONNEXES

Six regroupements programmés pour et par les membres du projet ont été réalisés. Des activités connexes au projet (en dehors du cadre initial déclaré) sont également venues au fil de l’eau sous forme d’un regroupement local restreint et de journées scientifiques pour faire état d’avancement des activités conduites dans le cadre du projet. 8.1. LES REGROUPEMENTS PROGRAMMÉS DU PROJET Les six regroupements réalisés ont été prévue pour deux types d’action : formation des participants et évaluation des travaux. 8.1.1. Premier regroupement : septembre 2012 – mise en route

Lieu - ISCC/CNRS, Paris

Date - 9 septembre 2012

Participants - Tous les membres du groupe

Objectifs - Planification générale du projet et budgétisation des actions programmées

Résultats - Fixation des objectifs - Plan d’action - Agenda de réalisation des travaux - Ventilation du budget attribué

N.B. - Le premier regroupement du projet a été réalisé à Paris en septembre 2012, profitant de la présence des partenaires maghrébins dans le cadre du projet OIF « Bibliothèque Numérique Franco-berbère ».

8.1.2. Deuxième regroupement : décembre 2012 – recadrage des activités

Lieu - LAS, École des Hautes Études, Paris

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

25

Date - 7-8 décembre 2012

Participants - Tous les membres du projet

Objectifs - Affiner la stratégie d’action - S’approprier davantage les objectifs du projet - Échanger des expériences interdisciplinaires pour l’harmonisation

des actions communes du projet

Programme - Présentation des nouveaux adhérents au projet - Présentation du projet BNFB - Présentation du projet HumanitéDigitMaghreb - Débat sur les stratégies de travail du projet - Introduction aux humanités digitales et à la TEI - Présentation des outils <oXygen/> & Omeka - Présentation de la matière de formation

Résultats - Identification des compétences nécessaires au projet - Présentation des spécificités des disciplines concernées - Introduction des pratiques techniques de compilation et de

traitement des ressources SHS - Présentation des applications informatiques à employer

N.B. - Ce deuxième regroupement avait comme vocation le rapprochement interdisciplinaire entre les participants et la délimitation des zones d’interaction entre eux tant sur le plan de la nature structurelle des contenus que sur les modalités d’usage des outils.

8.1.3. Troisième regroupement : février 2013 - formation

Lieu - École Normale Supérieure, Tunis (formation itinérante)

Date - 18-19 février 2013

Participants - Formateur itinérant : Abdellah Chamou - Membres et assistants locaux du projet : Hédia ABDELKEFI (Institut

Supérieur des Sciences Humaines), Sihem ZGHIDI & Rachid ZGHIBI (Institut Supérieur de Documentation) - Étudiants et chercheurs nationaux en SHS : 25 participants

(doctorants & enseignants-chercheurs en Humanités)

Programme - Présentation du contexte général des Humanités Digitales et du projet HumanitéDigitMaghreb. - Présentation de la TEI et d'<oXygen/> avec son support didactique - Démonstration de traitement sur texte français et arabe. - Échange avec les participants

Résultats - Présentation du projet HumanitéDigitMaghreb et sensibilisation au thème des humanités digitales et de leur apport aux sciences

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

26

humaines et sociales - Présentation de la TEI et démonstration de traitement de poèmes

français et arabes

N.B. - La formation a généré un intérêt important parmi les participants qui ont exprimé leurs ambitions de réaliser des travaux en thèse sur les humanités digitales.

8.1.4. Quatrième regroupement : février 2013 - formation

Lieu - Université Mouloud Mammeri, Tizi-Ouzou (formation itinérante)

Date - 20-21 février 2013

Participants - Formateur itinérant : Abdellah Chamou - Membres et assistants locaux du projet : Nora TIGZIRI, Ramdane

BOUKHROUF (Université Mouloud Mammeri) - Étudiants et chercheurs nationaux en SHS (10 doctorants &

enseignants-chercheurs en Humanités)

Programme - Une présentation du contexte général des Humanités Digitales et du projet HumanitéDigitMaghreb - Présentation de la TEI et d'<oXygen/> - Démonstration de traitement sur texte français et berbère - Échange avec les participants

Résultats - Présentation et définition du processus de numérisation et des divers formats des documents - Présentation d’<oXygen/> et démonstration de traitement sur un

poème français - Présentation de l’encodage des documents oraux - Travaux pratiques : � Travail sur un document de Ramdane BOUKHROUF. L’encodage

d’un discours oral avec segmentation selon les évènements : pauses, interruptions, applaudissements etc..

� Méthode : présentation de la convention, élaborée par l’auteur. Correction et mise en adéquation de cette convention selon les exigences du traitement automatique. (Ex : Ne pas utiliser les slashs (//) dans les conventions.)

� Élaboration d’une nouvelle convention TEI, remplacement automatique de la première convention dans le document initiale.

� Exposé sur l’encodage des éléments oraux.

N.B. - Cette formation s’est focalisée sur deux niveaux d’expertise recherchée : encodage des corpus oraux et des contenus multilingues (en langue berbère)

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

27

8.1.5. Cinquième regroupement : février 2013 - formation

Lieu - Université Ibnou Zohr, Agadir (formation itinérante)

Date - 22-23 février 2013

Participants - Formateur itinérant : Abdellah Chamou - Membres et assistants locaux du projet : Mehdi IAZZI (Université

Ibnou Zohr, Agadir) ; Abdel-kader BEZAZI, Fouad MEHDAOUI (Université Oujda) - Étudiants et chercheurs nationaux en SHS (10 doctorants &

enseignants-chercheurs en Humanités)

Programme - Une présentation du contexte général des Humanités Digitales et du projet HumanitéDigitMaghreb - Distribution des supports didactiques - Présentation de la TEI et d'<oXygen/> avec son support didactique - Démonstration de traitement sur texte français et berbère - Échange sur la possibilité du traitement des contes et des proverbes.

Résultats - Présentation et définition du processus de numérisation et des divers formats des documents - Présentation d’<oXygen/> et démonstration de traitement sur un

poème français - Présentation de l’encodage des documents oraux - Travaux pratiques : � Encodage d’un discours oral avec segmentation selon les

évènements : pause, interruptions, applaudissements etc.. � Méthode : présentation de la convention « élaborée par

l’auteur ». Correction et mise en adéquation de cette convention selon les exigences du traitement automatique.

� Élaboration d’une nouvelle convention TEI, remplacement automatique de la première convention sur le document initial

� Exposé sur l’encodage des éléments oraux � Échange au sujet du traitement des contes (entre autres) et de la

spécificité de leur traitement

N.B. - Le pôle marocain du projet est focalisé sur les contes oraux en langue berbère. La formation a porté essentiellement sur ce type de ressources.

8.1.6. Sixième regroupement : avril 2013 - évaluation

Lieu - ISCC/CNRS, Paris

Date - 25-26 avril 2013

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

28

Participants - Tous les membres du groupe - Lou Burnard, fondateur de la TEI7 comme invité

Objectifs - Compte rendu final du projet et évaluation des travaux

Programme - Compte rendu des activités des partenaires du projet - Évaluation des formations itinérante au Maghreb - La TEI P5, présentée et commentée par Lou Burnard - Recommandations générales - Perspectives et ouvertures

Résultats - Des comptes rendus de réalisations de travaux d’encodage TEI de ressources SHS multilingues - Des prototypes de documents SHS structurés par la TEI - Des perspectives d’action dans le sillage du projet

HumanitéDiditMagreb - Des éléments factuels pour l’élaboration du rapport d’évaluation du

projet - Une plate-forme opérationnelle (Omeka) pour la constitution d’un

corpus numérique normalisé TEI P5 en SHS (http://www.hudima.org/)

N.B. - Ce dernier regroupement programmé a été l’occasion d’inviter Lou Burnard, l’un des fondateurs clés de la TEI pour discuter des potentialités d’usage de la TEI P5 et de l’intégration d’HumanitéDigitMaghreb à la communauté internationale de la TEI.

8.2. LES ACTIVITÉS CONNEXES, EXTERNES AU PROJET Ces activités sont survenues au fil de l’eau sous forme de participation à des colloques ou de formations ayant un rapport direct ou indirect avec les Humanités Digitales. 8.2.1. Un regroupement d’appropriation des outils numériques : 09 février 2013

Lieu - Lieu privé, Paris

Date - 9 février 2013

Participants - 05 membres du projet résidants à Paris

Objectifs - Pratiques avec l’outil <oXygen/> pour la codification TEI des ressources numériques

Résultats - Appropriation des fonctions de base de l’outil <oXygen/> pour la numérisation de ressources numériques

7 et auteur des TEI Guidelines.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

29

N.B. - Ce regroupement restreint de formation a été improvisé au fil de l’eau en dehors des actions programmées initialement dans le projet. Il a été utile pour la conception de la matière didactique pour les formations itinérantes au Maghreb en février 2013.

8.2.2. Un stage d’initiation à l’encodage XML/TEI des textes patrimoniaux (imprimés et manuscrits). Université François Rabelais, Tours : 23-30 janvier 2013

Lieu - CESR, Université François Rabelais, Tours, France

Date - 23-30 janvier 2013

Participants - 01 membre (formateur) du projet : Abdellah CHAMOU

Objectifs - Initiation à l’encodage XML/TEI des textes patrimoniaux (imprimés et manuscrits)

Résultats - Développement de compétences sur les techniques d’encodage des métadonnées et de l’encodage sémantique par la TEI

N.B. - Cette formation était dans le cadre d’un stage ouvert aux étudiants du Master Professionnalisant du CESR, et, en fonction des places disponibles, aux étudiants de l’université de Tours et autres institutions. Elle était assurée par Lou Burnard, l’un des partenaires d’honneur du projet HumanitéDigitMaghreb ; ce qui explique l’accès de notre formateur Abdellah Chamou à ce stage.

8.2.3. Un stage d’initiation à l’encodage MEI des textes patrimoniaux (imprimés et manuscrits).

Université François Rabelais, Tours : 23-30 janvier 2013

Lieu - CESR, Université François Rabelais, Tours, France

Date - 25 février 2013

Participants - 01 membre Sylvaine MARTIN

Objectifs - Rencontre avec Lauranne Bertrand, Ingénieur d'Études XML-TEI chez Bibliothèques Virtuelles Humanistes, afin d'explorer le standard MEI (Music Encoding Initiative) et pouvoir réaliser par la suite des corpus musicaux maghrébins en langage à balises

Résultats - Le but de cette rencontre avec Lauranne Bertrand était d'apprendre le fonctionnement du standard MEI (Music Encoding Initiative. Cette initiation a permis à Sylvaine Martin de Guise d'appliquer ce standard aux partitions musicales de musique maghrébine, et de l'appliquer en tout premier lieu sur des exemples de musiques traditionnelles tunisiennes.

- Ainsi, dans le cadre de la Mission de HumanitéDigitMaghreb à Tunis, les 7, 8 et 9 mars 2013, Sylvaine Martin de Guise a pu montrer au

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

30

public de l'Institut Supérieur des Langues de Gabès comment le standard MEI peut être utile dans l'étude et la transmission informatique des musiques traditionnelles et actuelles tunisiennes

N.B. - Cette formation était prise en charge par un fonds de recherche du projet 2R2INormTIC - Réseau de recherche international et interdisciplinaire sur les normes des TIC, MSHA Paris Nord, dirigé par Henri HUDRISIER, lui-même membre du projet HumanitéDIgitMaghreb.

8.2.4. Séminaire « technologies numériques dans l’art et les sciences humaine, Gabès, Tunisie : mars 2013

Lieu - ISAM, Université de Gabès, Tunisie

Date - 7-8 mars 2013

Participants - 06 membres du projet

Objectifs - Monter un atelier sur les « Humanité Digitale, TEI (Text Encoding Initiative) et ART »

Programme - Présentation générale du sujet des Humanités Digitales - Démonstration de sites et d’applications TEI - Présentation de la norme MEI (Music Encoding Initiative) - Structuration de corpus en TEI et MEI d’œuvres littéraires,

artistiques et musicales - Table ronde : évaluation de l’atelier et propositions de collaboration

entre ISAMG et l’équipe du projet HumanitésDigitMaghreb

Résultats - Textes scientifiques sur les humanités digitales à publier dans les actes du colloque - Accord de principe sur une collaboration future entre l’Université de

Gabes et l’équipe du projet HumanitéDigitMaghreb sur le sujet de la TEI et des Humanités digitales - Des ressources numériques supplémentaires structurées en TEI pour

le projet HumanitéDigitMaghreb

N.B. - Les actes du colloque seront publiés vers la fin 2013 - La prise en charge du voyage de S Martin par prise en charge par un

fonds de recherche du projet 2R2INormTIC - Réseau de recherche international et interdisciplinaire sur les normes des TIC, MSH Paris Nord, dirigé par Henri HUDRISIER, lui-même membre du projet HumanitéDigitMaghreb. - Le financement local des rencontres était pris en charge par l’Institut

d’Art et l’institut des langues de l’Université de Gabès. Ce partenaire est un point fort pour les futurs développements du projet HumanitéDigitMaghreb

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

31

8.2.5. The Music Encoding Conference 2013. Mayence, Allemagne

Lieu - Mainz Academy for Literature and Sciences, Mayence, Allemagne

Date - 20-24 mai 2013

Participants - 01 membre du projet : Sylvaine MARTIN DE GUISE

Objectifs - Assister à la conférence annuelle de la MEI (Music Encoding Initiative) en 2013

Programme - Acquérir des compétences supplémentaires d’encodage de ressources de musicologie et des bibliothèques musicales - S’informer sur l'état actuel de la modélisation des données, la

production et l'utilisation des ressources musicales - Introduire de nouvelles perspectives sur des sujets dans les

domaines de la musicologie traditionnelle et informatiques, des bibliothèques musicales, et l'édition savante, ainsi que dans le plus large domaine des humanités numériques - http://music-encoding.org/conference/program

Plus-value - Ce colloque a permis aux fondateurs de la MEI de partager avec ses membres et avec le public les plus récentes innovations du standard MEI et de présenter les nouvelles directions de ses activités dans la réalisation de corpus musicaux en langage à balise - Sylvaine Martin de Guise a pu ainsi assister à des cours offerts aux

membres de la MEI et proposer sa collaboration en tant que chercheur du projet HumanitéDigitMaghreb et du laboratoire Paragraphe. Ainsi a-t-il été entendu avec le fondateur principal de la MEI, Perry Roland, Professeur de 'l'Université de Virginia (USA), que Sylvaine Martin de Guise ferait la traduction française du Guide d'utilisation de la MEI

N.B. - Ce colloque était l’occasion de nouer des contacts avec les fondateurs de la MEI : Perry Roland et Ichiro Fujinaga de l’Université de Virginie - Prise en charge du voyage de Sylvaine Martin sur le projet

2R2INormTIC - Réseau de recherche international et interdisciplinaire sur les normes des TIC, MSH Paris Nord, dirigé par Henri HUDRISIER, lui-même membre du projet HuanitéDIgitMaghreb

8.2.6. 2éme rencontre internationale : « La linguistique du corpus : recueil, annotation, exploitation et diffusion », Tizi-Ouzou, Algérie : juin 2013

Lieu - Université Mouloud Mammeri, Tizi-Ouzou, Algérie

Date - 23-24 juin 2013

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

32

Participants - 03 membres de l’équipe du projet : � Nora TIGZIR : Base de données kabyles : collecte de

données et applications � Sylvaine MARTIN DE GUISE : La MEI – Music Encoding

Initiative � Abdellah CHAMOU : PHON, un outil indispensable pour la

transcription des corpus oraux

Objectifs - Confirmer les plus-values du projet HumanitéDigitMaghreb dans les axes de spécialité des intervenants

N.B. - Constituer une forme de continuité du projet HumanitéDigitMaghreb - Le financement du colloque et de la mission de Sylvaine Martin de

Guise ont été assurés par Université Mouloud Mammeri, Tizi-Ouzou

8.2.7. TEI Conference and members meeting, Rome : octobre 2013

Lieu - Association pour la culture humaniste et la culture digitale, Rome, Italie

Date - 2-5 octobre 2013

Auteurs - 04 membres du projet : � Henri HUDRISIER � Rachid ZGHIBI � Sihem ZGHIDI � Mokhtar BEN HENDA

Participant Objectifs

- 01 membre du projet : - Henri Hudrisier

- Confronter les acquis du projet HumanitéDigitMaghreb à la

communauté internationale de la TEI et des humanités Digitales - Inscrire le projet et l’équipe dans la dynamique du consortium TEI

Résultats - Mise en visibilité des enjeux d’HumanitéDigitMaghreb dans toute la communauté TEI - Inscription sur l’atelier thématique TEI & MEI - Communication acceptée : “ Promoting the linguistic diversity of TEI

in the Maghreb and the Arab region” [http://digilab2.let.uniroma1.it/teiconf2013/program/papers/] - Frais d’inscription et prise en charge de participation assures par des

fonds divers autres que celui du projet HumanitéDigitMaghreb - La mission et l’inscription a été prise en charge conjointement par le

LEDEN et sur le projet 2R2INormTIC - Réseau de recherche international et interdisciplinaire sur les normes des TIC, MSH Paris Nord,

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

33

9. DESCRIPTION TECHNIQUE DU PROJET Dans cette section, il est question de présenter plus en détail l’environnement applicatif du projet, la chaîne de production du travail de numérisation et les produits réalisés. Mais avant cela, une présentation des notions fondamentales sur lesquelles le projet a été conçu est essentielle pour mieux comprendre les articulations des tâches et des rôles dans le montage du projet. 9.1. TEI ET DOCUMENTS STRUCTURÉS Comme annoncé dans les objectifs du projet, il a fallu concevoir et produire des modèles de structure de documents numériques en SHS en appliquant les directives de la TEI Guideline, version P5. Le projet visait explicitement le développement de prototypes de documents numériques et non la constitution de corpus numériques en SHS. Cette finalité était bien étudiée dès le début du projet car la création de corpus numériques est une activité plus complexe et nécessite plus de moyens logistiques et de maîtrise des principes du travail technique sur les corpus numériques en sciences humaines et sociales. Suite à ce consensus, une large part des actions dans le projet a été orientée vers la formation et l’appropriation des concepts clés des Humanités digitales, des procédures et des techniques de structuration logique et d’encodage technique des ressources. Pour cela, il a fallu se doter d’outils informatiques à interfaces intuitives et mettre en place une plate-forme conviviale de gestion des ressources, ce qui explique le choix des deux outils <oXygen/> comme éditeur XML des schémas TEI et Omeka comme plateforme CMS pour l’organisation des documents produits. Mais avant de décrire l’environnement technique du projet et de la nature du travail accompli, commençons par définir la notion principale de « document structuré » pour mieux distinguer entre une structure logique et une autre physique d’un document numérique. Nous le ferons à partir des directives de la TEI (TEI Guidelines P5). 9.1.1. Structure physique Vs structure logique

Par structure logique, on entend l’organisation d’un document en parties constituantes de son contenu sémantique ; par structure physique ou mise en page, on entend la manière dont le document est inscrit et réparti, sur le support. Le contenu sémantique d’un texte et l’objet physique sur lequel ce texte est inscrit ont des structures hiérarchiques distinctes. Il faut rappeler ici que dans l’univers de la TEI, le texte est considéré avant tout comme une abstraction. Donc, c’est sa structure logique qui prime, à laquelle on rapporte en général les informations relatives à la structure physique par des techniques connexes (i.e. feuilles de style). La structuration d’un document est reproduite en langage TEI sous forme d’une DTD (Document Type Definition) écrite dans un langage formel (cf. Figure 5) qui permet de baliser logiquement la plupart des types de documents sur lesquels travaillent les chercheurs en

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

34

sciences humaines (textes en prose, poésie, théâtre, éditions philologiques, dictionnaires, corpus linguistiques, etc.). Les différents modules constituant un document sont regroupés en deux grandes catégories d’éléments descriptifs (cf. Figure 5). Certains éléments sont obligatoires, d’autres sont optionnels.

1. Métadonnées (<teiHeader>) : un document numérique dispose souvent d’un en-tête réservé au référencement de la ressource. L’en-tête contient des éléments d’identification comme le sujet, l’auteur, le titre de la ressource. Cette partie n’est pas obligatoire. Un document numérique peut exister sans disposer d’en-tête, même s’il a moins de chance d’être indexé, repéré et restitué par le système d’information qui l’héberge. Souvent, c’est le travail des documentalistes, mais les auteurs des documents ont de plus en plus tendance à saisir les métadonnées de leurs propres documents numériques.

2. Entité matérielle du document (<text>) : un document n’existe pas sans contenu.

C’est la partie centrale du document. Elle est donc obligatoire. L’entité matérielle du document se compose quant à elle de trois sous-catégories :

a. La partie des liminaires (<front>) qui sont souvent constituées de la page de

couverture, de la page du titre, du sommaire, des avant-propos, des prologues, dédicaces, etc. Cette partie n’est pas obligatoire puisqu’un document peut exister sans avoir ces pages liminaires.

b. Le contenu (<body>) : c’est le noyau central qui donne sa raison d’être au

document. C’est l’œuvre créative de l’auteur du document. Elle est donc obligatoire. Sa structuration revient naturellement au spécialiste en SHS. Elle reflète les parties propres à chaque discipline et permet donc de travailler différemment sur du théâtre, de la poésie, du roman, ou de structurer un dictionnaire ou un annuaire téléphonique. La constitution de chaque type de document est définie selon le genre littéraire (en SHS) ou le type de document technique (manuels, guides, annuaires, etc.)

c. Les annexes (<back>) qui prennent généralement la forme d’une table des

matières, d’un index, d’un document complémentaire (CD-ROM, Microfiche, etc.). Cet élément n’est pas obligatoire.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

35

Figure 5 : structure minimale d’un document

Tout document balisé conformément à la TEI comprend de ce fait deux parties :

1. un en-tête de nature documentaire (correspondant à l’élément <teiHeader>) ;

2. le texte du document proprement dit (correspondant à l’élément <text>). Cette structuration s’applique à la fois au document individuel et au niveau supérieur de la collection (corpus) de documents (cf. Figure 6).

Figure 6 : schéma TEI pour les différents niveaux de corpus

9.1.2. Les schémas de structuration de la TEI P5

Dans l’esprit des fondateurs des Humanités digitales qui nous intéressent particulièrement dans ce projet, deux types d'éléments sont prévus pour structurer des textes et annoter (ou « baliser ») de façon normalisée les éléments logiques qui les constituent :

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

36

• le noyau : ce sont les éléments (ou balises) communs à toutes disciplines, par exemple, la structure en divisions ou sections, la description documentaire du contenu, etc...

• les éléments propres à des disciplines : ils permettent de travailler sur un type particulier de ressource : théâtre, poésie, dictionnaires, histoire...

La TEI est, pour cela, une architecture plastique qui peut s’adapter aux nouveaux besoins et enjeux de la recherche en SHS. Dans sa version P5, la TEI propose des schémas standards qui servent de base à la numérisation de documents de plusieurs types :

� TEI Lite : schéma pour la description de documents simples � Bare TEI : schéma basique avec un minimum d’éléments � All : schéma avec tous les modules inclus � Corpus : schéma pour encoder les corpus linguistiques � MS : schéma pour la description des manuscrits et les formes complexes � Performance : schéma pour la description d’oeuvres théâtrales et autres (audio,

vidéo) � Speech : schéma pour la représentation du discours oral � Verse : schéma pour la description de poèmes � Dictionaries : schéma pour la description des dictionnaires � MEI : Music Encoding Initiative (depuis 2010)

Soulignons qu’un texte théâtral peut être en vers et qu’il existe des possibilités de générer des schémas adaptés à l’étude conjointe de ces deux typologies de documents.

9.2. MONTAGE TECHNIQUE DU PROJET HUMANITÉDIGITMAGHREB Le montage technique du projet a d’abord eu besoin d’une méthode cohérente et collaborative appropriée à l’acquisition et à l’installation de deux environnements techniques complémentaires. Il a eu ensuite besoin d’un environnement de production de ressources et d’un autre de gestion et d’organisation des corpus. Le premier a été créé par le logiciel <oXygen/>, le deuxième par le CMS Omeka. Des outils supplémentaires du domaine public (Open source) ont été également mis à la disposition de la communauté internationale de la TEI (Roma, Xgarage). 9.2.1. <oXygen/>, outil de production des ressources numériques normalisé TEI

- Fabriquant : SyncRO Soft, Revendeur français : 1, Rond-Point Victor Hugo 92137 Issy-les-Moulineaux Cedex – France

- Droits : commercial - Version : académique 2012

- Présentation : Le logiciel <oXygen/> XML Editor est un éditeur de fichier XML qui permet de contrôler et de modifier un document pour qu’il soit bien formé et valide. Ce programme permet également

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

37

de générer des fichiers DTD (Document Type Definition) qui décrivent la structure d’un document SGML ou XML. <oXygen/> est livré avec des DTD TEI, un catalogue XML, des feuilles de style XSL et des modèles de documents qui permettent de travailler immédiatement avec des documents TEI standards. En effet, <oXygen/> installe un riche ensemble de modèles pour un certain nombre d'applications XML, y compris un ensemble de modèles prédéfinis pour les documents XML TEI (cf. Figure 7).

Figure 7 : Les DTD TEI par défaut dans <oXygen/>

Ces modèles sont des coquilles de documents qui contiennent une structure prédéfinie. Ils fournissent des points de repères sur lesquels de nouveaux documents, ayant les mêmes caractéristiques de base (même genre littéraire), peuvent être rapidement construits. Le logiciel a été acquis en 03 licences sur le budget du projet HumanitéDigitMaghreb et 4 licences sur un financement externe (projet 2R2INormTIC - Réseau de recherche international et interdisciplinaire sur les normes des TIC, MSHA Paris Nord). Les licences ont été distribuées comme suit :

1. Laboratoire MICA : 01 licence ; 2. MSHA Paris Nord : 01 licence ; 3. Algérie : 01 licence ; 4. Maroc : 01 licence ; 5. Tunisie : 01 licence ; 6. Formateur Oxygen : 01 licence ;

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

38

7. Porteur du projet : 01 licence8 ;

L’exploitation d’<oXygen/> a été intégrée au cœur de la configuration générale du système d’information du projet (cf. Figure 8) qui fonctionne selon les trois principes conventionnels de tout système d’information :

1) Une phase d’entrée de données (Data Input) ; 2) Un processus de traitement et de conservation (Management and Storing) ; 3) Un processus de communication et de diffusion (Output : communication and

delivery). Dans ce schéma, <oXygen/> joue un rôle central puisqu’il permet de concevoir les documents numériques en TEI qui sont ensuite transférés vers le CMS (plate-forme Omeka) pour y être traités comme corpus puis diffusés comme collection.

Figure 8 : configuration d’usage d’<oXygen/>

Dans l’entourage technologique des spécialistes de la TEI, <oXygen/> est considéré comme un outil de production de documents XML génériques et non exclusivement TEI. De ce fait, il est souvent utilisé avec un ensemble d’outils complémentaires du domaine public (Open source) qui sont, quant à eux, exclusivement conçues pour des ressources TEI. Il s’agit du logiciel Roma (http://www.tei-c.org/Roma/) et de Oxgarage (http://www.tei-c.org/oxgarage/).

8 Dans la suite du projet (par exemple le projet en examen de financement éventuel à la MSH Paris Nord

« Numérisation savante (TEI&MEI » de poétiques et musiques euro-méditerranéennes en lien avec le déploiement d’activités numériques), on prévoirait une commémoration avec Huma-Num du CNRS qui pourrait mettre à notre disposition des licences Oxygen flottantes et gratuites pour un cadre d’usage académique.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

39

Roma est une interface Web mise au point par le consortium TEI. Elle permet aux utilisateurs de la TEI de générer des schémas personnalisés compatibles avec la TEI P5. Roma permet de choisir les modules les plus pertinents dans l’ensemble des modules de la TEI P5 pour préparer un schéma personnalisé (par exemple du théâtre en vers comme nous le signalions plus haut). Roma permet aussi de concevoir des modules personnalisés assez complexes (cf. Figure 9). Tous les changements par rapport à la « TEI canonique », c'est à dire les éléments et les attributs, leurs noms, leurs comportements et leurs sémantiques, sont indiqués dans le schéma personnalisé appelé « schéma ODD ». ODD permet donc de construire son propre schéma issu de la TEI adapté à des besoins précis.

Figure 9 : Interface Roma de personnalisation de schéma TEI

La majorité des transformations utilisent le format TEI comme format pivot pour la conversion de documents TEI vers Word (. Docx) ou Word (. Docx) vers le format TEI. OxGarage est une application Web de conversion de document utilisée pour gérer la transformation de documents entre une variété de formats. Les utilisateurs peuvent télécharger des fichiers de trois types :

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

40

des documents, des présentations et des feuilles de calcul (cf. Figure 10). Les documents dans des formats communs (tels que Microsoft Word, texte brut ou XHTML), ou dans d’autres formats différents, peuvent être convertis en de nombreux formats cibles, y compris LaTex, TEI P5, TXT, XML et RDF. Les types de feuilles de calcul sont limités à quelques formats standard, tels que Microsoft Excel et Open Office, mais les listes de sorties sont plus importante. Les fichiers de présentation sont moins nombreux, mais offrent, par exemple, des conversions intéressantes du genre PowerPoint vers Flash.

Figure 10 : Formats de conversion pris en charge par OxGarage

9.2.2. Omeka : un CMS open source

- Concepteur : Roy Rosenzweig Center for History and New Media, George Mason University (Virginie, Etats-Unis).

- Droits : Open source - Hébergeur : Digital Visuel

- Présentation : Omeka est un logiciel open source, conçu pour la publication sur le web de collections de documents numériques provenant de bibliothèques, de musées ou d’archives. Le logiciel est

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

41

développé depuis 2006 en PHP/MySql par le “Roy Rosenzweig Center for History and New Media”. Il permet la gestion d’archives spécialisées de petite taille (50 à 50000 documents) et offre toutes les fonctionnalités standards d’une archive ouverte : parcours des documents de l’archive, filtrage par mot-clé, par collection, accès aux fichiers, diffusion OAI-PMH des métadonnées. Une recherche simple et une avancée complètent les possibilités de navigation. Un grand nombre d’extensions, dont TEIDisplay, étendent ses fonctionnalités de base, facilitant ainsi la création d’expositions électroniques. L’administration du CMS Omeka permet la gestion de collections, la création d’items (contenu ou document), l’ajout d’un ou plusieurs fichiers pour chaque item (cf. Figure 11). Le type des items peut être précisé : texte, image, son, vidéo, cours, histoire orale, email, site web, lien hypertexte, évènement ou personne, de même que le statut public ou privé, normal ou mis en valeur sur la page d’accueil. Des métadonnées au format Dublin Core sont associées à chaque item et à chaque fichier. Les fichiers peuvent être du type texte (TXT, DOC, PDF, XML, JPG, TIFF), image (GIF, JPEG, PNG, TIFF), son (AIFF, MIDI, MP3, OGG, QT, RA, WAV) ou vidéo (AVI, MPEG, MP4, QT, SWF, WMV).

Figure 11 : modèle opératoire de a plate-forme Omeka

Le projet HumanitéDigitMaghreb ne prétend pas exploiter toutes les fonctionnalités de la plate-forme Omeka, mais fait en sorte que l’organisation des ressources produites sous <oXygen/> soit réalisée par les services techniques d’Omeka et disposés sous forme de collections encodées par des schémas de structures correspondant à des genres littéraires bien identifiés (cf. Figure 12).

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

42

Figure 12 : modèle d’organisation des ressources sur Omeka

9.2.3. L’organisation des ressources produites sur Omeka

Omeka permet un ensemble de fonctionnalités de traitement de ressources :

� Gestion des collections � Gestion de sous-collections � Gestion des items (ou contenu, ou document) � Métadonnées associées à chaque item � Fichiers associés à chaque item � Métadonnées associées à chaque fichier d’un item � Métadonnées ajoutées sur dictionnaire � Ajout de lots de documents – fichiers et métadonnées � Ajout de mots clés en plus de Dublin Core � Statistiques de consultation � Gestion des droits de chaque contenu � Réalisation d’une exposition virtuelle � Extensions pour la saisie de transcriptions en TEI (Text Encoding Initiative)

Parmi les fonctionnalités de consultation, Omeka permet aux utilisateurs externes de consulter l’archive via une interface web qui permet la recherche et le téléchargement de fichiers :

� Recherche simple d’un item � Recherche avancée � Parcourir l’archive � Parcourir une collection ou une sous collection � Affichage de la liste des résultats de recherche et navigation � Visualisation des documents volumineux ou en haute résolution (carte) dans une

visionneuse � Détail d’un item � Parcourir par mots clés

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

43

� Rechercher dans une collection � Visite d’une exposition virtuelle

Omeka repose également sur des fonctionnalités avancées, associées à des protocoles qui permettent les échanges de données et de métadonnées entre machines :

� Moissonnage des métadonnées par le protocole OAI-PMH � Flux RSS � Exposition des métadonnées aux formats du Web sémantique (RDF, RDFa, microdata) � Internationalisation de l’interface qui supporte plusieurs langues � Support du protocole COinS pour le référencement dans Zotero � Adaptation de l’interface aux tablettes et aux Smartphones � Commentaires sur les documents

- La granularité des corpus sur Omeka

Les corpus sur Omeka sont organisés selon plusieurs niveaux d’articulation entre plusieurs composantes documentaires :

� Élément (item) C’est l’unité de base d'un site Omeka. Un élément (article/fichier) peut être n'importe quel type de ressource : une photographie, une œuvre d'art, une personne, une idée. On peut décrire chaque article ou charger des fichiers de métadonnées pour les décrire (encoder). Un site Omeka est enfin de compte l'assemblage de ces éléments. Pour commencer à construire un site Omeka, on doit donc ajouter quelques éléments de contenu appelés articles (items). Un article contient des métadonnées descriptives basées sur le modèle Dublin Core. Les articles peuvent appartenir à une collection ou utilisés dans de multiples expositions.

Figure 13 : Liste d’éléments (items) sur Omeka

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

44

� Collection

C’est un ensemble d'éléments (articles) regroupés autour d’un sujet, thème, type ou toute autre valeur partagée. Les collections peuvent être utilisées dans une variété de contextes qui donnent plus de sens et de visibilité à une archive. Un site Omeka peut avoir plusieurs collections, mais un élément individuel ne peut appartenir qu'à une seule collection à la fois. Dans HumanitéDigitMaghreb, des collections ont été créées pour accueillir des ressources par genre littéraire et artistique (cf. Figure 14).

Figure 14 : Les collections du projet sur Omeka

� Exposition (exhibit)

Omeka a été initialement développé pour répondre aux besoins des musées, des historiens et des éducateurs. Le développement du logiciel au Centre de George Mason d'histoire sociale et des nouveaux médias explique l'une de ses forces majeures : construire des expositions. Toutes les expositions Omeka suivent la même structure. Chaque exposition contient des sections. Chaque section est composée de pages qui contiennent un assortiment d'articles et de textes. Une exposition donnée peut avoir plusieurs sections, permettant ainsi des relations plus complexes entre les objets numériques.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

45

Figure 15 : structure d’exposition sous Omeka

L’intérêt de la fonction « exhibition » réside dans sa capacité à transmettre une perspective de conservation dans un cadre dynamique et interactif qui guide les utilisateurs d'un objet vers un autre. L’exhibition fournit aussi des informations contextuelles de l’article en plus de ses métadonnées et de ses balises de marquage <HTags>.

� Dublin Core Dublin Core est la norme utilisée par Omeka pour décrire les attributs des éléments (i.e. titre, auteur, date de création,…) afin de garder une description cohérente des éléments et des collections. La norme de métadonnées Dublin Core est un ensemble d'éléments simples mais efficaces pour décrire une vaste gamme de ressources en réseau. La norme Dublin Core comprend deux niveaux : un Dublin Core simple et un Dublin Core qualifié. Le Dublin Core simple comprend quinze éléments et le Dublin Core qualifié comprend trois éléments supplémentaires (audience, provenance et détenteur des droits), ainsi qu’un ensemble d'éléments de raffinement (également appelé qualificatifs) pour affiner la sémantique des éléments d'une manière qui peut être utile dans la recherche des ressources. La sémantique du Dublin Core a été établie par un groupe international et interdisciplinaire de professionnels de la bibliothéconomie, l'informatique, l'encodage de texte, la communauté muséale, et d'autres domaines connexes.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

46

Figure 16 : les métadonnées Dublin Core pour chaque élément sur Omeka

� Type d’article (item type)

Les types d'articles (éléments) sont définis par l'utilisateur avec des métadonnées associées. Omeka est livré avec des types d'éléments prédéfinis. Il est toutefois possible de modifier facilement ces types, ou d’en ajouter d’autres. Un élément peut être : - Document (données textuelles) ; - Une image animée ; - Une ressource orale ; - Un fichier son (audio) ; - Une image fixe ; - Un site Web ; - Un événement ; - Un Email ; - Un plan de cours ; - Un lien hypertexte ; - Une personne (données biographiques) ; - Une ressource interactive (formulaires, applets).

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

47

Figure 17 : la liste des types de documents pour le corpus HumanitéDigitMaghreb

� Pages simples

Une page dans un site Omeka ne fait pas partie d'un corpus de textes ou d'une collection de ressources. Une page peut être une page d’accueil, une page d’introduction, d’aide ou une liste d’auteurs contribuant au contenu. Il s’agit de l’ensemble de données de présentation et d’introduction du corpus traité sur Omeka.

Figure 18 : Les pages simples qui servent à l’habillage du site (introduction, cadrage, membres, etc.)

- L’indexation des métadonnées sur Omeka

Indexer veut dire collecter, analyser et stocker des données pour faciliter les recherches rapides et précises. Omeka indexe automatiquement les enregistrements individuels dès

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

48

qu’ils sont créés et enregistrés. L’indexation est nécessaire dès qu’une mise à jour d'une version antérieure d’Omeka est mise en place ou qu’un changement de paramètres d’indexation est effectué. L’indexation des ressources s’accomplie à partir des éléments de métadonnées saisies pour décrire des articles, des collections ou des exhibitions. Dans Omeka version 1.0, un plug-in permet de saisir à la fois des métadonnées Dublin Core et d’ajouter un ensemble d'éléments de métadonnées personnalisées propres à une ou plusieurs ressources. Cette capacité pour des métadonnées extensibles assure à Omeka un degré d’interopérabilité considérable avec les différents standards de métadonnées. Le protocole de moissonnage OAI-PMH (Open Access Initiative-Protocol for Metadata Harvesting) définit un mécanisme pour l’indexation des documents contenant des métadonnées. L'OAI-PMH donne une solution technique simple pour les fournisseurs de données afin de rendre leurs métadonnées accessibles à travers des services basés sur les standards ouverts HTTP (Hypertext Transport Protocol) et XML (Extensible Markup Language). Les métadonnées récoltées peuvent être dans n'importe quel format accepté par une communauté ou par un ensemble de fournisseurs de données et de services. Ainsi, les métadonnées provenant de nombreuses sources peuvent être rassemblées dans une base de données centrale. Des services peuvent ainsi être fournis sur la base de ces métadonnées collectées. Le lien entre ces métadonnées et le contenu associé n'est pas défini par le protocole OAI-PMH, mais par d'autres mécanismes associés de recherche.

Figure 19 : Le protocole OAI-PMH pour le moissonnage des métadonnées descriptives

10. PERSPECTIVES Le projet HumanitésDigitMaghreb augure d’une synergie de recherche-action mise en marche pour atteindre de nouveaux horizons de recherche dans des partenariats plus diversifiés. La dynamique du groupe laisse envisager des perspectives d’ouvertures et de collaborations avec des structures nationales, régionales et internationales dans la recherche sur le numérique et les normes technologiques (ISCC, TGE-ADONIS, AUF, IFIC, ISO, etc.).

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

49

Parmi les pistes d’ouvertures immédiates, il s’agit essentiellement de viser une insertion forte dans la communauté TEI internationale et notamment française (TEI-fr) en inscrivant par exemple le projet auprès du consortium TEI (prenant appui sur Lou Bernard, co-fondateur de la TEI et associé de marque à notre projet). Une deuxième piste à moyen terme, est celle de la traduction des directives de la TEI dans les langues partenaires du projet. Un début de noyau de traduction s’est déjà constitué. Henri Hudrisier traduit en Français une bonne part de la TEI-P5. Rachid Zghibi emboite le pas pour créer une filière de traduction de la TEI-P5 en arabe. Le projet constitue ainsi une passerelle culturelle et technologique collégiale et académique vers les pays du Sud. D’un point de vue « conduite de projets », HumanitéDigitMaghreb ouvre la voie à de nouvelles perspectives de recherche-action collaborative, interdisciplinaire et internationale. Une nouvelle proposition de recherche est en cours de validation dans le cadre de l’appel à projets 2013 de la Maison des Sciences de l’Homme Paris-Nord. Le projet intitulée « TeiEuroMedAppropriation » s’appuie notamment sur des projets déjà engagés à l’ISCC, à l’ITEN-FMSH, dans le cadre de nos contacts AUF et OIF (HumanitéDigitMaghreb de l’ISCC-CNRS, BNFB de l’OIF et 2R2NORMETIC à la MSH Paris Nord). Ce projet a pour objectif de s’associer et de prolonger des projets d’appropriation et d’implication dans la TEI et les bibliothèques numériques plus spécifiquement dans le domaine de la recherche en art (histoire de l’art, musique notamment mais aussi arts picturaux), en littérature et dans certaines sciences sociales (linguistique notamment..). Il vise fondamental à permettre aux travaux scientifiques et aux corpus réalisés en numérique et respectant les recommandations (guidelines) TEI, de devenir de fait transmissibles, cumulables, compatibles en quelques « clics » parce qu’ils sont normalisés et donc inter-compatibles et interopérables. Des voies de partenariats supplémentaires dans le pourtour méditerranéen sont également en cours de constitution avec notamment le Liban, la Grèce, l’Espagne et l’Italie. Des ouvertures plus larges sont envisagées vers l’Afrique subsaharienne et le Canada.

…/…

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

i

11. LES ANNEXES 11.1. ANNEXE 1 : LISTE DÉFINITIVE DES MEMBRES DE L’ÉQUIPE (ORDRE ALPHABÉTIQUE)

ABDELKEFI Hédia Professeur de l’enseignement supérieur Institut Supérieur des Sciences Humaines -Université de Tunis El Manar 26 avenue Dargouth Pacha - Tunis, TUNISIE

BEN HENDA Mokhtar Professeur de l’enseignement supérieur Laboratoire MICA EA-4426, Université Michel de Montaigne, Bordeaux 3 Esplanade des Antilles, 33607 Pessac, France Tél. : + 33 (0)6 60 14 33 87 Courriel : [email protected] http://www.benhenda.com

BEZZAZI Kader Professeur de l’enseignement supérieur Université Mohamed Premier, faculté des Lettres, Centre Universitaire de Langues et Communication 60 000 Oujda, MAROC Tél. : +212 536 50 06 14 Fax : +212 536 50 09 96 Courriel : [email protected] Site Web : http://flo.ump.ma/

BOUKHEROUF Ramdane Doctorant en linguistique Laboratoire « Aménagement et enseignement de la langue amazighe » LAELA Faculté de lettres et langues, Université Mouloud Mammeri de Tizi-Ouzou, ALGÉRIE Site Web : http://www.ummto.dz/spip.php?rubrique523 Tel. : 026411413 Fax : 026411413

BORDE Jean-Michel

Chef d'entreprise – Consultant. Documentation manager - Ingénieur qualité en imagerie documentaire numérique Digital Visuel 28 rue de Moscou 75008 Paris, FRANCE Tél. : 0142931107 – 0670018581 Courriel : [email protected]

BURNARD Lou Chercheur, expert TEI Consultant TGE-Adonis Courriel : [email protected]

CHAMOU Abdellah

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

ii

Doctorant, L’École des Hautes Études en Sciences Sociales, Laboratoire d’Anthropologie Sociale (LAS) 52 rue du cardinal Lemoine, 75005 Paris, FRANCE Tél. : 00 33 (0)1 44 27 17 61 Fax : 00 33 (0)1 44 27 17 66 Courriel : [email protected] http://las.ehess.fr/document.php?id=211

GHRAB Anas Maître-assistant à l'Institut Supérieur de Musique de Sousse Université de Sousse, Rue Abou kacem Chebbi Sousse 4000, TUNISIE Courriel : [email protected] Site Web : http://www.ismso.rnu.tn/index_fichiers/fr/index_fr.htm

HUDRISIER Henri Maître de Conférences, habilité à diriger des recherches Laboratoire Paragraphe Paris 8 (EA349), MSH Paris Nord, Saint-Denis, France Tél. : 33 1 49 40 67 58 Fax : 33 1 49 40 67 83 Courriel : [email protected] Site Web : http://paragraphe.info/

IAZZI El Mehdi Professeur de l’enseignement supérieur Faculté des Lettres et des Sciences Humaines Université Ibn Zohr, Agadir-MAROC Tél. : 00212+528 220 558 / 528220878 / 528221154 Fax : 00212+528221620 Courriel : [email protected] Site Web : http://www.flsh-agadir.ac.ma

MAIGNIEN Yannick Professeur de l’enseignement supérieur Laboratoire TACTIC EA 1738 Université Paris Ouest Nanterre La Défense. Sciences de l’homme et de la société. 12 Passage de la Fonderie 75011 Paris, France

MARTIN DE GUISE Sylvaine Compositrice, musicologue, docteur en sciences de l'information et de la communication, membre du Laboratoire Paragraphe de l'Université de Paris 8, secrétaire de Cartago, et journaliste à l'AILF 47 avenue du Capitaine Glarner 93400 Saint-Ouen

OILLO Didier Directeur du programme « Innovation par les technologies de l’information et de la communication pour l’éducation » Agence Universitaire de la Francophonie

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

iii

AUF direction Monde 4 Place de la Sorbonne, 75005 Paris, FRANCE Tél. : 33 1 44411818

PERRIAULT Jacques Épistémologue, expert en recherche-action ISCC/CNRS Université Paris Ouest Nanterre La Défense

SAADI Hocine Université d'Evry-Val-d'Essonne Département mathématiques Boulevard François Mitterrand 91025 Evry Tél. : 01 69 47 70 00 Courriel : [email protected]

SELLAH Soraya Doctorante, Université Paris Ouest Nanterre La Défense 200 Avenue de la république 92001 Nanterre Cedex, FRANCE Tél. : 01.40.97.72.00

TIGZIRI Nora Professeur de l’enseignement supérieur Laboratoire « Aménagement et enseignement de la langue amazighe » LAELA Faculté de lettres et langues, Université Mouloud Mammeri de Tizi-Ouzou, ALGÉRIE Site Web : http://www.ummto.dz/spip.php?rubrique523 Tél. : 026411413 Fax : 026411413

VAUCELLE Alain Ingénieur R&D Département ARTEMIS, Télécom SudParis, Institut Mines-Télécom 9 rue Charles Fourier 91011 Evry Cedex, FRANCE Tél. : 33 1 60 76 47 47 Fax : 33 1 60 76 43 81 Courriel : [email protected] Site Web : http://artemis.telecom-sudparis.eu

YACINE Tassadit Maître de Conférences – Habilité à diriger des recherches L’École des Hautes Études en Sciences Sociales (EHESS), Laboratoire d’Anthropologie Sociale (LAS) 52 rue du cardinal Lemoine, 75005 Paris, FRANCE Tél. : 00 33 (0)1 44 27 17 61 Fax : 00 33 (0)1 44 27 17 66 Courriel : [email protected] Site web : http://las.ehess.fr/document.php?id=211

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

iv

ZGHIBI Rachid

Maître-Assistant de l’enseignement supérieur Institut Supérieur de Documentation Campus universitaire, 2010 La Manouba, TUNISIE

ZGHIDI Sihem Maître-Assistant de l’enseignement supérieur Institut Supérieur de Documentation Campus universitaire, 2010 La Manouba, TUNISIE

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

v

11.2. ANNEXE 2 : EXTRAITS DE RESSOURCES PRODUITES PAR L’ÉQUIPE DU PROJET La finalité première du projet était de s’approprier un nouvel environnement de travail de structuration de documents numériques par la TEI en travaillant sur des documents choisis selon des critères de spécialisation, de complexité de structure ou de langue. En voici quelques exemples : � Une fable bilingue (AR-FR)

Titre du document : Fables de Loqman le sage [ أمثال للـقـمان آلـحـكيم]

Nature : Fichier Word

Langue : Arabe

Genre littéraire : Fable

Responsable : Rachid ZGHIBI & Sihem ZGHIDI

Schéma TEI : TEI P5 All (schéma générique)

Extrait de la catégorie <TEIHeader>

Extrait de la catégorie <Text>

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

vi

Rendu visuel

Particularité de l’exemple

- Bidirectionnalité du texte - Mise en parallèle de textes bilingues

� Une partition musicale (KA)

Titre du document : Hymne national Kabyle

Nature : Fichier XML

Langue : Kabyle

Genre : Poésie

Responsable : xxx

Schéma TEI : All

Extrait du bloc <TEIHeader> :

<TEI xmlns="http://www.tei-c.org/ns/1.0"> <?xml-stylesheet type="text/css" href="/plugins/TeiDisplay/views/public/css/tei_display_hudima.css" title="tei_display_main" alternate="no"?> <teiHeader> <fileDesc> <titleStmt> <title>Hymne national Kabyle</title> <author/> </titleStmt> <editionStmt> <edition> <date/> </edition> </editionStmt> <publicationStmt> <p>En Kabyle puis traduit en français</p> </publicationStmt> <sourceDesc> <p>source : http://lounes-le-kabyle.skyblog.com/</p> </sourceDesc> </fileDesc> <revisionDesc> <change> <name/> <date/> </change> </revisionDesc>

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

vii

</teiHeader> Extrait du bloc <text>

<text> <body> <table> <row role="label"> <cell n="1">TEXTE KABYLE</cell> <cell n="2">TRADUCTION FRANCAISE</cell> </row> <row> <cell n="1">Kker a mmi-s umazigh !</cell> <cell n="2">Debout fils d'Amazigh !</cell> </row> <row> <cell n="1">I tij nnegh yuli-d,</cell> <cell n="2">Notre soleil s'est levé,</cell> </row> <row> <cell n="1">Atas ayag' ur -t-zrigh,</cell> <cell n="2">Il y a longtemps que que je ne l'avais vu,</cell> </row> <row> <cell n="1">A gma nnuba nnegh tzzid.</cell> <cell n="2">Frère, notre tour est arrivé.</cell> </row> <row> <cell n="1"/> <cell n="2"/> </row> <row> <cell n="1">A zzel an-as i Masinisa :</cell> <cell n="2">Cours dire à Massinissa :</cell> </row> <row> <cell n="1">T amurt is tukwi-d ass a,</cell> <cell n="2">Que son pays est aujourd'hui réveillé,</cell> </row> <row> <cell n="1">Win ur nebgh' ad iqeddem,</cell> <cell n="2">Quand à celui qui ne veut pas avancer,</cell> </row> <row> <cell n="1">Argaz ssegnegh yif izem.</cell> <cell n="2">Qu'un seul de nous vaut plus qu'un lion.</cell> </row> <row> <cell n="1"/> <cell n="2"/> </row> <row> <cell n="1">In-as, in-as i-Yugurta :</cell> <cell n="2">Dis, dis à Yugurtha :</cell> </row> <row> <cell n="1">Arraw-is ur-t-ttunn-ara,</cell> <cell n="2">Que ses enfants ne l'ont pas oublié,</cell> </row>

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

viii

Rendu visuel

Particularité de l’exemple

L’encodage parallèle kabyle-français du chant de l’hymne

� Une partition musicale (FR)

Titre du document : Au clair de la lune Nature : Fichier XML Langue : Français Genre : Musique Responsable : Sylvaine MARTIN DE GUISE Schéma TEI : MEI Extrait du bloc <TEIHeader> :

<?xml version="1.0" encoding="UTF-8"?> <mei xmlns="http://www.music-encoding.org/ns/mei"> <meiHead> <fileDesc> <titleStmt> <title>Au Clair de la lune</title> </titleStmt> <pubStmt> <geogName>France</geogName> </pubStmt> </fileDesc> </meiHead>

Extrait du code <Music>

<music> <body> <mdiv type="chanson"> <score> <scoreDef meter.count="3" meter.unit="4" key.sig="2f" key.mode="dorian"/> <section n="mes1to8"> <measure n="1"> <staff> <layer> <note pname="a" oct="4" dur="4" stem.dir="up" syl="Au"/> <note pname="b" oct="4" dur="4" stem.dir="down" syl="Clair"/> <note pname="b" oct="4" dur="4" stem.dir="up" syl="de"/>

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

ix

</layer> </staff> </measure> <measure n="2"> <staff> <layer> <note pname="g" oct="4" dur="4" stem.dir="up" syl="la"/> <note pname="f" oct="4" dur="4" stem.dir="up" syl="Lu"/> <note pname="g" oct="4" dur="4" stem.dir="up" syl="ne"/> </layer> </staff> </measure> </section> </score> </mdiv> </body> </music> </mei>

Source originale

Particularité de l’exemple

- La granularité du traitement musical au niveau des mesures - Détail de description : forme montantes « up » ou descendantes

« down » des hampes des notes ; formes des ligatures etc.

� Un poème (AR)

Titre du document : Muallaqat Tarafa Ibn El Abd Nature : Fichier Word converti en TEI P5 (Oxgarage) Langue : Arabe Genre littéraire : Poésie Responsable : Rachid ZGHIBI, Zihem ZGHIDI Schéma TEI : TEI Verse Extrait du bloc <TEIHeader> :

<TEI xmlns="http://www.tei-c.org/ns/1.0"> <teiHeader> <fileDesc> <titleStmt> <title>العبد بن طرفة معلقة</title> <author>العبد ابن طرفة</author> </titleStmt> <editionStmt> <edition> <date/> </edition> </editionStmt> <publicationStmt> <p>المعلقات ديوان</p> </publicationStmt>

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

x

<sourceDesc> <p>oXygen</p> </sourceDesc> </fileDesc> <revisionDesc> <change> <name/> <date/> </change> </revisionDesc> </teiHeader>

Extrait du bloc <Text>

<text> <body> <p rend="center">العبد بن طرفة</p> <p rend="center">( ؟٥٤٣ ؟٥٦٩ـ )</p> <p rend="justify"> في آلوشم كباقي تلوح ثهمد بـبرقة أطالل لحولة <p/>آليد ظاهر <p rend="justify">أسى تهلك ال يقولون مطيهم علي صحبي بها وقوفا <p/>وتجلد <p rend="justify">وإنفاقي وبيعي ولذتي آلخمور تشرابي زال وما <p/>ومتلدي طريفي <p rend="justify">إفراد وأفردت كلها آلعشيرة تحامتني أن إلى بد آلمع آلبعير </p> <p rend="justify"> هذاك أهل وال ينكرونني ال غبراء بني رأيت راف <p/>آلممدد آلط <p rend="justify"> أشهد وأن آلوغى أحضر آلالئمي ذا أيها أال يمخلد أنت هل آللذات </p> <p rend="justify"> أبادرها فدعني منيتي دفع تسـتطيع ال كنت فإن <p/>يدي ملكت بما <p rend="center">Tarafa Ibn al-‘Abd</p> <p rend="center">(543 ?-569 ?)</p> <p rend="justify">(Du campement) de Khalwa (sont) les vestiges dans le désert de Thahmad</p> <p rend="justify">(Qui) brillent comme un reste de tatouage sur le revers de la main,</p> <p rend="justify"> Mes compagnons arrêtant leurs montures près de moi</p> <p rend="justify">(Me) disent : « ne meurs pas de chagrin, patience ! »,</p> <p rend="justify">Je ne cesse de gouter aux vins et au plaisir Et vendre et dilapider patrimoine et héritage, </p> <p rend="justify">Jusqu’à ce que toute la tribu ne m’évite Et m’isole (comme) on isole un chameau galeux,</p> <p rend="justify">J’ai vu les miséreux (<hi rend="italic">litt.</hi> les fils de la poussière) ne pas me renier Pas plus que les gens de cette vaste tente,</p> <p rend="justify">Toi qui me blâmes d’être présent à la guerre Et d’invoquer les plaisirs est-ce que tu m’assureras l’éternité <hi rend="italic">(litt.</hi> es-tu mon éternité) Et si tu ne peux provoquer mon trépas</p> <p rend="justify">Laisse-moi l’avancer avec ce que ma main possède</p> </body> </text> </TEI>

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xi

Rendu visuel

Complexité de l’exemple

- Bidirectionnalité et alignement du texte arabe et de sa traduction - Gestion des espaces entre les hémistiches d’un même vers (typique à la

poésie classique arabe (et anglaise) mais non connue dans la poésie française)

� Une scène de théâtre (FR)

Titre du document : Le Roi UBU Nature : Fichier Word (converti en TEI P5 XML par Oxgarage) Langue : Français Genre littéraire : Théâtre Réalisation : Schéma TEI : Performance Extrait du bloc <TEIHeader> :

<TEIxmlns="http://www.tei-c.org/ns/1.0"> <teiHeader>

<fileDesc> <titleStmt>

<title>Le Roi UBU</title> <author/>

</titleStmt> <editionStmt>

<edition> <date/>

</edition> </editionStmt> <publicationStmt>

<p>no publication statement available</p> </publicationStmt>

<sourceDesc> <p>WrittenbyoXygen</p>

</sourceDesc> </fileDesc> <revisionDesc>

<change>

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xii

<name/> <date/>

</change> </revisionDesc>

</teiHeader> Extrait du bloc <Text>

<text> <body> <div type="div1" rend="P4"> <head>Scène VI</head> </div> <div type="div1"> <head> <hi rend="italic">Le palais du roi</hi>.</head> <p>LE ROI VENCESLAS, entouré de ses officiers; BORDURE; les fils du roi, BOLESLAS, LADISLAS &amp; BOUGRELAS. Puis UBU.</p> <div type="div2"> <head>Père Ubu (entrant) :</head> <p>Oh! vous savez, ce n'est pas moi, c'est la mère Ubu et Bordure.</p> </div> <div type="div2"> <head>Le Roi :</head> <p>Qu'as-tu, Père Ubu?</p> </div> <div type="div2"> <head>Bordure :</head> <p>Il a trop bu.</p> </div> <div type="div2"> <head>Le Roi :</head> <p>Comme moi ce matin.</p> </div> <div type="div2"> <head>Père Ubu :</head> <p>Oui, je suis saoul, c'est parce que j'ai bu trop de vin de France.</p> </div> <div type="div2"> <head>Le Roi :</head> <p>Père Ubu, je tiens à récompenser tes nombreux services comme capitaine de dragons, et je te fais aujourd'hui comte de Sandomir.</p> </div> <div type="div2"> <head>Père Ubu :</head> <p>O monsieur Venceslas, je ne sais comment vous remercier.</p> </div> <div type="div2"> <head>Le Roi :</head> <p>Ne me remercie pas, Père Ubu, et trouve-toi demain matin à la grande revue.</p> </div> <div type="div2"> <head>Père Ubu :</head> <p>J'y serai, mais acceptez, de grâce, ce petit mirliton.</p> <p rend="center"> <hi rend="italic">(Il présente au roi un mirliton)</hi> </p> </div> <div type="div2"> <head>Le Roi :</head> <p>Que veux-tu à mon âge que je fasse d'un mirliton? Je le donnerai à Bougrelas.</p> </div> <div type="div2"> <head>Le jeune Bougrelas :</head> <p>Est-il bête, ce Père Ubu.</p> </div> <div type="div2"> <head>Père Ubu :</head> <p>Et maintenant je vais foutre le camp.<hi rend="italic"> (Il tombe en se retournant.)

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xiii

</hi>Oh! aïe! au secours! De par ma chandelle verte, je me suis rompu l'intestin et crevé la bouzine!</p> </div> <div type="div2"> <head>Le Roi (le relevant) :</head> <p>Père Ubu, vous estes-vous fait mal?</p> </div> <div type="div2"> <head>Père Ubu :</head> <p>Oui certes, et je vais sûrement crever. Que deviendra la Mère Ubu?</p> </div> <div type="div2"> <head>Le Roi :</head> <p>Nous pourvoirons à son entretien.</p> </div> <div type="div2"> <head>Père Ubu :</head> <p>Vous avez bien de la bonté de reste. (<hi rend="italic">Il sort.)</hi> Oui, mais, roi Venceslas, tu n'en seras pas moins massacré.</p> </div> </div> </body> </text>

Rendu visuel

Complexité de l’exemple

- Adapter au schéma TEI Performance (Drama) - Encoder les spécificités théâtrales (didascalies, scènes, acteurs,…)

� Un apparat critique (AR)

Titre du document :

[Epître de Yahya ibn al-Munajjm sur la musique] رسالة يحيى بن المنجم

Nature : Fichier Word (converti en TEI P5 XML par Oxgarage)

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xiv

Langue : Arabe Genre littéraire : Catalogue de manuscrit de musique Réalisation : Anas GHRAB Schéma TEI : All Extrait du bloc <TEIHeader> :

<teiHeader> <fileDesc xml:idx="001"> <titleStmt> <title type="full"> <title type="main">المنجم بن يحيى رسالة</title> <title type="sub">Titre translitéré</title> <title type="alt">Epître de Yahya ibn al-Munajjm sur la musique</title> </title> <author> <persName> <forename>يحيى</forename> <genName>يحيى بن</genName> <surname>المنجم بن</surname> <addName></addName> </persName> <date>... <placeName> <settlement type="city">...</settlement> <country>...</country> </placeName> </date> <date>... <placeName> <settlement type="city">...</settlement> <country>...</country> </placeName> </date> </author> <respStmt> <resp>تحقيق</resp> <persName>غراب أنس</persName> </respStmt> </titleStmt> <publicationStmt>

Extrait du bloc <Text>

<text> <front> <div type="abstract"> <head>وصف محتوى الكتاب</head> </div> <div type="contents"> <head>فهرس الكتاب</head> </div> </front> <body> <p xml:idx="001"> حيم حمان الر الر bبسم ا </p> <p xml:idx="002"> م مولى أمير المؤمنين المعتضد باb في الموسيقى رسالة يحيى بن علي بن يحيى المنج</p> <p xml:idx="003">

لنغم وعددها، ، ونصف اآلن أمر اابنا الذي قبل هذا صفة المغني، وما يجب أن يكون عليه، ووصفنا ما فيه نهاية من ذلك نقول قد ذكرنا في كت اه إسحاق بن ابراهيم اوما يأتلف منها ويختلف، ومواقع اصبع اصبع من وتر وت « لموصلي ر، وموضع كل نغمة من كل دستان، ونبين ما سم

ي مثل إسحاق اب الغناء العرب في األصوات التي رسم بعضها بمجرى الوسطى، وبعضها بمجرى البنصر، واختالف ما بين أصح » المجرى ن ونظرائه مم

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xv

<app> <lem> جمع</lem> <rdg wit="#Ram">جميع</rdg> </app> ناعة والعمل، وبين أصحاب الموسيقى من الفالسفة القدماء في عدد النغم إذ ك شر وكان إسحاق ونظراؤه يزعمون أن النغم ع ان العلم بالص أصحاب الموسيقى يزعمون أنها ثماني عشرة، <app> <lem>. وبعدها شرح لما يجمع األلحان واألنغام</lem> <rdg wit="#Ram"> فهاموبعده شرح ما يجمع االلحار واال </rdg> <rdg wit="#BM">ونقدمه شرح بما يجتمع االلحار واالفهام</rdg> <rdg wit="#Zak">ونقدم شرح ما يجتمع األلحان واألنغام</rdg> </app>

Rendu visuel

Complexité de l’exemple

- Traitement des apparats critiques du texte

Ces exemples sont extraits des ressources numérisées et déposées sur la plate-forme Omeka (www.hudima.org). Elles sont insérées dans ce rapport dans leur état brut. Des améliorations de leur encodage sont supposées descendre à des niveaux de granularité plus profonde et des encodages TEI plus détaillées.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xvi

11.3. ANNEXE 3 : PRODUCTIVITÉ CONNEXE AU PROJET Les fiches suivantes sont celles des participations des membres du projet dans des manifestations scientifiques (séminaires, colloques, cours, ateliers, formations, etc.) en étroite relation avec le projet HumanitéDigitMaghreb :

Intervenant(s) HUDRISIER Henri

Titre TEI & Humanités digitales

Type Conférence inaugurale

Résumé Notre intérêt pour la communauté de la TEI traduit notre conviction qu’elle représente un mouvement « néo-Humaniste » qui se singularise dans la combinaison entre les technologies et la réflexion approfondie sur les textes, les patrimoines intellectuels et leur diffusion. À l’instar des humanistes de la Renaissance, cette communauté estime que la clef du progrès dans l’intelligence culturelle des textes (mais aussi dans leur diffusion et leur conservation) est à la fois technique et intellectuelle. Comme l’Humanisme de la Renaissance, elle s’inscrit (ou plutôt elle naît) au sein d’un vaste mouvement de refondation des Humanités sous la forme clairement affirmée d’Humanités digitales. Les premiers pionniers de la TEI ont ainsi adopté très tôt la philosophie des documents structurés. La TEI n’est pas uniquement un référentiel technique d’un format d’encodage ou d’échange de textes numériques en sciences humaines et sociales (SHS). Elle constitue aussi une grande communauté de pratiques polyvalentes, structurée en sous communautés spécialisées se rencontrant autour de conventions communes et interopérables. Après plus de 20 ans d’existence, cette méta-communauté représente aujourd’hui un modèle de réussite du travail collaboratif extrêmement interdisciplinaire entre chercheurs.

Intervenant BEN HENDA Mokhtar

Titre TIC et référentiels normatifs dans la construction d’un nouveau contexte de

recherche en Art et Humanités

Type Conférence inaugurale

Résumé Grâce aux TIC et à la normalisation des accès et des échanges sur les réseaux de transmission des données, toutes les disciplines ont désormais des chances égales pour se réorganiser et se restructurer dans le nouvel espace interdisciplinaire de notre société du savoir. Les Arts et les SHS ont été très vite inscrits dans les enjeux de la mondialisation grâce à des projets comme les Humanités Digitales. Or, le défi actuel des HD est que leurs principes et méthodes soient accessibles aux communautés de pratique dans le plus grand nombre de pays émergents. Dans ce papier, il est question d’explorer quelques-uns de ces principes et méthodes et de découvrir le lien qu’ils peuvent avoir avec les Arts et les SHS. Le papier prend le contexte tunisien comme socle d’analyse pour étudier et proposer des alternatives stratégiques et procédurales pour optimiser

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xvii

l’application des référentiels normatifs au profit de la recherche dans les domaines des Arts et des Sciences humaines et sociales.

Intervenante ZGHIDI Sihem

Titre Le TEI header : élément indispensable pour l’identification, récupération et

interopérabilité des documents électroniques

Type Table ronde

Résumé Dans l’objectif de constituer un corpus documentaire électronique accessible et facilement identifiable et partageable, il est indispensable de procéder à son indexation par des métadonnées. Il s’agit d’un ensemble des données structurées situées au sein d'un document (ou qui lui sont associées par une DTD) afin de le décrire. La TEI applique cette règle à travers l’élément entête <TeiHeader>. L’en-tête ou le header est la partie qui contient les éléments métadonnées et qui répertorie des renseignements semblables à ceux qu’on trouverait sur une page titre d’un document imprimé. Cette partie joue principalement le rôle d'identifiant du document. Elle se divise en quatre sections : 1. <fileDesc> : Description bibliographique de la ressource (titre, auteur, édition,

éditeur, conditions juridique de distribution, taille, etc.) 2. <encodingDesc> : Renseignements sur la manière dont le texte a été encodé. 3. <profileDesc> : Autres types d’indications au sujet de la ressource (langue,

participants à la création, thèmes abordés, etc.) 4. <revisionDesc> : Mises à jour effectuées sur la ressource et les responsables de

sa modification. Cependant, ces éléments ne sont pas tous obligatoires pour la description d’un document électronique. Seulement une partie est absolument requise ; celle définie par le header minimal, qui doit contenir le nom du texte électronique et son auteur.

Intervenant ZGHIBI Rachid

Titre La norme TEI : la création et l’échange des données textuelles électroniques

Type Table ronde

Résumé La norme TEI propose des solutions d’encodage XML des textes sous forme numérique. Elle vise à rendre compte de l’organisation logique d’un texte et à reconstituer son arborescence hiérarchique : divisions, chapitres, sous-chapitres, sections jusqu’à ses parties les plus complexes. Grâce à son système modulaire, elle permet de choisir des ensembles d’éléments répondant aux besoins d’encodage d’un type particulier de texte : poésie, pièces de théâtre, dictionnaires, corpus linguistiques, manuscrits, transcriptions de discours oraux, etc. La norme TEI utilise le codage Unicode comme jeu des caractères par défaut (UTF-8) ce qui permet de créer et d’échanger des documents électroniques multilingues et multiscripturaux. A l’heure actuelle, la TEI est largement utilisée dans les milieux de la Recherche en Sciences humaines (linguistique, histoire, lettres, etc.), dans l'édition électronique et dans certaines bibliothèques numériques. Dans le cadre de cet atelier, il a été intéressant de programmer une petite démonstration sur la création d’un type des documents littéraires en langage TEI.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xviii

Intervenante MARTIN DE GUISE Sylvaine

Titre La MEI

Type Table ronde

Résumé MEI Music Encoding Initiative, qu'on peut traduire par Norme d'encodage musical, est née d'un effort commun afin de donner une représentation symbolique numérique, acceptée par tous, des documents musicaux présentés sous forme de notation musicale. Ainsi la norme MEI sert à traduire en langage informatique de balisage générique l'ensemble des aspects et caractéristiques musicaux habituellement décrits dans la notation des œuvres musicales. De même qu'il existe différentes sortes de notation musicale dans le monde, la norme MEI a été conçue pour pouvoir accommoder l'ensemble des types de notation musicale développés par les différentes cultures. Cependant, dans le cadre de cet atelier, il a été plus facile, pour commencer, d'aborder les aspects qui sont communs à la grande majorité des notations musicales, c'est-à-dire les hauteurs, les rythmes et les formes musicales que toute notation décrit habituellement dans une œuvre musicale.

Intervenant GHRAB Anas

Titre Mise en place d’un catalogue extensible des manuscrits arabes sur la

musique Type Table ronde Résumé La mise en place d’un catalogue extensible des textes arabes sur la musique est

un projet ambitieux. Son existence s’impose par l’évolution des disciplines musicologiques et philologiques puisant dans les sources textuelles arabes. Les premiers catalogues sont nés au XIXe s., ont connu un développement important au cours du XXe s. et cette activité ne peut que continuer à se développer au cours du XXIe s. en s’adaptant aux exigences de la recherche actuelle. Nous résumons ces exigences en trois points essentiels : 1. Le catalogue en ligne doit intégrer toutes les données présentes dans le catalogue en papier et faciliter leur consultation ; 2. Il devrait être extensible afin d’intégrer lui-même les éditions critiques des textes ; 3. L’édition des données du catalogue et des éditions critiques doit pouvoir se faire dans le cadre d’un travail collaboratif entre plusieurs chercheurs. Nous aborderons ici les deux premiers points en étudiant la possibilité d’utiliser le standard TEI comme solution technique pouvant répondre à ces exigences. À cette fin, nous allons brièvement présenter l’organisation des catalogues existants et la nature des textes catalogués et nous récapitulerons ensuite les éléments nécessaires à la réalisation d’une édition critique en langue arabe correspondant à.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xix

Intervenant BEN HENDA Mokhtar

Titre TEI et Humanités Digitales, un cadre de convergence pour les corpus d’Arts et de

Sciences humaines et sociales multilingues et multidisciplinaires : retour d’expérience du projet « HumanitéDigitMaghreb ».

Type Communication

Résumé HumanitésDigitMaghreb est une recherche-action dans laquelle sont engagés des acteurs de terrains (linguistes, artistes, musicologues, chercheurs en littérature, culture, histoire tant française qu’arabe ou berbère) soucieux d’inscrire leurs pratiques dans l’organisation rationnelle de corpus numériques répondant aux recommandations mondiales des réseaux de bibliothèques numériques (OCLC) et des Humanités digitales l’ADHO (Alliance of Digital Humanities Organizations). Ces acteurs de terrains sont associés avec des praticiens de la coopération francophone numérique, des spécialistes de l’information et de la communication, des fondateurs de la TEI et des Humanités digitales en France, des spécialistes de l’appropriation des usages du numérique et plus spécifiquement des patrimoines numériques.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xx

Intervenante TIGZIRI Noura,

Titre Base de données kabyles : collecte de données et applications

Type Communication

Résumé Les logiciels d’annotation des corpus écrits sont déjà anciens et ils ne permettent pas toujours d’aboutir à un balisage robuste. L’annotation des corpus oraux est plus récente et pose encore de très nombreux problèmes auxquels il faut réfléchir pour y apporter des solutions. Les techniques de conservation des corpus, leur accessibilité à travers le net, les problèmes juridiques liés à la publication de ces corpus qu’ils soient écrits ou oraux sont des questions d’actualité qui appellent une réflexion et concertation avec tous les spécialistes du domaine.

Intervenante MARTIN DE GUISE Sylvaine

Titre La MEI – Music Encoding Initiative

Type Communication

Résumé La MEI – Music Encoding Initiative – a été développée selon le même principe que la TEI – Text Encoding Initiative – c’est-à-dire en poursuivant la volonté d’offrir un standard qui permette de rendre et d’émettre des textes, ici musicaux, qui soient lisibles sur toutes les machines (ordinateurs) et qui puissent comporter une variété d’information particulièrement exhaustive. Par exemple, la MEI autorise désormais, non seulement de réaliser en langage à balises le texte des partitions musicales, mais aussi de commenter ces partitions, de fond en comble, d'en présenter des analyses fines et variées qui soient incluses dans le document MEI lui-même et de proposer en même temps les clés de ces analyses. Si la MEI s'est d'abord appuyée sur les caractéristiques de la musique occidentale, typiquement « écrites », pour distinguer des catégories musicales, elle a développé par la suite autant de moyens pour étudier les musiques « orales » et aborder leurs caractéristiques fondamentales, par exemple les micro-intervalles. C'est à ce titre que la MEI, qui montre une capacité et une souplesse remarquable à s'adapter aux musiques de toute origine, dans le cas présent les musiques amazighes et arabes d'Algérie, devient un outil incontournable au XXIe siècle pour faciliter la compréhension et la comparaison des musiques du monde.

Intervenant CHAMOU Abdellah

Titre PHON, un outil indispensable pour la transcription des corpus oraux

Type Communication

Résumé S’il est l’outil, favoris, des phonologues, il n’en demeure pas utile pour les humanités digitales. Phon est un logiciel, facilitant grandement l’analyse des

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxi

données. Construit, de prime abord, pour les recherches portant sur l’acquisition de la langue première (le babillage). Sa finesse, dans les possibilités d’exploitation, ne peut qu’enrichir l’encodage des corpus oraux. Phon supporte le liage de fichiers audio/vidéo, la segmentation des unités, la transcription en mode multi-aveugle, l’étiquetage automatique (traits, syllabation), et la comparaison systématique entre formes cibles (modèles) et actuelles (produites). Phon, fournit une interface graphique conviviale, à partir de laquelle peuvent être exploitées plusieurs bases simultanément. Ce logiciel fonctionne sur Mac OS X et Windows et est compatible avec le format XML de CHILDES (TalkBank). Phon est un outil gratuit dont le code source est ouvert. Il facilite les échanges entre les chercheurs et est utilisé pour l’élaboration de la base de données partagée PhonBank, une nouvelle initiative au sein de CHILDES pour supporter les besoins empiriques de la recherche dans tous les domaines en acquisition de la phonologie, entre autres. Sans pour autant prétendre à une véritable révolution et s’inscrivant dans la lignée des logiciels adoptés dans le domaine scientifique, Phon apporte une solution à bien des difficultés inhérentes à la transcription.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxii

Intervenants HUDRISIER Henri, ZGHIBI Rachid, ZGHIDI Sihem, BEN HENDA Mokhtar,

Titre Promoting the linguistic diversity of TEI in the Maghreb and the Arab region

Type Communication

Résumé Depuis des siècles, la région du Maghreb connait une hybridation linguistique importante qui impacte lentement sur son patrimoine culturel. Au-delà des strates libyques, latines, ottomanes se sont accumulées des quantités non négligeables de ressources dans plusieurs cultures linguistiques soit dérivées de l’arabe classique (dialectes régionaux), soit dans divers dialectes berbères (kabyle par exemple). Plusieurs ressources sont même composées simultanément en plusieurs langues d’usage courant ou réservé (arabe littéraire, arabe dialectal, français, anglais, berbère) comme les journaux, l’imprimerie de ville, les supports publicitaires, la littérature populaire, les contes, les manuels d’apprentissage des langues parlées, etc. Ces documents sont souvent écrits dans une graphie hybride mélangeant à la fois l’arabe classique et vernaculaire, ou des formes de translittération latin-arabe ou arabe-latin voire aussi en tifinagh (écriture berbère traditionnelle) notamment au Maroc. Contrairement à beaucoup de ressources textuelles classiques (documents conventionnels imprimés et manuscrits médiévaux), il n’existe pas aujourd’hui de vaste corpus de textes en langues vernaculaires. Notre hypothèse est que le seul fait de faire connaître cette diversité des ressources textuelles aurait pour effet d’augmenter de façon exponentielle et dans un proche avenir le nombre de chercheurs susceptibles de s’intéresser au recueil des fonds anciens classiques, des corpus oraux et à l’étude de ces littératures plurielles. Le format de codage standard que constitue la TEI, présente une opportunité unique, celle de créer ces ressources en garantissant leur intégration dans le patrimoine culturel général et leur réutilisabilité avec une flexibilité technique maximale. Le projet « HumanitéDigitMaghreb » qui fait l’objet de cette intervention, a pour objet d’étudier la faisabilité, et d’amorcer l’appropriation de méthodes permettant de répondre à plusieurs aspects de ces objectifs de recherche.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxiii

11.4. ANNEXE 4 : GLOSSAIRE DES HUMANITÉS DIGITALES ACH Association for Computers and the Humanities (Association pour

l'informatique et les sciences humaines) est le membre américain du consortium de l'Alliance des Organisations des Humanités digitales (ADHO*). C’est une société professionnelle dans le domaine des sciences humaines numériques qui soutient et diffuse la recherche par des conférences, des publications et des activités de sensibilisation. L’ACH est basée aux États-Unis, mais bénéficie d'une large adhésion internationale (environ 21 pays à travers le monde). Ses partenaires sont l'Association de la Littérature et de la Linguistique Computationnelle (ALLC*), la Société des Humanités digitales / Société pour l'Étude des Médias Interactifs (SDH/SEMI). Comme membre de l’ADHO, l’ACH parraine des publications, des événements et des activités de soutien des humanités numériques.

ADHO Alliance of Digital Humanities Organizations (Alliance des Organisations des Humanités digitales) est une organisation dont les objectifs sont la promotion et le soutien de la recherche et de l'enseignement numérique à travers les arts et les disciplines des sciences humaines rassemblant les humanistes engagés dans la recherche assistée par ordinateur, l'enseignement, la création, la diffusion. L’ADHO encourage et appuie la recherche et l'enseignement numérique à travers tous les arts et les disciplines des sciences humaines, agissant comme une force consultative communautaire pour soutenir l'excellence dans la recherche, la publication, la collaboration et la formation.

BarCamp Un BarCamp est une rencontre, une non-conférence ouverte qui prend la forme d’ateliers-événements participatifs dont le contenu est fourni par les participants qui sont tous placés, à un titre ou à un autre, en situation de contribuer et d’apporter quelque chose au Barcamp. Le principe est que chaque barcamper/euse peut être actif et participant, et qu’il/elle est encouragé à prendre l’initiative.

Communauté de pratique

« Une communauté de pratique concerne des groupes de personnes qui partagent un intérêt commun ou une passion qu'ils pratiquent et apprennent à faire d'une meilleure façon en s'interagissant régulièrement » (Winger).

Corpus Recueil réunissant ou se proposant de réunir, en vue de leur étude et conservation, la totalité des documents disponibles d'un genre donné, par exemple épigraphiques, littéraires, etc.

CSS Les feuilles de styles (en anglais "Cascading Style Sheets", abrégé CSS) sont un langage logiciel qui permet de gérer la présentation d'une page Web. Le langage CSS est une recommandation du World Wide Web Consortium.

DARIAH-EU Digital Research Infrastructure for the Arts and Humanities. DARIAH-Eu est un projet de recherche européen sur l'accès à long terme et l'utilisation des données numériques de recherche européennes dans les arts et les lettres.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxiv

Dublin Core Norme de description simple des ressources d'information électronique. La

norme Dublin Core comprend un jeu de 16 éléments (comme le titre, l'auteur, le format, la langue ou l'audience) qui permettent de décrire de manière simple mais efficace une ressource d'information électronique.

Encodage Ensemble de règles définissant une correspondance biunivoque entre des informations et leur représentation par des caractères, des symboles ou des éléments de signal.

Exhibition Sur Omeka, l’exhibition (dans le sens exposition) est composée d’éléments (articles) réunis autour d’un thème dans une structure ordonnée et hiérarchisée en sections et pages.

Genre littéraire “Un genre littéraire est une notion de type catégorielle qui permet de classer des productions littéraires en prenant en compte des aspects de forme (genre poétique, genre narratif ou genre dramatique), de contenu (entre autres : roman d'aventure, journal intime, théâtre de boulevard, etc.), ou encore de registre (fantastique, tragique, comique notamment). Divers critères pouvant se combiner et se chevaucher pour déterminer des catégories secondaires, la liste des genres n’étant en effet pas close. Le débat sur la constitution des genres littéraires existe depuis Platon et surtout depuis l'ouvrage majeur en la matière d'Aristote : la Poétique” (Wikipédia). Pour ce qui nous concerne dans HumanitéDigitMaghreb, le débat toujours ouvert sur les subtilités de typologie en genres littéraires n’a d’intérêt que s’il nous permet de façon pragmatique et opératoire d’appliquer sur tel ou tel fragment de ressource littéraire un modèle TEI spécifique à un genre : éventuellement deux ou plusieurs modèles associés (par exemple du théâtre en vers (2 modèles TEI) ; plus complexe mais bien réel : une citation de théâtre en vers dans un dictionnaire littéraire (3 modèles TEI). Notons aussi, qu’il existe de nombreux exemples de manuels scientifiques mis en vers pour des raisons mnémotechniques : par exemple l’école de médecine de Salerne en Italie à la Renaissance mais des traditions similaires existe en arabe.

Humanités digitales En France, une proposition de définition a été élaborée lors du THATCamp des 18 et 19 mai 2010 sous la forme d'un « Manifeste des digital humanities » : « les digital humanities concernent l'ensemble des sciences humaines et sociales, des arts et des Lettres. Les digital humanities ne font pas table rase du passé. Elles s’appuient, au contraire, sur l’ensemble des paradigmes, savoir-faire et connaissances propres à ces disciplines, tout en mobilisant les outils et les perspectives singulières du champ du numérique. Les digital humanities désignent une transdiscipline, porteuse des méthodes, des dispositifs et des perspectives heuristiques liés au numérique dans le domaine des sciences humaines et sociales. »

Linguistique computationnelle

La branche de la linguistique dans laquelle les techniques de l'informatique sont appliquées à l'analyse et à la synthèse de la parole et du langage.

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxv

MEI Music Encoding Initiative (MEI) est un effort communautaire visant à définir des lignes directrices pour l'encodage des documents musicaux dans une structure lisible par machine. La MEI, comme la TEI, est un terme générique pour décrire simultanément une organisation, une communauté de recherche, et un langage de balisage qui réunit des spécialistes de diverses communautés de recherche en musique, y compris les techniciens, bibliothécaires, historiens et théoriciens dans un effort commun pour discuter et définir les meilleures pratiques pour représenter un large éventail de documents et de structures musicales. Les résultats de ces discussions sont ensuite formalisés dans le schéma MEI, un ensemble de base composé de règles pour l'enregistrement des caractéristiques physiques et intellectuelles des documents de notation musicale.

Métadonnées Littéralement, une métadonnée est une donnée à propos d'une autre donnée. Il est plus juste de voir les métadonnées comme un jeu ou un ensemble structuré d'informations décrivant une ressource quelconque. Des livres dans une bibliothèque sont par exemple décrits avec le jeu de métadonnées de la norme ISBD (International Standard Book Description). Les métadonnées peuvent ainsi permettre d'organiser une collection de ressources (inventaire interne) et de découvrir des ressources (moteur de recherche). Dans le cadre de la recherche d’information, les métadonnées associées à une ressource peuvent aussi permettre aux utilisateurs de mieux juger de la pertinence des résultats. En matière de standards de métadonnées sur le Web, on citera le jeu du Dublin Core, de plus en plus largement utilisé.

Open Source La désignation open source s'applique aux logiciels dits « libres » dont la licence respecte des critères précisément établis par l'Open Source Initiative, c'est-à-dire la possibilité de libre redistribution, d'accès au code source et aux travaux dérivés.

RSS Un fil RSS désigne un fil d'informations au contenu structuré en XML. Il rassemble les dernières informations mises en ligne d'un site et peut être affiché sous divers formats : RSS, RSS2, ATOM. Le lien vers le fil d'informations d'un site est généralement affiché sous la forme de l'icône Syndication de contenu.

SGML Standard Generalized Markup Language : langage généralisé de marquage. C’est un système de balisage pour organiser et marquer des éléments d'un document. SGML a été élaboré et normalisé par l'Organisation internationale de normalisation (ISO) en 1986. SGML ne spécifie aucune forme particulière, mais plutôt, précise les règles pour les éléments de marquage qui peuvent ensuite être interprétés comme éléments de format de différentes manières.

TEI La TEI (Text Encoding Initiative) que l'on pourrait traduire par « groupe d'initiative pour le balisage normalisé des textes » est une norme de balisage, de notation et d'échange de corpus des documents électroniques fondée sur le SGML*. Elle s'est élaborée pragmatiquement à partir des besoins de structuration, de conceptualisation et de mise en réseau de textes (Romary, Hudrisier).

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxvi

TEIHeader L'en-tête TEI (TEIHeader) est la notice bibliographique d’un fichier informatique qui conserve des éléments d’information sur le fichier en question. Il est l'un des aspects les plus importants de n'importe quel fichier TEI. Le TEIHeader comporte quatre composantes principales : 1. <fileDesc> (description du fichier) contient une description

bibliographique complète d'un fichier électronique ; 2. <encodingDesc> (description d'encodage) documente la relation entre

un texte électronique et la ou les sources d'où il provient ; 3. <profiledesc> (texte de description de profil) fournit une description

détaillée des aspects non bibliographiques d'un texte, en particulier les langues et variétés de langues utilisées, la situation dans laquelle elle a été produite, les participants et leur environnement. (à peu près tout ce qui n’est pas couverts dans les autres éléments d'en-tête) ;

4. <revisionDesc> (la description de révision) résume l'historique des révisions d'un fichier.

THATcamp Un ThatCamp – The Humanities and Technology Camp – est une rencontre qui permet aux acteurs de la recherche en sciences humaines et sociales utilisant des technologies numériques de partager informations, idées, solutions et savoir-faire autour de leurs pratiques. Les ThatCamps sont organisés par les participants eux-mêmes. Le programme n’est pas établi à l’avance mais construit directement sur place. Un ThatCamp n’est pas constitué de conférences ex cathedra mais prend la forme d’atelier où tous les participants sont invités à partager leurs connaissances.

Tifinagh Tifiniagh ou libyco-berbère est un alphabet utilisé par les Berbères, essentiellement les Touaregs. C'était autrefois un abjad, un alphabet consonantique. Cet alphabet a subi des modifications et des variations inévitables depuis son origine jusqu'à nos jours, passant du libyque jusqu'aux néotifinaghs en passant par le tifinagh saharien et les tifinaghs Touaregs.

Unconference Une «conférence» qui ne suit pas la structure générale d'une conférence. L'idée est de permettre à un calendrier dynamique où les participants décident à la volée ce que les séances auront lieu et les sujets qui seront discutés. Il n’y pas de papiers présentés. Au contraire, tout est discuté et axée sur la pratique. A “conference” that doesn’t follow the general structure of a conference. The idea is to allow for a dynamic schedule where participants decide on the fly what sessions will be held and what topics will be discussed. No papers are presented. No talks are given. Rather, everything is discussion and practice-based.

XML Extensible Markup Language. La norme XML est un outil permettant de définir un langage (on dit alors qu'il s'agit d'un métalangage), permettant de créer des documents structurés à l'aide de balises. XML est un sous ensemble de SGML (Standard Generalized Markup Language), défini par le standard ISO8879 en 1986, utilisé dans le milieu de la Gestion Electronique Documentaire (GED). XML reprend la majeure partie des fonctionnalités de SGML, il s'agit donc d'une simplification de SGML afin

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxvii

de le rendre utilisable sur le web.

XSL XSL est un langage permettant de définir des feuilles de style pour les documents XML au même titre que les CSS (Cascading StyleSheets) pour le langage HTML ou bien DSSSL (Document Style Semantics and Specification Language) pour le SGML.

XSLT XSLT permet de transformer les documents XML à l'aide de feuilles de style contenant des règles appelées template rules (ou règles de gabarit en français).

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxviii

11.5. ANNEXE 5 : ACRONYMES DES HUMANITÉS DIGITALES

ACH Association for Computers and the Humanities

ADHO Alliance of Digital Humanities Organizations

CSS Cascading Style Sheet

DAH Digital Arts and Humanities

DARIAH-EU Digital Research Infrastructure for the Arts and Humanities

DHO Digital Humanities Observatory

TGE-Adonis Très Grand Equippement-Adonis

MEI Music Encoding Initiative

SDH Society for Digital Humanities

TEI Text Encoding Initiative

THATcamp The Humanities and Technology camp

XML Extensible Markup Language

XSL eXtended Sructured Language

SGML Standard generalized Mark-up Language

THATCamp The Humanities and Technology Camp

XSLT eXtended Structured Language Transformation

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxix

11.6. ANNEXE 6 : CARTOGRAPHIE DES HUMANITÉS DIGITALES

- Dans le monde

Figure 20 : carte des Humanités digitales dans lemonde (2011)

Source : http://upload.wikimedia.org/wikipedia/commons/4/42/Digital_humanities_chart.jpg

- En Francophonie (Europe)

Aix en Provence; France Berne; Suisse Bron; France Caen; France Dijon; France Grenoble; France Lausanne; Suisse Liège; Belgique Lorient; France Louvain la neuve; Belgique Lyon; France Marseille; France Nancy; France Nancy; France Nanterre; France Paris; France Pessac; France Rennes; France Sanem; Luxembourg Tours; France Vandœuvre-lès-Nancy ; France Villeurbanne; France Walferdange; Luxembourg

Figure 21 : Carte des digital humanities francophones (2013).

Source : http://pireh.univ-paris1.fr/DHfrancophone/index.php

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxx

11.7. ANNEXE 7 : BIBLIOGRAPHIE SÉLECTIVE DES HUMANITÉS DIGITALES

- Ouvrages & articles • ABBÈS R. (2000). “Encodage des corpus de textes arabes en conformité à la TEI, outils et

démarche technique“. Rapport final de projet DIINAR-MBC.

• Bauden F., Cortese Delia Ismaili, and other (2002). Arabic Manuscripts. A Descriptive Catalogue of Manuscripts in the Library of The Institute of Ismaili Studies.

• Berry, D. D. M. (2012). Understanding Digital Humanities. Palgrave Macmillan.

• Books, H. (2011). Articles on Digital Humanities, Including: Perseus Project, Text Encoding Initiative, Roberto Busa, Electronic Literature, Stylometry, Institute for A. Hephaestus Books.

• Brossaud, C., & Reber, B. (2007). Humanités numériques: Volume 1, Nouvelles technologies cognitives et épistémologie. Hermès Science Publications.

• BURNARD Lou (2009). Du Literary and linguistic computing aux Digital Humanities : retour sur 40 ans de relations entre sciences humaines et informatique, séminaire de l’EHESS «Digital Humanities : les transformations numériques du rapport aux savoirs» [en ligne], 16 décembre 2009, Paris. http://leo.hypotheses.org/3994

• Burnard, L. (2012). “Encoder l’oral en TEI : démarches, avantages, défis…. Présenté à Conférence à la Bibliothèque Nationale de France, Paris: Abigaël Pesses.

• Burnard, Lou & Serberg-McQueen, C.M (1996). "La TEI simplifiée : une introduction au codage des textes électroniques en vue de leur échange", traduction de François ROLE. In : Cahiers GUTenberg, nº24, juin 1996, pp. 23-151.

• Cahiers GUTenberg (1999). TEI : Text Encoding Initiative, numéro spécial, Cahiers GUTenberg, nº24, juin 1996. [Internet]. Consulté en septembre 1999 : <http://www.gutenberg.eu.org/pub/GUTenberg/publications/>

• Doueihi Milad (2011). Pour un humanisme numérique, Éditions du Seuil

• Fourmentraux, J.-P. (2012). L’Ère post-média: Humanités digitales et cultures numériques. Editions Hermann.

• Gold, M. K. (2012). Debates in the Digital Humanities. University of Minnesota Press.

• Hockey, S. M. (2000). Electronic Texts in the Humanities: Principles and Practice. Oxford University Press.

• Ide, N. (1996). “Representation schemes for language data: the Text Encoding Initiative and its potential impact for encoding African languages”. In CARI’96 

• Ide, N. M., & Véronis, J. (1995). Text Encoding Initiative: Background and Contexts. Springer.

• Jones, S. E. (2013). The Emergence of the Digital Humanities. Taylor & Francis.

• Liu Alain (2012). The state of the digital humanities: A report and a critique. Arts and Humanities in Higher Education FEB/APR 2012 11: 8-41

• MacEnery, T. (2001). Corpus Linguistics: An Introduction. Edinburgh University Press.

• Manifeste des Digital Humanities, issu du THATCamp, Paris 2010, la non-conférence sur les humanités digitales.

• Mohammed Ourabah, S., & Hassoun, M. (2012). “A TEI P5 Manuscript Description Adaptation for Cataloguing Digitized Arabic Manuscripts”. Journal of the Text Encoding Initiative,

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxxi

• Patrascu, M., Brusq, J., Canivenc, S., & Gal, D. L. (2011). Corpus et Methodes Épistémologies Critiques et Appropriations Multidisciplinaires. Éditions L’Harmattan.

• Pierazzo, E. (2010). “On the Arabic ENRICH schema”. Wellcome Library Blog, 27 August, http://wellcomelibrary.blogspot.com/2010/08/guest-post-elena-pierazzo-on-arabic.html

• Pierrat Marie-Josèphe. (s. d.). Approche critique de la pratique de la Text Encoding Initiative, TEI, pour la constitution d’une bibliothèque virtuelle en sociologie. http://gabriel.gallezot.free.fr/Solaris/d06/6pierrat.html

• Portier, P.-E. (2010). Construction des documents multistructurés dans le contexte des Humanités Numériques, Thèse de Doctorat de l’Institut National des Sciences Appliquées.

• Rydberg-Cox, J. A. (2006). Digital libraries and the challenges of digital humanities. Chandos Publishing.

• Schmidt Thomas (2011) « A TEI-based Approach to Standardising Spoken Language Transcription », Journal of the Text Encoding Initiative [Online], Issue 1 | June 2011, Online since 08 June 2011, connection on 25 May 2012. URL : http://jtei.revues.org/142

• Schreibman Susan, Siemens Ray, Unsworth John (2004). A Companion To Digital Humanities [en ligne] Etats-Unis, Blackwell Publishers, 2004, [consulté le 03/03/2011] <http://www.digitalhumanities.org/companion/>

• Svensson Patrik (2012). The digital humanities as a humanities project. Arts and Humanities in Higher Education FEB/APR 2012 11: 42-60

• Vaucelle, A., & Hudrisier, H. (2010). Langages structurés et lien social. tic&société, (Vol. 4, n° 1). Consulté à l’adresse http://ticetsociete.revues.org/790

• Véronis, J. (2000). Parallel Text Processing: Alignment and Use of Translation Corpora. Springer.

• Warwick, C., Terras, M. M., & Nyhan, J. (2012). Digital Humanities in Practice. Facet Publishing.

- Revues

• Digital Humanities Quarterly, éditée par l’Alliance of Digital Humanities Organizations (ADHO) <http://digitalhumanities.org/dhq/>

• Digital Studies/champ Numérique, éditée par la Canadian Society for Digital Humanities/Société pour l’Etude des Médias Interactifs (SDH/SEMI), une organisation affiliée à l’Association for Computers and the Humanities (ACH) et l’Association for Literary and Linguistic Computing (ALLC) au travers l’ADHO < http://www.digitalstudies.org>

• Journal of Electronic Publishing, éditée par la bibliothèque de l’université du Michigan <http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno=3336451.0013.306>

• D- Lib Magazine, éditée par la D-Lib Alliance <http://www.dlib.org/dlib/january11/01editorial.html>

• Literary and Linguistic Computing, éditée par la presse de l’université d’Oxford <http://llc.oxfordjournals.org/>

• Ariadne, éditée par UKOLN (UK Office for Library and Information Networking) <http://www.ariadne.ac.uk/information/#about>

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxxii

11.8. ANNEXE 8 : URLS INSTITUTIONNELS UTILES

- aaDH Australasian Association for Digital Humanities [http://aa-dh.org/]

- ACH : Association for Computers and the Humanities [http://www.ach.org/]

- ADHO [Alliance of Digital Humanities Organizations] : [http://adho.org/]

- ALLC: The European Association for Digital Humanities [http://www.allc.org/]

- centerNet [http://digitalhumanities.org/centernet/]

- CSDH/SCHN : Canadian Society for Digital Humanities / Société canadienne des humanités numériques [http://csdh-schn.org/]

- Huma-Num : la TGIR des Humanités numériques (ancien TGE-Adonis) : [http://www.huma-num.fr/]

- JADH Japanese Association for Digital Humanites [http://www.jadh.org/]

- Liste de diffusion TEI : [https://groupes.renater.fr/sympa/subscribe/tei-fr]

- MEI : The music Encoding Initiative [http://music-encoding.org/home]

- TEI-P5 : Guidelines for Electronic Text Encoding and Interchange (TEI P5). [http://www.tei-c.org/Guidelines/P5/]

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxxiii

11.9. ANNEXE 9 : PROJETS EN HUMANITÉS DIGITALES UTILISANT LA TEI

� A Digital Comparative Edition and Translation of the Shorter Chinese Saṃyukta Āgama

� A Family at War: Mary Martin’s Diary, 1 January – 25 May 1916

� African American Women Writers of the 19th Century

� African Languages Lexicon Project (ALLEX)

� Alex Catalogue of Electronic Texts

� American Memory from the Library of Congress

� American Verse Project

� Ancient Inscriptions of the Northern Black Sea

� Aphrodisias in Late Antiquity (2004)

� Archimedes Palimpsest Project

� ATLAS : ATLA Series

� Autour des Res Gestae Divi Augusti

� Base de Français Médiéval – Old French Corpus

� Berardier.org: Édition électronique de Bérardier de Bataut, Essai sur le récit (1776)

� Berlin Intellectuals 1800-1830

� Bibliotheques virtuelles humanistes

� Boccaccio's Decameron

� Bodleian Library: Toyota City Imaging Project

� Brevier Legislative Reports

� British National Corpus

� British Women Romantic Poets, 1789-1832

� Brown University Scholarly Technology Group

� Brown University Women Writers Project

� Bulgarian National Corpus

� Cambridge University Press

� Carl-Maria-von-Weber-Gesamtausgabe

� Cartulaire blanc of the Abbey of Saint-Denis

� CELT Project: The Corpus of Electronic Texts

� Chinese Buddhist Electronic Text Association

� Chronicon

� Colonial Despatches: The colonial despatches of Vancouver Island and British Columbia 1846-1871

� Computational Linguistics for Metadata Building (CLiMB)

� Corpus Encoding Standard (CES)

� Corpus Toneelkritiek Interbellum

� Croatiae auctores Latini

� Croatian Language Corpus (Hrvatski jezini korpus)

� Cursus Project

� Dafydd Ap Gwilym Edition

� DALF - Digital Archive of Letters by Flemish

Authors and Composers from the 19th & 20th century

� Dante's Lemmatized Works

� Der Junge Goethe in Seiner Zeit

� Deutsches Textarchiv (The German Text Archive)

� Diccionario electrónico multilingüe de verbos amplios de movimiento

� Digital Litteratur

� Digital Quaker Collection

� Digitale Bibliotheek voor de Nederlandse Letteren (dbnl)

� Digitales Wörterbuch der deutschen Sprache (The Digital Dictionary of the German Language)

� Dingler-Online: Dingler’s Polytechnisches Journal

� Documenting the American South

� Early 19th Century Russian Readership & Culture

� Early American Fiction

� Early Americas Digital Archive

� Early Canada Online

� Early Irish Glossaries Database

� Early Modern French Women Writers

� Emblem Project Utrecht

� eMunch: Edvard Munch's Written Materials

� English Poetry Full-Text Database

� Ernst Barlach: Bibliographical Listing of Secondary Literature

� Europeana Regia

� Ex Bibliotheca Gondomariensi

� Expérimentation de normes d balisage en langues partenaires

� Extracts from the Diary of Robert Graves

� For Better for Verse: Interactive scansion tutorial

� Fortunoff Video Archive for Holocaust Testimonies

� FreeDict

� Freiburger Anthologie - Lyrik und Lied

� Henrik Ibsen's Writings

� History of the Accademia di San Luca, c. 1590-1635

� HyperGrammar

� Icelandic Online Dictionary and Readings

� Icon Programming for Humanists, Second Edition

� In Transition: Selected Poems by the Baroness Elsa von Freytag-Loringhoven

� Indiana Authors and Their Books

� Indiana Magazine of History

� Indiana University Bloomington Faculty Council

Projet ISCC/CNRS : HumanitéDigitMaghreb 2012-2013 Rapport scientifique

xxxiv

Minutes

� Indiana University Board of Trustees Minutes

� Inscriptions of Aphrodisias (2007)

� Inscriptions of Roman Cyrenaica

� Inscriptions of Roman Tripolitania

� Integrating Digital Papyrology

� Internet Library of Early Journals

� Japanese Text Initiative

� John Foxe's Book of Martyrs Variorum Edition Online

� JOS Corpora of Slovene

� Kolb-Proust Archive for Research

� Le mariage sous l'Ancien Régime

� Mark Twain Project Online

� Medieval Nordic Text Archive - Menota

� Miguel de Cervantes Digital Library

� Model Editions Partnership: Historical Editions in the Digital Age

� Morris On-Line Edition

� MULTEXT-East

� Multilingual Text Tools and Corpora (MULTEXT)

� MyManuskrip (Malaysian Manuscripts): a Digital Library

� National Corpus of Polish

� New Left Review

� New Zealand Electronic Text Centre

� Newcastle Electronic Corpus of Tyneside English

� Newton Manuscript Project

� Norsk Ordbok 2014

� OCIMCO: Oxford & Cambridge Islamic Manuscripts Catalogue Online

� Old French Corpus - Base de Français Médiéval

� Oxford Text Archive

� Partial Transcription of John Lydgate's "Fall of Princes"

� Perseus Project

� Petrus Plaoul: The Electronic Critical Edition of Plaoul's Commentary on the Sentences

� Piers Plowman Electronic Archive

� Polish Language of the XX Century Sixties

� ProQuest

� Repertorium of Old Bulgarian Literature and Letters

� Resianica Dictionary

� Rôles et pouvoirs des femmes au XVIe siècle dans la France de l'ouest

� Saint Patrick's Confessio HyperStack

� Sandrart.net

� SARIT

� Scholarly Digital Editions of Slovenian Literature

� Slovene Biographical Lexicon

� Szeged Corpus: a natural language processed Hungarian corpus

� The Algernon Charles Swinburne Project

� The Charles Brockden Brown Electronic Archive and Scholarly Edition

� The Charrette Project

� The Chymistry of Isaac Newton

� The Doegen Records Web Project

� The Electronic Cædmon's Hymn

� The English-Norwegian Parallel Corpus

� The EpiDoc Collaborative

� The FIDA Corpus of Slovene Language

� The Future Fire

� The Kapellmeisterbuch of the Abbey of Einsiedeln

� The Legacy Tobacco Documents Library

� The Medieval Review

� The Open Siddur Project

� The Orlando Project: An Integrated History of Women's Writing in the British Isles

� The Oslo Multilingual Corpus

� The Scholarly Electronic Text and Image Service

� The Thomas MacGreevy Archive

� The Versioning Machine

� The World of Dante

� The Writings of James Fenimore Cooper

� The Yellow Nineties Online � Thesaurus Musicarum Italicarum (TMI)

� United Farm Workers of America (California) Collective Bargaining Agreements Collection

� University of Michigan Humanities Text Initiative (HTI)

� University of Virginia Electronic Text Center

� University of Virginia Library

� Using XML to generate research tools for Wittgenstein scholars by collaborative groupwork

� Victorian Women Writers' Project

� Vincent van Gogh – The Letters

� Voices of the Holocaust

� Voltaire Foundation

� Women's Travel Writing, 1830-1930

� Wright American Fiction 1851-1875


Recommended