+ All Categories
Home > Data & Analytics > Data sprint des archives

Data sprint des archives

Date post: 14-Jan-2017
Category:
Upload: associationaf
View: 4,046 times
Download: 0 times
Share this document with a friend
16
data sprint des archives Forum des Archivistes, Troyes, 30, 31 mars, 1er avril 2016
Transcript
Page 1: Data sprint  des archives

data sprint des archivesForum des Archivistes, Troyes, 30, 31 mars, 1er avril 2016

Page 2: Data sprint  des archives

Réunion d’information sur le data sprint des archives

1.“data sprint des archives” ?

où, quoi, qui, comment, pourquoi

planning, licences de réutilisation

2.exemples de visualisation de données

3.focus sur les données collectéesexemples

critères (structuration des données)

4.questions

Page 3: Data sprint  des archives

Tour de table

Source : BanQ, Conrad Poirier [Public domain or Public domain], via Wikimedia Commons

Page 4: Data sprint  des archives

“Data sprint des archives” ?

1. “Data sprint des archives” ?

2. Exemples de visualisation de données

3. Focus sur les données collectées

4. Questions

● Pourquoi ?

Souhait du comité scientifique d’organiser un événement participatif

● Quoi ?

Choix du format de l’événement : un data sprint étalé dans le temps

Collecte de données > réutilisation et développement de dispositifs et dataviz par des équipes > restitution

Page 5: Data sprint  des archives

“Data sprint des archives” ?

1. “Data sprint des archives” ?

2. Exemples de visualisation de données

3. Focus sur les données collectées

4. Questions

● Planning

● Comment

Des équipes, à distance voire locales // des outils collaboratifs en ligne

> Place des archivistes ? expliquer les données, nettoyer/normaliser les fichiers, découvrir, apprendre et échanger

mars 2015 : début de la

réflexion

juin 2015 : choix du format, appel

à participation (archives)

mars 2016 : FORUM

après ? SAV et débrief

juillet-déc. 2015 : collecte des données

janvier-mars 2016 : conception et dév.

des dispositifs

nov. 2015 : réunion d’information

déc. 2015 : appel à participation

(non archives)

Page 6: Data sprint  des archives

“Data sprint des archives” ?

1. “Data sprint des archives” ?

2. Exemples de visualisation de données

3. Focus sur les données collectées

4. Questions

● Les licences des données collectées

Au choix : - durée du forum (mais les dispositifs ne seront pas pérennes)- ouverture des données (dispositifs pérennes et ouverts après le forum,

contenu open data / licences CC / ouvertes), avec accompagnement de l’équipe data sprint (y compris après le forum)

Sur l’ouverture des données : - impact très important en matière de communication très important

(visibilité, relais Etalab, etc.)- tutoriel : L’open data culturel (MCC, 2013) : http://dai.ly/xyqrun- tutoriel : Les licences Creative Commons (MCC, 2013) :

http://dai.ly/x1tg4gv

Exemples d’ouverture de données : AD71, AD78, AM Toulouse, téléversements d’images sur Commons des AN, de la BAnQ, NARA, musées européens, etc.

Page 7: Data sprint  des archives

1. “Data sprint des archives” ?

2. Exemples de visualisation de données

3. Focus sur les données collectées

4. Questions

Exemples de visualisation de données

ou comment obtenir, à partir d’un “simple” fichier XLS ou XML, toute sorte de chose...

Page 8: Data sprint  des archives

Exemples de visualisation de données

Archives de la Manche (Pinterest)

Gallica (Pinterest)Archives de Boulogne-Billancourt

Page 9: Data sprint  des archives

Exemples de visualisation de données

Archives des Yvelines, liste des machines à vapeur (données non exhaustives et non corrigées)

Voir carte de chaleur animée (heatmap)

Fichier XLS

CartoDB

Page 10: Data sprint  des archives

Statistiques sur la structuration de fichiers XML et l’utilisation des balises EAD

> les données comme aide à la décision

Exemples de visualisation de données

Page 11: Data sprint  des archives

Avant-Après avec juxtapose.js http://goo.gl/yh0i00

Lieu de naissance et de mort à partir de fichiers XML-EAC

Visualisation des traités & accords de la France de 1500-1900 par lieux de signature conservés aux #archives du Ministère des Affaires étrangères et européennes

Exemples de visualisation de données

Page 12: Data sprint  des archives

Visualisation des expositions dans les musées français (1900-1950)

Fichier TXT initial

Exposition Fragonard au Petit Palais, paris, du 21/02/1902 au 12/05/1902

“Plaisirs d’ornements”, Musée des Beaux-Art de Lille, Lille, janvier 1904

Fichier CSV_1

Titre_expo Lieu_musee Lieu_Ville Date_debut Date_fin

Exposition Fragonard

Petit Palais paris 21/02/1902 12/05/1902

“Plaisirs d’ornements”

Musée des Beaux-Art de Lille

Lille janvier 1904

SPLIT + REGEX

OpenRefine

Titre_expo Lieu_musee Lieu_Ville Année Geoloc

Exposition Fragonard

Petit Palais Paris 1902 51.45643;-124789

Plaisirs d’ornements

Musée des Beaux-Art de Lille

Lille 1904 31.45643;-024789

OpenRefineNettoyage + REGEX + API

Page 13: Data sprint  des archives

Dataviz des relations autour de la #Galerie Bonnier grâce à <cpfRelation> des notices XML-EAC

Réseaux des élèves-architectes (en bleu) par ateliers (en rouge) lors de l’enseignement aux Beaux-Arts de Paris

Exemples de visualisation de données

Page 14: Data sprint  des archives

Focus sur les données collectées

données structurées : fichier XML, fichier Excel normalisé, etc.

vs

données non structurées (beaucoup plus difficilement utilisables) : fichier Word, listes non normalisées

1. “Data sprint des archives” ?

2. Exemples de visualisation de données

3. Focus sur les données collectées

4. Questions

Fichier Sénateurs Second Empire

Page 15: Data sprint  des archives

Focus sur les données collectées

On recherche encore : des statistiques (de type Google Analytics), des données XML EAC, des images libres de droit, etc.

1. “Data sprint des archives” ?

2. Exemples de visualisation de données

3. Focus sur les données collectées

4. Questions

Participants actuels Thèmes

AD10, AD26, AD31, AD35, AD50, AD51, AD62, AD71, AD78, AD89, AD95, AM Toulouse, AM Dijon, AM Beaune, AM Orléans, AM Rennes, Sénat, Inserm, Mémoire des Hommes, La Parisienne de Photographie, INHA, …

+ données disponibles sur les portails open data

guerre et vie militaire, économie et travail (machines à vapeur, syndicats, grèves, factures), personnes (cartes postales, bases nominatives), monuments (MH, architectes), lieux (cartes postales, plans, monographies), héraldique, associations, surveillance

Données de gestion (stats de service), statistiques sites Internet)


Recommended