Introduction à l'exploration du Web
Sébastien Heymann <[email protected]>- doctorant Lip6 ComplexNetworks -
Web mining
What the hell is this?!
Comment représentez-vous le Web ?
Contenu, frontières, unité documentaire, sens
Comment représentez-vous le Web ?
Que font les gens sur le Web ?
http://vidberg.blog.lemonde.fr/2010/06/02/ma-vie-privee-nest-pas-sur-internet/
Comment imaginez-vous votre métier ?
De la collecte à la sélection critique
Aujourd'hui, la documentation● Savoir se repérer
Aujourd'hui, la documentation● Savoir se repérer
● Sélectionner les bonnes informations
Aujourd'hui, la documentation● Savoir se repérer● Sélectionner les bonnes informations
● Agréger des sources hétérogènes de façon rigoureuse
Aujourd'hui, la documentation● Savoir se repérer● Sélectionner les bonnes informations● Agréger des sources hétérogènes de façon rigoureuse
● Manipuler, mettre en forme l'information
Aujourd'hui, la documentation● Savoir se repérer● Sélectionner les bonnes informations● Agréger des sources hétérogènes de façon rigoureuse● Manipuler, mettre en forme l'information
● Faire sens et dire des choses pas trop fausses !
Nouveaux besoins, nouvelles compétences, (re)nouveau des métiers
Compétences
coder – analyser - représenter
Ben Fry – Computational Information Design, 2004
Coder: acquérir
Doc, HTML
Flux de news
Base de données
Coder : extraire
Parcours de fichier
Parcours de documents structurés
Parcours de flux de données
Analyser
Niveaux d'ordres
Grandeurs, écarts
Différences, singularités
Représenter
Volumétrie
Géographie
Relations
Interagir
Connexions
Occupation de l'espace
Mouvement
Exemple: voir du texte
Wordle
PhaseNets
Objectifs du module1/ Construire un corpus Web et interroger les propriétés de cet espace « socio-technique ».
Objectifs du module1/ Construire un corpus Web et interroger les propriétés de cet espace « socio-technique ».
2/ Cartographier ces propriétés pour produire un discours critique et révéler des phénomènes inattendus.
Objectifs du module1/ Construire un corpus Web et interroger les propriétés de cet espace « socio-technique ».
2/ Cartographier ces propriétés pour produire un discours critique et révéler des phénomènes inattendus.
3/ Mobiliser des méthodes, outils et stratégies de représentation pour produire une analyse pertinente.
Organisation du module
Mon travail3h cours + 6h TP
Votre travailune exploration et analyse d'une thématique /
communauté sur le Web
Le cours● 1h de mise en contexte● 1h de théorie des graphes● 30min sur l'exploration du Web● 30min d'ouverture
Au boulot !