Date post: | 22-Feb-2017 |
Category: |
Data & Analytics |
Upload: | guillaume-chevillon |
View: | 607 times |
Download: | 6 times |
Big Data: alchimie ou science ?Janvier 2015 - GUILLAUME CHEVILLON Professeur of Statistics & Econometrics, ESSEC Business SchoolCoDirecteur ESSEC-CentraleSupélec MSc Data Sciences & Business Analytics
Pier
re B
ismut
h
BIG DATA: QUELLES DONNEES ?PREVOIRAPPORT DES SCIENCES SOCIALESUNE SCIENCE ?
Big Data is not about the Data!Gary King
Harvard University (2015)
The End of Theory: The Data Deluge Makes the Scientific Method Obsolete
Chris AndersonWired (2008)
MÉTHODE SCIENTIFIQUE?Anderson: inductionObservationHypothèseTest
Tsan
g Ki
n-W
ah
MÉTHODE SCIENTIFIQUE?Anderson: inductionObservationHypothèseTest
Popper? falsificationData science: améliorer l’induction
Cross-validationRégularisation
Tsan
g Ki
n-W
ah
MÉTHODE SCIENTIFIQUE?Anderson: inductionObservationHypothèseTest
Popper? falsificationData science: améliorer l’induction
Cross-validationRégularisation
Hendry (approche LSE) formulationsélectionévaluation“computation”
Tsan
g Ki
n-W
ah
ANALYTICS
DECRIRE ET CLASSER PAR MESURES ET VISUALISATION
PREVOIR PAR ANALOGIE
PRESCRIRE PAR CRITERES DE DECISION
Dirk Skreber
OUTILS PROBABILITES STATISTIQUES CODING ALGORITHMIQUE OPTIMISATION … Jules de Balincourt
Big Data, are we making a big mistake ?Tim Harford
Financial Times April 2014
Erik Kessels
Big Data, are we making a big mistake ?Tim Harford
Financial Times April 2014
• False positive
Big Data, are we making a big mistake ?Tim Harford
Financial Times April 2014
• False positive•N = all ?
Detection influenza epidemics using search engine query dataNature, 2009
Detection influenza epidemics using search engine query dataNature, 2009
QUELLES DONNÉES ?NON STRUCTURÉES, HAUTE FREQUENCERESEAUX
non pas N mais NK x Tvoire NN! x T
Andreas Gursky
QUELLES DONNÉES ?NON STRUCTURÉES, HAUTE FREQUENCERESEAUX
non pas N mais NK x Tvoire NN! x T
DONNÉES NON EXPERIMENTALESLE MODÈLE DEFINIT L’ERREUR
Andreas Gursky
QUELLES DONNÉES ?NON STRUCTURÉES, HAUTE FREQUENCERESEAUX
non pas N mais NK x Tvoire NN! x T
DONNÉES NON EXPERIMENTALESLE MODÈLE DEFINIT L’ERREUR
NON-STATIONNAIRES/ÉVOLUTIONAndreas Gursky
QUELLES DONNÉES ?NON STRUCTURÉES, HAUTE FREQUENCERESEAUX
non pas N mais NK x Tvoire NN! x T
DONNÉES NON EXPERIMENTALESLE MODÈLE DEFINIT L’ERREUR
NON-STATIONNAIRES/ÉVOLUTIONORIGINE: ACTIVITÉ HUMAINEAndreas Gursky
EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST
- HUMAINS VS MACHINES INPUT/OUTPUT, ACTIONS DEPENDENT DE
1/ passé et présent observable2/ croyances, espoirs, anticipations, 3/ réseau (infini?) d’interactions
Andreas Gursky
Julien Prévieux
EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST
- HUMAINS VS MACHINES INPUT/OUTPUT, ACTIONS DEPENDENT DE
1/ passé et présent observable2/ croyances, espoirs, anticipations, 3/ réseau (infini?) d’interactions
- FEEDBACK
Andreas Gursky
ANTICIPATIONS AVENIR &
ACTIONS DES AUTRES
ACTIONS
LE PRESENT OBSERVE
Julien Prévieux
EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST
- HUMAINS VS MACHINES INPUT/OUTPUT, ACTIONS DEPENDENT DE
1/ passé et présent observable2/ croyances, espoirs, anticipations, 3/ réseau (infini?) d’interactions
- FEEDBACK- SEULES LES ACTIONS SONT OBSERVABLESA “l’équilibre” les croyances et actions sont alignéesAnalyste observe et comprend les “lois de comportement”
- MALHEUREUSEMENT L’équilibre n’existe pas réellement et fluctueLes actions passées ne sont pas suffisantes pour prévoir le comportement
Andreas Gursky
Julien Prévieux
MACROECONOMISTES : EXPERIENCE ET REPONSESEXPERIENCE “BIG DATA” HISTORIQUE
KEYNES puis Hicks
Après WW2: US Cowles Commission (L. Klein)- données deviennent disponibles- mettre l’économie en équations- bonnes prévisions à court terme
Tsan
g Ki
n-W
ah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSESEXPERIENCE “BIG DATA” HISTORIQUE
KEYNES puis Hicks
Après WW2: US Cowles Commission (L. Klein)- données deviennent disponibles- mettre l’économie en équations- bonnes prévisions à court terme
1950s Courbe de Phillips- rôle pour le gouvernement ?
Tsan
g Ki
n-W
ah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSESEXPERIENCE “BIG DATA” HISTORIQUE
KEYNES puis Hicks
Après WW2: US Cowles Commission (L. Klein)- données deviennent disponibles- mettre l’économie en équations- bonnes prévisions à court terme
1950s Courbe de Phillips- rôle pour le gouvernement ?
1970s modèles de Klein et Phillips s'écroulent- stagflation
Tsan
g Ki
n-W
ah
Olafur Eliasson
EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSE
exemple: modèle Cobwebformation des anticipations ? dynamique ? loi perçue vs loi effective
Tsan
g Ki
n-W
ah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSE
exemple: modèle Cobwebformation des anticipations ? dynamique ? loi perçue vs loi effective
Muth (1960) puis Lucas: Anticipations rationnelles- lien entre croyances individuelles et comportement agrégé
- évite les hypothèses arbitraires (erreurs systématiques)
- Une manière de comprendre le rôle des interventions: la critique de Lucas (1976)
Tsan
g Ki
n-W
ah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSE
exemple: modèle Cobwebformation des anticipations ? dynamique ? loi perçue vs loi effective
Muth (1960) puis Lucas: Anticipations rationnelles- lien entre croyances individuelles et comportement agrégé
- évite les hypothèses arbitraires (erreurs systématiques)
- Une manière de comprendre le rôle des interventions: la critique de Lucas (1976)
Concept limité mais généralisable
Tsan
g Ki
n-W
ah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSEMODELES ECONOMETRIQUES- Eviter les boîtes noires
préférer les petits modèles interprétables
(structurels?)équilibre partiel vs général
Tsan
g Ki
n-W
ah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSEMODELES ECONOMETRIQUES- Eviter les boîtes noires
préférer les petits modèles interprétables
(structurels?)équilibre partiel vs général
- prévisionsstabilitérobustesse
Tsan
g Ki
n-W
ah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSEMODELES ECONOMETRIQUESDIFFICULTES STATISTIQUES- coordination des anticipations
prévoir les prévisions d'autruihétérogénéité
Tsan
g Ki
n-W
ah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
EXPERIENCE “BIG DATA” HISTORIQUEUNE REPONSEMODELES ECONOMETRIQUESDIFFICULTES STATISTIQUES- coordination des anticipations
prévoir les prévisions d'autruihétérogénéité
- inférence impossible ?simulations, validation reposent sur
des hypothèseslois fractales
ex: apprentissageou si N −>∞
Tsan
g Ki
n-W
ah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
How can the current disquiet of our time be properly grasped, made comprehensible, examined, and articulated?
Over the course of the last two centuries the radical changes […] have made fascinating subject matter for artists
The principal question the exhibition will pose is this: How can artists, thinkers […] make sense of the current upheaval?
Okwui Enwezor, Curator of “All the World’s Futures”
2015 Venice Biennale
PREVOIR EN PRESENCE DE DISRUPTIONDES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS...
COMPRENDREcomprendre les croyances (esprit)
besoin d'une vue exhaustive des futurs possibleséviter l'auto-censure
Muy
brid
ge
PREVOIR EN PRESENCE DE DISRUPTIONDES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS...
COMPRENDREcomprendre les croyances (esprit)
besoin d'une vue exhaustive des futurs possibleséviter l'auto-censure
COMPARERprendre en compte les croyances des autresquelle est la mesure pour décider de la similarité et de la proximité
?pour le classement ?
Muy
brid
ge
PREVOIR EN PRESENCE DE DISRUPTIONDES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS...
COMPRENDREcomprendre les croyances (esprit)
besoin d'une vue exhaustive des futurs possibleséviter l'auto-censure
COMPARERprendre en compte les croyances des autresquelle est la mesure pour décider de la similarité et de la proximité
?pour le classement ?
EVALUERquel est le code (angage) pour enregistrer et décrire ? qu'est ce qu'une description précise, exacte ?comment évaluer les prévisions ?
Muy
brid
ge
ACHAB VS ULYSSE
N.C
Wye
th
MERCI