1
Analyse dincertitude, analyse de sensibilit. Objectifs et principales tapes
David MakowskiINRA
Ecole chercheur Analyse de sensibilit et exploration de modles
Mai 2009, Giens, France
2
1. Dfinitions et objectifs
2. Analyse dincertitude
3. Analyse de sensibilit
4. Etude de cas
3
1. Dfinitions et objectifs
4
Sources dincertitude dans un modle
( ),f x
Equations Variables dentre
Paramtres
5
Types dincertitude
Manque de connaissance
Ex: Temprature optimale pour le dveloppement dun champignon pathogne
Erreur de mesures / Echantillonnage
Ex: Erreur de mesure de la densit de plantes dans une parcelle agricole
Variabilit des caractristiques du systme
Ex: Variabilit de la temprature moyenne journalire entre annes
6
z = variables dentre et paramtres incertains
= facteurs incertains
z = (z1, z2, , zp)
Notation
( ) ( )1 2, ,.., py z z z y z=Sortie du modle
7
Analyse dincertitudePermet de rpondre la question suivante:
Quel est le niveau dincertitude dans y(z) qui rsulte de lincertitude dans z ?
z1
y(z)
On a
On veut dterminer
z2
et
8
Analyse de sensibilit
Son objectif est de rpondre la question:
Quelles sont les principales sources dincertitude parmi z1, z2, , zp ?
y(z)
Variance de y(z) = effet de z1 + effet de z2 +
9
Intrt pratique de lanalyse dincertitude- donner des informations sur lincertitude associe aux prdictions dun modle
- optimiser des variables dcisionnelles
de lanalyse de sensibilit- identifier les paramtres et les variables dentre qui ont une forte influence sur
les sorties dun modle
Important de les connatre avec prcision
- identifier les paramtres et les variables dentre qui ont une influence moindre
sur les sorties
Moins important de les connatre avec prcision
10
Exemples de questions pouvant tre traites par AI ou AS
Est-il important de mesurer prcisment les caractristiques
du sol pour prdire le rendement dune culture ?
Probabilit quune nouvelle mesure de gestion du stock de
langoustines soit plus efficace que la mesure actuelle ?
Quelle est la probabilit de perdre plus de 0.2 t ha-1 si la dose
dengrais applique sur du bl est rduite de 20%?
Quels sont les paramtres dun modle de culture estimer en
priorit gnotype par gnotype ?
11
0
500
1000
1500
2000
2500
3000
9/1 30/1 20/2 13/3 3/4 24/4 15/5 5/6 26/6 17/7
DATE
Dry
Mat
ter
(kgh
a-1)
1N0 TOT Obs 1N0 TOT Pred 1N0 G Obs 1N0 G Pred
2N0 TOT Obs 2N0 TOT Pred 2N0 G Obs 2N0 G Pred
Simulations de la biomasse du bl laide du modle dynamique AZODYN
12
AZODYN
Paramtres
Variables dentre
caractristiques du sol
donnes climatiques
pratiques agricoles
Biomasse
Rendement
Teneur en protines des
grains
N rsiduel du sol
Jeuffroy et Recous, 1999
13
Incertitude associe 13 paramtres potentiellement gnotypiques
Parameter Definition Range Unit
RDTMAXVAR Maximal yield 10.0 - 13.7 t.ha-1
Ebmax Radiation use efficiency 2.7-3.3 g.MJ-1
D Ratio of leaf area index to critical nitrogen 0.02-0.045 -
REM2 Fraction of remobilized nitrogen 0.5-0.9 -
K Extinction coefficient 0.6-0.8 -
Eimax Ratio of intercepted to incident radiation 0.9-0.99
Tep.flo Duration between earing and flowering 100-200 C.day
R Ratio of total to above ground nitrogen 1.0-1.5 -
P1GMAXVAR Maximal w eight of one grain 47-65 mg
Lambda Parameter for calculating nitrogen use efficiency 25-45 -
Mu Parameter for calculating nitrogen use efficiency 0.6-0.9 -
DJPF Temperature threshold 150-250 C.day
NGM2MAXVAR Maximal grain number 107.95-146.05 -
14
Quels paramtres doit-on estimer ?
Exp. 1Gnotype
Soissons
Paramtres pour Soissons
Exp. 2Gnotype Recital
Paramtres pour Rcital
Coteux !
15
0.0 0.2 0.4 0.6 0.8 1.0
Sensitivity of yield
DJPFNGM2MAXVAR
MuLambda
P1GMAXVARR
Tep.floEimax
KREM2
DEbmax
RDTMAXVAR
0.0 0.2 0.4 0.6 0.8 1.0
Sensitivity of grain protein content
Tep.floK
EimaxEbmax
DJPFNGM2MAXVAR
P1GMAXVARD
MuLambda
RDTMAXVARR
REM2
Indices de sensibilit totale pour les simulations de rendement et de teneur en protines
Rendement Teneur en protines
Makowski et al. 2005
16
2. Analyse dincertitude
17
Analyse dincertitudePermet de rpondre la question suivante:
Quel est le niveau dincertitude dans y(z) qui rsulte de lincertitude dans z ?
z1
y(z)
On a
On veut dterminer
z2
et
18
Application un modle trs simple
Equation: y(z1, z2) = z1 + 2 z2
Incertitude sur z1 et z2 : z1 ~ N(20, 16) et z2 ~ N(60, 64)
0 20 40 60 80 100
Valeurs de z1
0.0
00
.02
0.0
40
.06
0.0
80
.10
De
nsi
te d
e p
rob
ab
ilite
0 20 40 60 80 100
Valeurs de z2
0.0
00
.01
0.0
20
.03
0.0
40
.05
De
nsi
te d
e p
rob
ab
ilite
Question: Raliser une analyse dincertitude
Value of z1 Value of z2
Pro
bab
ilityden
sity
Pro
bab
ilityden
sity
19
Vous devez dterminer la distribution de probabilitde y(z1, z2) partir des distributions de z1 et z2 .
Proprits:
Si z1 et z2 sont deux variables indpendantes de
distribution Gaussienne alors
A z1 + B z2 suit une distribution Gaussienne
E(A z1+B z2)=A E(z1)+B E(z2)
var(A z1+B z2)=A var(z1)+B var(z2)
Application un modle trs simple
20
100 150 200
Valeurs de y(z1,z2)
0.0
00
0.0
05
0.0
10
0.0
15
0.0
20
0.0
25
De
nsi
te d
e p
rob
ab
ilite
y(z1,z2) ~ N(140, 272)
Pour ce modle simple, on peut dterminer lexpression exacte
de y(z1,z2) :
Pro
bab
ilityden
sity
Value of y(z1, z2)
Application un modle trs simple
21
En gnral, cest plus dur !
Equations plus complexes, relation non linaire entre y(z) et z
Pas possible de dterminer lexpression analytique de la
distribution de y(z)
La distribution de z nest pas toujours connue
Choix subjectif
Temps de calcul parfois long avec certains modles
Le nombre de simulations est limit
22
Quatre tapes
1. Dfinir les distributions de z1, , zp.
2. Gnrer des chantillons partir des distributions dfinies ltape 1
3. Calculer y(z) pour chaque srie de z1, , zp gnre
4. Estimer la distribution de y(z)
23
tape 1. Dfinition des distributions
Les distributions de probabilit des facteurs incertains (paramtres
ou variables dentre) peuvent tre dfinies en utilisant :
La littrature scientifique et lexpertise
Des sries de mesures (srie climatique)
Les valeurs des paramtres estimes
24
tape 1. Dfinition des distributions
Exemple:
daprs un article publi par Jeuffroy et Recous en 1999 dans
EJA, lefficacit dutilisation de rayonnement intercept
varie entre 1.09 et 3.8 g.MJ-1 pour le bl
1.09 3.8 Eb 1.09 3.8 Eb
25
1. Dfinition des distributions de z1, , zp.
2. Gnration dchantillons partir des distributions dfinies ltape 1.
26
tape 2. Gnration dchantillons partir des distributions de z1, , zp
Il faut gnrer suffisamment de valeurs de z1, z2, , zp
Diffrentes mthodes dchantillonnage peuvent tre
utilises:
- chantillonnage alatoire
- chantillonnage en hypercube latin
-
En pratique, on utilise un logiciel pour gnrer N valeurs de
z1, z2, , zp (ex: N=20000).
27
1.09 3.8 Eb
On gnre un chantillon de valeurs de Eb issues de sa
distribution :
1.2, 1.9, 2.1, 2.2, 2.3, 2.5, 2.7, 3.1, 3.7
tape 2. Gnration dchantillons partir des distributions de z1, , zp
28
0.910.753.70Srie N
0.920.721.97Srie 2
0.990.851.21Srie 1
zpz2z1
tape 2. Gnration dchantillons partir des distributions de z1, , zp
29
1. Dfinition des distributions de z1, , zp.
2. Gnration dchantillons partir des distributions dfinies ltape 1.
3. Calcul de y(z) pour chaque srie z1, , zp gnre.
30
tape 3. Calcul de y(z) pour chaque srie de z1, , zp gnre
La difficult de cette tape dpend du niveau de
complexit du modle.
Le temps de calcul peut tre long avec certains
modles particulirement complexes.
31
0.91
0.92
0.99
zp
81.50.753.70Srie N
95.20.721.97Srie 2
90.90.851.21Srie 1
y(z)z2z1
tape 3. Calcul de y(z) pour chaque srie z1, , zp gnre
32
1. Dfinition des distributions de z1, , zp.
2. Gnration dchantillons partir des distributions dfinies ltape 1.
3. Calcul de y(z) pour chaque srie z1, , zp gnre.
4. Approximation de la distribution de y(z).
33
tape 4. Approximation de la distribution de y(z)
Dcrire les N valeurs de y(z) calcules ltape 3.
tape souvent assez facile.
Diffrentes approches possibles
- calcul de la moyenne et de la variance,
- calcul de quantiles (quartiles, dciles),
- histogramme,
- fonction de distribution cumule,
- box plot
34
Application au modle simple
Approche en 4 tapes pas ncessaire pour ce modle car on
peut calculer analytiquement la distribution de y(z1, z2)
On applique cette approche ce modle uniquement pour
montrer quelle marche bien.
35
Equation : y(z1, z2) = z1 + 2 z2
Incertitude sur z1 et z2 : z1 ~ N(20, 16), z2 ~ N(60, 64)
0 20 40 60 80 100
Valeurs de z1
0.0
00
.02
0.0
40
.06
0.0
80
.10
De
nsi
te d
e p
rob
ab
ilite
0 20 40 60 80 100
Valeurs de z2
0.0
00
.01
0.0
20
.03
0.0
40
.05
De
nsi
te d
e p
rob
ab
ilite
Value of z1 Value of z2
Pro
bab
ilityden
sity
Pro
bab
ilityden
sity
Application au modle simple
Etape 1
36
N valeurs de z1 et z2 sont gnres
Plusieurs valeurs de N sont considres successivement
N = 10
N = 100
N = 1000
Application au modle simple
Etape 2
37
Application. Etape 2. N=10
Valeur de z1
Val
eur
de z
2
0 20 40 60 80 100
020
4060
8010
0
0 20 40 60 80 100
01
23
4
Valeur de z1
0 20 40 60 80 100
01
23
4
Valeur de z2
Value of z1 Value of z2
Value of z 2
Value of z2
38
Valeur de z1
Val
eur
de z
2
0 20 40 60 80 100
020
4060
8010
0
0 20 40 60 80 100
05
1015
20
Valeur de z1
0 20 40 60 80 100
05
1015
20
Valeur de z2
Application. Etape 2. N=100
Value of z1 Value of z2
Value of z 2
Value of z2
39
Valeur de z1
Val
eur
de z
2
0 20 40 60 80 100
020
4060
8010
0
0 20 40 60 80 100
050
100
150
Valeur de z1
0 20 40 60 80 100
050
100
150
200
250
Valeur de z2
Application. Etape 2. N=1000
Value of z1 Value of z2
Value of z 2
Value of z2
40
Application. Etape 3
47.3817.69
58.5423.69
52.5817.88
61.5524.67
55.5325.67
66.1125.48
49.2520.45
57.8516.43
52.3323.18
59.3016.83
y(z1,z2)z2z1
41112.4547.3817.69
140.7858.5423.69
123.0452.5817.88
147.7761.5524.67
136.7355.5325.67
157.7166.1125.48
118.9549.2520.45
132.1357.8516.43
127.8452.3323.18
135.4359.3016.83
y(z1,z2)z2z1
Application. Etape 3
42
80 100 120 140 160 180 200
050
100
150
200
Valeur de y(z1,z2) Valeur de y(z1,z2)
P(y