Modèles autorégressifs à changements de régimes ......Motivations • Conditions d’états de...

Page 1

Pierre Ailliot

Modèles autorégressifs à changements de régimes markoviens

Applications aux séries temporelles de vent

Introduction

Page 2

Motivations

• Conditions d’états de mer (vent, vagues) influencent...• Evolution d’un trait de côte

• Faisabilité d’une opération en mer

• Rentabilité d’une ligne maritime

• Données disponibles sur des périodes relativement

courtes ( maxi)

• Utilisation d’un modèle stochastique afin de simuler de

nouvelles séries temporelles d’états de mer

• Relations complexes entre les paramètres...• Dans un premier temps, séries temporelles de vent

• Les vagues sont générées par le vent...• Reconstitution à partir des séries temporelles de vent

• Filtrage non paramétrique (Monbet et al., 2003)

50 ans≈

Introduction

Page 3

Exemple d’application (projet Egide)

• Objectif: étudier la rentabilité d’une ligne

maritime en Mer Egée pour un bateau donné

• Données océano-météorologiques disponibles

• Conditions d’états de mer sur la ligne (3 ans)

• ...utilisation d’un modèle stochastique afin de

simuler de nouvelles séries (500 ans)

• Vent puis vagues

• Réponse du navire dans les différents états de mer

• Vitesse maximale du bateau dans chaque état de mer

• Contraintes structurelles, confort des passagers

• ...développement d’un “simulateur” de traversée

• Entrée: conditions d’états de mer sur la ligne pendant la traversée

• Sortie: traversée normale, retardée ou annulée

21E 28E34N

39N

30.0

25.0

20.0

15.0

10.0

0

45

90

135

180

225

270

315

Hs=3m and Tp=7sec

Introduction

Page 4

• Résultats obtenus

• Variabilité de ces quantités

Répartition du pourcentage de traversées annulées (à gauche) et retardées (à droite)

• 8% des années avec plus de 30% de traversées retardées

Données (3 ans) Simulées (500 ans)

% de traversées annulées 0.00% 0.58%

% de traversées retardées 11.1% 11.2%

0 5 100

100

200

300

400

0 20 400

20

40

60

80

100

1

1

Introduction

Page 5

Plan de l’exposé

1. Définition des modèles MS-AR

2. Etude théorique des modèles MS-AR

3. Modèles en un point fixe

4. Modèle spatio-temporel

5. Perspectives

Définition

Page 6

1. Définition

Définition: suit un modèle MS-AR si c’est une chaîne de

Markov (CM) à espace d’état (avec ) telle que

•

• CM homogène ou non-homogène

• ,

• avec compact de

• Processus non observé

•

• : probabilités d’émission

•

• Processus observé

: noyau de transition de la CM “complète”

Xt

{ } StY

t,{ }=

1…M{ } Y× Y Rd⊂

P StS

t 1–

st 1–

Yt 1–

y=

t 1–… S

0s0Y0

y0

=,=, , ,=( ) P StS

t 1–

st 1–

=( )=

qθt( )i j,( ) P St j St 1–

i==( )= Qθt( )

qθt( )i j,( )( )i j 1…M{ }∈,=

θ Θ∈ Θ Rp

P YtS

ts

t= S

t 1–s

t 1–Y,=,

t 1–y

t 1–… S,

0s0

= Y,0

y0

=,=( ) P YtS

ts

tY

t 1–

yt 1–

=,=( )=

P YtS

ts

tY

t 1–y

t 1–=,=( )

P Yt

dy∈ St

stY

t 1–y

t 1–=,=( ) gθ y

ts

ty

t 1–,( )dy=

Πθt( )

Xt

{ } StY

t,{ }=

Définition

Page 7

Cas particuliers

• CM cachées:

• Modèles autorégressifs (M=1)

Deux types de modèles MS-AR utilisés pour le vent...

• Modèle MS-LAR

• Introduit par Hamilton (1989) en économétrie

• Variable cachée représente les cycles économiques (croissance/récession)

• Modèle spatio-temporel pour les champs de vent

• Définition:

• , et

• un bruit blanc gaussien, indépendant de pour

• Probabilités d’émission:

P YtS

ts

t= Y,

t 1–y

t 1–=( ) P Y

tS

ts

t=( )=

Yt

AθS

t( )

Yt 1–

BθS

t( )

HθS

t( )εt

+ +=

Aθs( )

MdR( )∈ Bθ

s( )M

d 1, R( )∈ Σ θs( )

Hθs( )Hθ

s( )( )' Sd

+R( )∈=

εt{ } ε t Y t' t' t<

P YtS

ts

tY

t 1–y

t 1–=,=( ) N Aθ

st( )Y

t 1–Bθ

st( )Σθ

st( )

,+( )∼

Définition

Page 8

• Modèle MS-γAR

• à valeurs dans

• Intensité du vent, hauteur significative des vagues...

• Définition: suit une loi gamma

• de moyenne avec et

• d’écart-type

Yt

{ } R+

P YtS

ts

tY

t 1–y

t 1–=,=( )

µs

t( )

yt 1–( ) a

st( )

yt 1–b

st( )

+= as( )

0≥ bs( )

0>

σs

t( )

0>

gθ yt st y,t 1–

( )

µs

t( )

yt 1–( ) σ

st( )

( )2

Γµ

st( )

yt 1–( )

σs

t( )-------------------------

2

⁄=

ytµs

t( )

yt 1–( )

σs

t( )

( )2

-----------------------------

µ yt 1–( )

σst( )-------------------

2

1–

ytµ

st( )

yt 1–( )

σst( )

( )2

-----------------------------–

1R+ y

t( )exp

Etude théorique des modèles MS-AR

Page 9

2. Etude théorique des modèles MS-AR

Estimation

• Objectif: estimer le paramètre inconnu à partir d’une

réalisation du processus

Définition: un estimateur du maximum de vraisemblance (EMV) est un maximum de la fonction de vraisemblance

avec une condition initiale arbitraire

• Calcul numérique des EMV?

• Qualité des EMV?

Validation

• Le modèle permet-il de décrire le phénomène observé?

θ Θ∈y

t{ }

t 0…T{ }∈ Yt

{ }

LT s

0, θ( ) qθ

t( )

t 1=

T

∏ st 1–

st,( )gθ y

tyt 1–

st,( )

s1… s

T, ,( ) 1…M{ } T∈

∑=

s0

1…M{ }∈

Etude théorique: calcul numérique des EMV

Page 10

Calcul numérique des EMV

Algorithme EM (Baum et al. (1970), Dempster et al. (1977))

Principe: algorithme itératif, partant de . A chaque itération:

• Etape E (Expectation): calcul de la fonction intermédiaire

• Expression en fonction des probabilités de lissage

• Algorithme Forward-Backward

• Etape M (Maximisation): calcul de

• Selon les modèles, expression analytique ou optimisation numérique

Inconvénients:

• Convergence possible vers des extrema locaux

• Taux de convergence asymptotique linéaire

θ 0( ) Θ∈

R θ θ n 1–( ),( ) Eθ n 1–( ) pθ y

1

TS1

Ty0s0,,( ) y

0

Ts0,ln[ ]=

pθ Sty0

TS0

s0

=,( )

θ n( )argmaxθ Θ∈ R θ θ n 1–( ),( )=

Etude théorique: calcul numérique des EMV

Page 11

Algorithme quasi-Newton

• Taux de convergence asymptotique super-linéaire

• Nécessite d’évaluer la fonction de vraisemblance et son gradient

en un nombre de points importants

• ...se calculent à partir du filtre de prédiction

• ...qui vérifie une relation de récurrence (algorithme Forward)

Algorithme utilisé en pratique

• Localisation d’un extremum “intéressant”

• Choix de plusieurs valeurs initiales de manière aléatoire

• Utilisation de itérations de l’algorithme EM

• Estimation finale avec l’algorithme quasi-Newton

• Valeur approchée de la matrice d’information observée

pθ Sty0

t 1–S0

s0

=,( )

θ 0( )

N1

IT s

0,

obs ∇– θ2

LT s

0, θ̂T s

0,( )( )ln=

Etude théorique: propriétés asymptotiques des EMV

Page 12

Propriétés asymptotiques des EMV

Bibliographie

• Baum et al. (1966)

• Consistance et normalité asymptotique dans les modèles CMC ( fini)

• Leroux (1992)• Consistance des EMV dans les modèles CMC

• Francq et al. (1998), Krishnamurty et al. (1998)

• Consistance des EMV dans les modèles MS-AR

• Bickel et al. (1998)• Normalité asymptotique des EMV dans les modèles CMC

• Douc et al. (2004)

• Consistance et normalité asymptotique des EMV dans les modèles MS-AR

...conditions vérifiées par les modèles MS-LAR

Y


Page 13

Consistance des EMV (modèles MS-γAR homogènes)

• On suppose que le processus suit un modèle MS-γAR de paramètres

• Notation: si les deux paramètres définissent le même modèle, à la

numérotation près des états

Proposition: Supposons que les deux conditions ci-dessous sont vérifiées:

(C1) (stabilité): , la matrice est irréductible, le noyau admet une

unique probabilité invariante et la solution stationnaire est ergodique et possède

un moment d’ordre

(C2) (identifiabilité): si

alors, si désigne la loi stationnaire de , on a

, p.s. quand

pour la topologie quotient associée à ~

Yt

{ }

θ0

θS 0, θR 0,1( ) … θR 0,

M( ), , ,( )=

θ1θ2

∼

θ∀ Θ∈ Qθ Πθ

κ 2>

θR 0,i( ) θR 0,

j( )≠ i j≠

Pθ0

YYt{ }

s0

1…M{ }∈∀ θˆ T s0, θ

0→ Pθ

0

YT ∞→


Page 14

Stabilité (modèles MS-γAR homogènes)

• Résultats existants valables pour les modèles fonctionnels de la

forme

• Holst et al. (1994), Francq et al. (1998), Yao et al. (2000 et 2001)

Proposition: Soit un processus MS-γAR, tel que soit irré-

ductible et apériodique de probabilité invariante .

Si l’hypothèse (S1) est vérifiée alors est géométriquement ergodique

(S1)

Si en outre l’hypothèse (S2) avec est vérifiée alors la loi stationnaire de admet des moments d’ordre

(S2) avec

• Conditions (C2) et (S2) (avec ) impliquent la consistance des EMV

MS AR–

Yt

fS

t( )

Yt 1–( ) ε

t+=

Xt

{ } StY

t,{ }= S

t{ }

π π1… πM, ,( )=

Xt{ }

πi ai( )( )log 0<

1 i M≤ ≤∑

κ 1≥Yt{ } κ

ρ Rκ( ) 1< Rκ (q i j,( )(a j( ))κ)i j 1…M{ }∈,=

κ 2>


Page 15

Normalité asymptotique (modèles MS-γAR homogènes)

• Résultats de Douc et al. (2004) ne s’appliquent pas

Etude de la qualité des EMV par simulation

• Simulation de N=1000 réalisations de longueur d’un modèle

• équivalent à 22 ans de données de vent ( )

• Comparaison à l’écart-type calculé à partir de la matrice d’information

q(1,1) q(2,2) a(1) a(2) b(1) b(2) σ(1) σ(2)

Vraie valeur 0.97 0.96 0.84 0.78 1.06 2.10 1.23 2.30

Biais 0.001 -0.001 -0.003 -0.002 0.020 0.019 0.001 -0.006

Ecart-type 0.028 0.033 0.049 0.058 0.337 0.499 0.126 0.218

σinformation 0.030 0.036 0.055 0.061 0.384 0.604 0.125 0.216

supθ Θ∈ y0

y1

s, ,( ), Y Y S××∈ gθ y1y0s,( ) ∞=

T MS γAR–

T T 2700≈

Etude théorique: validation de modèle

Page 16

Validation de modèle

Différents critères sont généralement utilisés...

• Interprétabilité de la variable cachée• Cycles économiques, types de temps, déplacement des masses d’air...

• Propriétés des résidus• Test d’indépendance, variance du résidu

Tests d’adéquation

• Choix de différents critères, selon l’application

• Fonction de répartition marginale, fonction d’autocorrélation...

• Pour chacun de ces critères, choix d’une statistique de test • Exemple: distance de Kolmogorov-Smirnov

• Estimation de la loi de sous par simulation

Sélection de modèle

• Première sélection avec le critère

W

W H0

BIC 2l θ̂( )– npar

T( )ln+=

Modèles en un point fixe

Page 17

3. Modèles en un point fixe

Données utilisées

• Produites par OCEANWEATHER

• Données de “hindcast”

• 22 ans,

• Point étudié: (46.25N, 1.67 E)

• : intensité du vent ( ), : direction du vent (degré)

Composantes non stationnaires

• Pas de tendance significative

• Composantes saisonnières

• Données mois par mois

• Composantes journalières

• Négligeables en hiver

• Modèle spécifique en été

∆t 6h=

Ut

{ } ms1– Φ

t{ }

0 5 10 15 200

5

10

15

20

25

temps (années)

U

0 1 20

2

4

6

8

10


Page 18

Modèles pour l’intensité du vent (mois de janvier)

• Méthode usuelle (TGP) (Borgman et al., 1991)

• Hypothèse: est un processus gaussien

• et fonctions de répartition de et de la loi

• Simulation du processus gaussien par des méthodes exactes

• Permet de décrire la loi marginale et la structure d’ordre 2

• Ne permet pas de décrire l’existence de “type de temps”

• Modèle MS-γAR

• Première sélection avec BIC

• Modèles à 2 ou 3 régimes?

• Interprétabilité de la variable cachée et tests d’adéquation

M 1 2 3 4 5

BIC 10485 10316 10307 10343 10387

Vt

{ } Φ 1– °FUU

t( ){ }=

FUΦ U

tN 0 1,( )

Vt

{ }


Page 19

Interprétabilité des différents régimes (M=2)

• Paramètres régissant l’évolution dans les différents régimes

• Premier régime: faiblement perturbé, conditions anticycloniques

• Deuxième régime: volatilité plus importante, conditions dépressionnaires

• Matrice de transition de la CM cachée

• Temps de séjour moyen:

• dans le premier régime

• dans le deuxième régime

Régime 1 (s=1) 1.37 [0.12] 0.79 [0.05] 1.46 [0.33]

Régime 2 (s=2) 2.40 [0.21] 0.77 [0.06] 2.24 [0.49]

0.98 [0.03] 0.02 [0.03]

0.03 [0.04] 0.97 [0.04]

σ s( ) a s( ) b s( )

q i j,( ) j 1= j 2=

i 1=

i 2=

14 jours≈ 7 jours≈


Page 20

• Exemple d’évolution des probabilités de lissage

• Répartition empirique de la direction du vent dans les différents régimes

• Conditions dépressionnaires associées à des vents de Sud-Ouest

0 5 10 15 20 25 300

10

20

0

1

0 5 10 15 20 25 300

1

P(St=1/u1,...uT)

P(St=2/u1,...uT)

Ut

temps (jours)

Régime 1 Régime 2


Page 21

• Comparaison des modèles et

• Valeur entre crochets: limite de la région de rejet au seuil

Statistique observée (noir) et correspondant au modèle (rouge)

TGP M=2 M=3

Fonct. répart. marginale 0.808 [0.012] 0.000 [0.012] 0.641 [0.024]

Fonct. d’autcorrél. 0.062 [0.012] 0.057 [0.009] 0.086 [0.022]

Fonct. répart. durée tempêtes (14 ms-1) 0.053 [0.012] 0.367 [0.032] 0.080 [0.016]

Fonct. répart. durée inter-tempêtes 0.002 [0.006] 0.284 [0.002] 0.053 [0.009]

Fonct. répart. durée calme (7 ms-1) 0.124 [0.031] 0.009 [0.031] 0.346 [0.004]

TGP MS γAR–

α 5%=

0 10 20 300

0.2

0.4

0.6

0.8

1

0 5 10 15 20 250

0.2

0.4

0.6

0.8

1


Page 22

Deux extensions (chaîne cachée non-homogène)

• En présence de composantes journalières

• une matrice stochastique, , ,

• Pour décrire la relation avec la direction du vent

qθt( )

i j,( ) P St

j= St 1–

i=( ) qi j, κ j ωt Φj+( )cos( )exp∼=

Q qi j,( )= κ j 0> Φj 0 2π[,[∈ ω π 2⁄=

0 0.5 1 1.5 20

5

10

15

20

25

30

35

40

qθt( )

i j,( ) P St j= St 1–i=( ) qi j, κ j Φt Φj–( )cos( )exp∼=

−20 −10 0 10 20−15

−10

−5

0

5

10

15

20

Modèle spatio-temporel

Page 23

4. Modèle spatio-temporel

Données utilisées

• Produites par ECMWF

• Données de “hindcast”• Disponibles sur tout le globe

• ,

• 11 ans (mois de janvier)

• Restriction à une zone

•

• points

Notations

• , : composantes zonale et méridienne

•

v

u

Wφ

−35 −30 −25 −20 −15 −10 −5 0

40

45

50

55

0

8

16

25

−30 −28 −26 −24

45

46

47

48

49

x∆ y∆ 1.125°= = ∆t 6h=

R0

600km 600km×N 35=

ZtR0

( ) u r1

t,( ) … u rN

t,( ) v r1

t,( ) …v rN

t,( ),,,,( )=

u v

R0

r1… r

N, ,( )=


Page 24

Choix du modèle

Les structures météo se déplacent...

• déplacement entre et

• A valeurs dans

• Vitesses inférieures à

Utilisation d’un modèle

Paramétrisation et estimation

• Estimation des valeurs prises par le processus

• Utilisation d’information supplémentaire (champs sur une plus grande zone)

• Utilisation de ces déplacements estimés pour...

• Choisir des formes paramétriques pour , , et

• Obtenir une première estimation de

• Réestimation des paramètres du modèle

−30 −20 −10 0

40

45

50

55

0

8

16

25

−30 −20 −10 0

40

45

50

55

0

8

16

25

4/01/1998 12h 4/01/1998 18h

St

t 1– t

a1… a

M, ,{ } Z

2⊂

150kmh 1–

MS LAR–

ZtR0

( ) AθS

t( )Z

t 1–R0

( ) BθS

t( )

HθS

t( )εt

+ +=

St

{ }

Aθs( )Bθ

s( ) Σθs( )

Hθs( )Hθ

s( )( )'= Qθ

θ


Page 25

Paramétrisation de

•

• : déformation du champ entre les instants et

• fixée, permettant d’extrapoler le champ sur la zone à par-

tir du champ sur la zone

Paramétrisation de

•

• 6 paramètres

Paramétrisation de

• 7 paramètres

As( )

Zt 1–

R0

( ) Z≈tR0

St

+( ) δt

+

δt

t 1– t

As( )

R0

R0

s+

Ms( )

I As( )

–( ) 1–B

s( )=

Ms( )

Fs G+=

20 40 60

20

40

60

−5

0

5

10

15

20 40 60

20

40

60

−5

0

5

10

15

Paramétrique (s=(3,0))Empirique (s=(3,0))

Σ s( )


Page 26

Paramétrisation de l’évolution de la CM cachée

• 6 paramètres

Estimation des paramètres

• Nombre total de paramètres: 19

• Première estimation à partir des déplacements estimés

• EM puis quasi-Newton

• Temps de calcul importants...

• Grand nombre d’états pour la CM cachée

• Complexité des probabilités d’émission

q i j,( ) P= St

aj St 1–ai= =( )

ai aj– 2

σ2---------------------– aj a

0–( )'O 1–

aj a0

–( )– exp∼


Page 27

Validation

• En prédiction• Comparaison avec un modèle AR(1) (trait fin)

• En simulation

• Structure d’ordre 2 bien reproduite

• Lois marginales aux différents points mal reproduites

−26−24

−22−20

44

46

48

500

2

4

6

8

10

12

−26−24

−22−20

44

46

48

500

5

10

15

20

Composante zonale Composante méridienne

Perspectives

Page 28

Perspectives

• Etude théorique des modèles MS-AR

• Normalité asymptotique des EMV dans les modèles

• Propriétés asymptotiques des EMV lorsque est non-homogène

• Sélection de modèle

• Modèles en un point fixe

• Tester les modèles sur d’autres paramètres ( , ,...)

• Tester les modèles sur des mesures “in-situ”

• Modèles paramétriques pour les séries directionnelles ( , ,...)

• Modèle spatio-temporel

• Algorithmes plus efficaces pour le calcul des paramètres

• Tester d’autres paramétrisations

• Reconstruction de , ,... à partir des séries de vent

• Boîte à outils (Matlab)

MS γAR–

St

{ }

Hs Tp

Φ Θm

HsTp

Date post:	27-Apr-2021
Category:	Documents
Upload:	others
View:	0 times
Download:	0 times

Modèles autorégressifs à changements de régimes ......Motivations • Conditions d’états de...

Documents