+ All Categories
Home > Documents > These Alimentation Matematique Risque Alimentaire

These Alimentation Matematique Risque Alimentaire

Date post: 14-Oct-2015
Category:
Upload: mariuscozma
View: 37 times
Download: 0 times
Share this document with a friend
Description:
These Alimentation Matematique Risque Alimentaire
Popular Tags:

of 168

Transcript
  • UNIVERSITE PARIS X - NANTERREECOLE DOCTORALE CONNAISSANCE ET CULTURE

    T H E S Epour obtenir le grade de

    DOCTEUR DE LUNIVERSITE PARIS X

    Discipline : Mathmatiques Appliques et Applications des Mathmatiques

    prsente par

    Jessica TRESSOU

    et soutenue publiquement le 9 dcembre 2005

    Titre de la these

    Mthodes statistiques pour lvaluation du risque alimentaire

    sous la direction de

    Patrice BERTAIL

    Composition du Jury

    President

    Mme Judith Rousseau Professeur, Universit Paris IX, Paris

    Rapporteurs

    Mme Sylvie Huet Directeur de Recherche, INRA MIA, Jouy en JosasM. Hilko van der Voet Senior Statistician, Biometris, Wageningen, Pays-Bas

    Examinateurs

    Mme Karine Tribouley Professeur, Universit Paris X, NanterreM. Philippe Verger Directeur de Recherche, INRA Mt@risk, ParisM. Patrice Bertail Professeur, Universit Paris X, Nanterre

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 2tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • Remerciements

    Trois annes de travail, de nombreuses rencontres, et un grand nombre de personnes remercier...Par o commencer ... certainement par celui qui ma convaincue, il y a maintenant

    plus de trois ans, par son enthousiasme pour la recherche applique et ses comptences enrecherche thorique, Patrice Bertail. Il a t un directeur de thse attentionn et disponible.Je le remercie sincrement davoir cru en moi et de la conance quil me tmoigne encoreen me prsentant ses collaborateurs hongkongais.Merci Sylvie Huet et Hilko van der Voet davoir accept, avec un enthousiasme qui

    me touche particulirement, dtre les rapporteurs de cette thse. Je remercie galement sin-crement Judith Rousseau, Karine Tribouley et Philippe Verger qui les ont rejoints dans cetteaventure "risque" en tant que membres du jury.Revenons au dbut de lhistoire...Ma rencontre avec le risque alimentaire est incarne par Jean-Charles Leblanc, qui pen-

    sait, il y a maintenant trois ans, que "mes stats" pouvaient solutionner tous ces problmesdvaluation de risque... Je le remercie vivement pour son soutien et les discussions enrichis-santes que nous avons eues maintes reprises sur le risque et sur le monde de la rechercheen gnral.Trs bien accueillie pour mes dbuts dans la recherche par lensemble des membres du

    CORELA, je tiens remercier particulirement Pierre Combris et France Caillavet pourleur gnreuse aide ; Christine Boizot et David Delobel, pour qui le panel SECODIP na plusde secret ; Olivier Allais avec qui jai dcouvert les multiples sigles et lunivers de lINRA;Anne Lhuissier, Fabrice Etil et Sverine Gojard, sans qui les sorties piscine auraient tbien tristes...A force dy croire, lunit INRA-Mt@risk est ne : dmnagement lINA P-G et une

    nouvelle tape commence... Rencontre de Philippe Verger (le directeur !), qui ma rapidementaccord une trs (trop ?) grande conance, Max Feinberg qui a toujours port une grandeattention mon travail, Isabelle Albert pour ses conseils et son soutien et Catherine Dervinqui dispute le rle de seconde maman avec Nadine Flavigny, toujours prtes rendre demultiples services, en particulier aux thsardes... Je tiens particulirement remercier AmlieCrpet avec qui nous partageons depuis quatre ans nos soucis statistiques et autres ; EmilieCounil, qui ma devance de peu pour terminer sa thse et ma soutenue jusquau rush nal ;et Hugo Harari qui ma laisse monopoliser notre directeur de thse dans les derniers temps.Merci galement Sandrine Blanchemanche et Patrice Buche pour leur enthousiasme etleur dynamisme au sein de lunit et lensemble des membres de Mt@risk. Une penseparticulire pour Eloisa D. Caldas et Guillaume Drot avec qui jai beaucoup apprci de

    3

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 4 REMERCIEMENTS

    travailler ; et Stphan Clmenon, qui nous a rejoint trop rcemment mais me permettra dedcouvrir dautres domaines des mathmatiques appliques.Merci galement Sylvie Mlard, Stphane Robin, Jean-Jacques Daudin et Franck Picard

    qui, malgr des emplois du temps bien remplis, ont pris le temps de rpondre mes questions.Cette thse naurait pas t la mme sans laide des bibliothcaires dici et dailleurs :

    merci Josette Renaud de lENSAE, Annick Ravaud Ivry sur Seine et Carole Tiphaine delINA P-G.Le tableau serait incomplet si joubliais les collgues chargs de TD : Fabrice Wilthien,

    Chi Viet Tran, Clo Tavan, et les autres...Merci mes parents et ma soeur qui mont toujours soutenue tout au long de ces trois

    annes.Je noublie bien sr pas mes amis dOrlans, qui ny vivent plus pour la plupart, et ceux

    de Paris ou dailleurs, qui me manqueront certainement beaucoup dans mon aventure Hong-kongaise...Un dernier clin doeil Maman, Julia, Isabelle, Zo et Coco pour leur participation la

    dernire relecture !Last but not least... mon Coco ! Il a le mrite de mavoir supporte plus que tous et

    senvolera vers de nouveaux horizons avec moi pour continuer de le faire...

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • Table des matires

    Remerciements 3

    Table des matires 5

    Table des gures 9

    Liste des tableaux 11

    Liste dacronymes et abbrviations 13

    1 Introduction 151.1 Lanalyse de risque alimentaire . . . . . . . . . . . . . . . . . . . . . . . . . 171.2 Les donnes disponibles en France et leurs particularits . . . . . . . . . . . 19

    1.2.1 Consommation alimentaire des individus . . . . . . . . . . . . . . . . 191.2.2 Contamination . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.2.3 Appariement des donnes de consommation et de contamination . . . 22

    1.3 Les mthodes usuelles dvaluation de lexposition . . . . . . . . . . . . . . . 221.3.1 Construction de la distribution dexposition . . . . . . . . . . . . . . 231.3.2 Grandeurs dintrt et risque chronique . . . . . . . . . . . . . . . . . 25

    1.4 Principaux rsultats de la thse . . . . . . . . . . . . . . . . . . . . . . . . . 261.4.1 Les risques alimentaires : un phnomne extrme ? . . . . . . . . . . . 261.4.2 Evaluation empirique des risques . . . . . . . . . . . . . . . . . . . . 281.4.3 Modlisation de la censure des donnes de contamination . . . . . . . 301.4.4 Evaluation de lexposition individuelle de long terme partir de don-

    nes mnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321.4.5 Finalisation informatique des recherches . . . . . . . . . . . . . . . . 34

    2 Valeurs extrmes et risque alimentaire 352.1 Valeurs extrmes et indice de Pareto . . . . . . . . . . . . . . . . . . . . . . 36

    2.1.1 Valeurs extrmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362.1.2 Loi de Pareto et Pareto gnralise . . . . . . . . . . . . . . . . . . . 392.1.3 Lestimation indirecte : mthode P.O.T. . . . . . . . . . . . . . . . . 422.1.4 Lestimation directe : estimateurs classiques . . . . . . . . . . . . . . 43

    2.2 Mise en vidence du biais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482.2.1 Fonctions variation lente et biais . . . . . . . . . . . . . . . . . . . 48

    5

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 6 TABLE DES MATIRES

    2.2.2 Quelques simulations . . . . . . . . . . . . . . . . . . . . . . . . . . . 502.3 Mthode de correction du biais . . . . . . . . . . . . . . . . . . . . . . . . . 52

    2.3.1 Description du modle . . . . . . . . . . . . . . . . . . . . . . . . . . 522.3.2 Estimation des paramtres . . . . . . . . . . . . . . . . . . . . . . . . 552.3.3 Mise en oeuvre de ces mthodes sur donnes simules . . . . . . . . . 56

    2.4 Caractrisation des populations risque . . . . . . . . . . . . . . . . . . . . 582.4.1 Facteurs dterminant lappartenance la zone risque . . . . . . . . 592.4.2 Caractrisation des populations risque partir de la loi des excs . 60

    2.5 Illustration : risque alimentaire . . . . . . . . . . . . . . . . . . . . . . . . . 612.5.1 Risque dexposition lacrylamide . . . . . . . . . . . . . . . . . . . . 612.5.2 Risque dexposition au mthylmercure . . . . . . . . . . . . . . . . . 642.5.3 Caractrisation des populations exposes au mthylmercure . . . . . . 68

    Annexe 2.A Donnes de consommation franaises . . . . . . . . . . . . . . . . . . 722.A.1 Lenqute individuelle nationale sur les consommations alimentaires

    (INCA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 722.A.2 Le panel SECODIP . . . . . . . . . . . . . . . . . . . . . . . . . . . . 732.A.3 Les autres sources de donnes sur la consommation . . . . . . . . . . 75

    Annexe 2.B Rappel sur la thorie des valeurs extrmes . . . . . . . . . . . . . . 762.B.1 Thorme de Fisher & Tippett (1928) . . . . . . . . . . . . . . . . . . 762.B.2 Fonctions variation lente et rgulire . . . . . . . . . . . . . . . . . 762.B.3 Caractrisation des trois domaines dattraction . . . . . . . . . . . . . 77

    Annexe 2.C Quelques rsultats sur les statistiques dordre . . . . . . . . . . . . 782.C.1 Lemme de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 782.C.2 Construction dcarts . . . . . . . . . . . . . . . . . . . . . . . . . . . 782.C.3 Reprsentation de Rnyi . . . . . . . . . . . . . . . . . . . . . . . . . 79

    Annexe 2.D Correction de biais pour une fonction variation lente de type loga-rithmique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 802.D.1 Preuve du thorme 2.3.2 . . . . . . . . . . . . . . . . . . . . . . . . 802.D.2 Estimation des paramtres du modle . . . . . . . . . . . . . . . . . . 80

    Annexe 2.E Calcul de linformation de Fisher . . . . . . . . . . . . . . . . . . . . 81

    3 valuation empirique des risques 833.1 Estimation de la probabilit de dpasser un seuil d . . . . . . . . . . . . . . 84

    3.1.1 Notations et paramtrisation du problme . . . . . . . . . . . . . . . 843.1.2 Comportement asymptotique de lestimateur plug-in . . . . . . . . . 85

    3.2 Approximation par une U-Statistique incomplte . . . . . . . . . . . . . . . . 883.2.1 Principe gnral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 883.2.2 Cas du tirage alatoire avec remise . . . . . . . . . . . . . . . . . . . 883.2.3 Approximation de la variance : Jackknife ou Bootstrap . . . . . . . . 89

    3.3 Intervalles de conance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 923.3.1 Construction des intervalles . . . . . . . . . . . . . . . . . . . . . . . 923.3.2 Algorithme de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . 923.3.3 Validation par simulation . . . . . . . . . . . . . . . . . . . . . . . . 94

    3.4 Illustration : risque dexposition lochratoxine A . . . . . . . . . . . . . . . 95

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • TABLE DES MATIRES 7

    3.4.1 Description des donnes . . . . . . . . . . . . . . . . . . . . . . . . . 953.4.2 Rsultats et discussion . . . . . . . . . . . . . . . . . . . . . . . . . . 96

    Annexe 3.A Quelques rsultats sur les U-statistiques . . . . . . . . . . . . . . . . 99Annexe 3.B Preuves et complments . . . . . . . . . . . . . . . . . . . . . . . . . 104

    3.B.1 Preuve du thorme 3.1.1 . . . . . . . . . . . . . . . . . . . . . . . . 1043.B.2 Preuve de la proposition 3.2.1 . . . . . . . . . . . . . . . . . . . . . . 1053.B.3 Preuve du thorme 3.2.1 . . . . . . . . . . . . . . . . . . . . . . . . 106

    4 Traitement de la censure 1094.1 Mthode paramtrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1104.2 Mthode non paramtrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

    4.2.1 Estimateur de Kaplan Meier pour des donnes censures gauche . . 1114.2.2 Estimation de la probabilit de dpasser un seuil d . . . . . . . . . . 1124.2.3 Mise en oeuvre pratique : estimation et intervalles de conance . . . 1164.2.4 Validation par simulation . . . . . . . . . . . . . . . . . . . . . . . . 118

    4.3 Illustration : risque dexposition lochratoxine A . . . . . . . . . . . . . . . 119Annexe 4.A Hadamard direntiabilit et Delta-mthode fonctionnelle . . . . . . 124Annexe 4.B Comportement asymptotique . . . . . . . . . . . . . . . . . . . . . . 125

    5 Individualisation et risque de long terme 1295.1 Dcomposition de quantits unidimensionnelles . . . . . . . . . . . . . . . . 130

    5.1.1 Indpendance des individus . . . . . . . . . . . . . . . . . . . . . . . 1315.1.2 Dpendance au sein du mnage . . . . . . . . . . . . . . . . . . . . . 135

    5.2 Validation empirique sur les donnes INCA . . . . . . . . . . . . . . . . . . . 1355.3 Extensions du modle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

    5.3.1 Introduction de caractristiques socio-dmographiques . . . . . . . . 1375.3.2 Introduction dune dimension temporelle . . . . . . . . . . . . . . . . 1385.3.3 Dcomposition de quantits multidimensionnelles . . . . . . . . . . . 139

    5.4 Quantication du risque de long terme . . . . . . . . . . . . . . . . . . . . . 1405.5 Application : mthylmercure dans les produits de la mer . . . . . . . . . . . 142

    5.5.1 Choix du modle de base pour une quantit unidimensionnelle . . . . 1435.5.2 Inuence de certaines caractristiques socio-dmographiques . . . . . 1445.5.3 Quantication du risque de long terme . . . . . . . . . . . . . . . . . 146

    5.6 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1515.6.1 Une modlisation en deux tapes . . . . . . . . . . . . . . . . . . . . 1515.6.2 Vers le modle de ruine . . . . . . . . . . . . . . . . . . . . . . . . . . 1515.6.3 Intgration des mthodes dvaluation des risques sur le long terme . 151

    Annexe 5.A Description simplie de la mthode Chesher . . . . . . . . . . . . . 153Annexe 5.B Estimation dun modle mixte par maximum de vraisemblance res-

    treint (REML) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153Annexe 5.C Estimation de la variance de lexposition individuelle . . . . . . . . . 155Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 8 TABLE DES MATIRES

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • Table des gures

    2.1 Distribution de lexposition totale au mercure en mg/an . . . . . . . . . . . 392.2 Comparaison des queues de courbes de type Pareto pour divers . . . . . . 412.3 QQ-plot de lexposition au mercure . . . . . . . . . . . . . . . . . . . . . . . 442.4 Estimateur de Hill bHk;n en fonction de k . . . . . . . . . . . . . . . . . . . . 442.5 Comparaison destimateurs de lindex de Pareto, exposition au mercure . . . 472.6 Estimateur de bas sur la mthode de Bertail et al. (2004) . . . . . . . . . 482.7 Comparaison destimateurs de (exposition au mercure) . . . . . . . . . . . 482.8 Comparaison de trois estimateurs de selon k pour la simulation dune vraie

    loi de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.9 Comparaison de deux estimateurs de selon k pour la simulation dune vraie

    loi de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.10 Comparaison de trois estimateurs de selon k pour la simulation dun mlange

    de lois de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.11 Comparaison de deux estimateurs de selon k pour la simulation dunmlange

    de lois de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.12 Comparaison des trois estimateurs de selon k pour la simulation dune loi

    de Pareto perturbe par une fonction variation lente en logarithme . . . . . 512.13 Comparaison des deux estimateurs de selon k pour la simulation dune loi

    de Pareto perturbe par une fonction variation lente en logarithme . . . . . 512.14 Correction de lestimateur de Hill sur donnes simules par un mlange de lois

    de Pareto sous lhypothse VL en puissance . . . . . . . . . . . . . . . . . . 572.15 Correction de lestimateur de Hill sur donnes simules par une loi de Pareto

    perturbe par une fonction VL en log sous lhypothse VL en puissance . . 572.16 Correction de lestimateur de Hill sur donnes simules par un mlange de lois

    de Pareto sous lhypothse VL en log . . . . . . . . . . . . . . . . . . . . . . 572.17 Correction de lestimateur de Hill sur donnes simules par une loi de Pareto

    perturbe par une fonction VL en log sous lhypothse VL en log . . . . . 572.18 Hill par CSP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 582.19 Exposition lAcrylamide . . . . . . . . . . . . . . . . . . . . . . . . . . . . 622.20 Estimation de lindice de risque pour lexposition lacrylamide . . . . . . 632.21 Correction de biais : exposition au methylmercure . . . . . . . . . . . . . . . 662.22 Limite de lutilisation de la thorie des valeurs extrmes dans le calcul de la

    probabilit de dpassement dun seuil (DHT, par exemple). . . . . . . . . . . 672.23 Coe cients estims du modle Probit . . . . . . . . . . . . . . . . . . . . . . 69

    9

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 10 TABLE DES FIGURES

    2.24 Estimation de limpact des variables CSP sur le risque dexposition au mercure. 692.25 Impact du diplme sur le niveau du risque dexposition au mercure . . . . . 702.26 Impact de la variable sans Enfant sur le niveau du risque dexposition au

    mercure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

    3.1 Histogrammes des distributions des consommations et des contaminations as-socies en OTA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

    4.1 Estimateur de la fonction de rpartition dFKM . . . . . . . . . . . . . . . . . 1134.2 Description de la Procdure KM . . . . . . . . . . . . . . . . . . . . . . . . . 1164.3 Comparaison de direntes distributions de lexposition lOTA. . . . . . . . 120

    5.1 Validation de la mthode de dcomposition sur les donnes INCA. . . . . . . 1375.2 Estimation des lexpostion individuelle moyenne par ge et sexe par la m-

    thode de Chesher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1385.3 Estimation de lexposition individuelle moyenne selon lge et le sexe . . . . 1445.4 Estimation de lexposition individuelle moyenne des hommes selon lge . . . 1455.5 Estimation de lexposition individuelle moyenne des femmes selon lge . . . 1465.6 Exposition individuelle moyenne des femmes selon lge et la classe sociale . 1475.7 Exposition individuelle moyenne des femmes selon lge et la rgion de rsidence1485.8 Risque moyen de dpassement de la DHT (MeHg) au cours du temps pour

    lanne 2001. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1495.9 Exposition cumule au MeHg au cours du temps . . . . . . . . . . . . . . . . 150

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • Liste des tableaux

    2.1 Correction de biais : valeurs optimales de k et des paramtres . . . . . . . . 562.2 Description des donnes pour lAcrylamide . . . . . . . . . . . . . . . . . . . 622.3 Exposition lacrylamide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 642.4 Exposition aux mtaux lourds . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    3.1 Probabilits de couvertures et longueurs des dirents IC . . . . . . . . . . . 953.2 Dcomposition de la variance, comparaison de populations . . . . . . . . . . 983.3 Risque dexposition lOTA . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

    4.1 Probabilits de couvertures et longueurs des dirents IC . . . . . . . . . . . 1194.2 Comparaison des distributions dexposition lOTA . . . . . . . . . . . . . . 1214.3 Inuence du choix des paramtres dans la construction des intervalles . . . . 1214.4 Dcomposition de la variance . . . . . . . . . . . . . . . . . . . . . . . . . . 1224.5 Inuence de lge sur la probabilit de dpasser un seuil tolrable . . . . . . 1224.6 Impact de lintroduction dune limite maximale sur les crales . . . . . . . . 1224.7 Impact de lintroduction dune limite maximale sur les vins . . . . . . . . . . 123

    5.1 Estimation des paramtres du modle 5.4 selon direntes hypothses . . . . 143

    11

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 12 LISTE DES TABLEAUX

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • Liste dacronymes et abbrviations

    ACR : Acrylamide AFSSA :Agence Franaise de scurit sanitaire des aliments DGAL : Direction Gnrale de lALimentation DGCCRF : Direction Gnrale de la Concurrence, de la Consommation et de la R-pression des Fraudes

    DHT : Dose Hebdomadaire Tolrable FAO : Food Agricultural Organization IEFS : Institute of European Food Studies INRA : Institut National de Recherche Agronomique JECFA : Joint FAO/WHO Expert Committee on Food Additives and contaminants MAAPAR : Ministre de lAgriculture, de lAlimentation,de la Pche et des AairesRurales

    MeHg : Mthylmercure NOAEL : No Observed Adverse Eect Level OMS : Organisation Mondiale de la Sant OTA : Ochratoxine A SCF : Scientic Committee on Food (comit de lUnion Europenne)WHO : World Health Organization

    cdf : cumulative distribution function (Fonction de rparatition) EVT : Extreme Value Theory IC : Intervalle de Conance i.i.d. : indpendant et identiquement distribuML : Maximum Likelihood pdf : probability distribution function (densit) REML : REstricted Maximum Likelihood SASAR : Sondage Alatoire Simple Avec Remise v.a. : variable alatoire

    13

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 14 ACRONYMES ET ABBREVIATIONS

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • Chapitre 1

    Introduction

    Lvaluation du risque alimentaire est un domaine dapplication relativement nouveaupour les statisticiens : il trouve depuis peu sa place dans les congrs internationaux destatistiques (voir le site du congrs du 25me "European Meeting of Statisticians"1, sessionStatistics in environmental and food sciences). Cest galement lune des sept priorits du7ime PCRD (Programme Cadre de Recherche et Dveloppement2).Le but dune analyse de risque alimentaire est de dterminer si une substance donne

    peut poser un problme de sant publique, de caractriser les individus les plus risques etles moyens de rduction du risque les plus e caces an de mettre ventuellement en oeuvrecertaines mesures de scurit sanitaire (FAO/WHO, 1995). La notion de risque alimentairene peut videmment tre totalement dissocie de la notion oppose de bnces. Ainsi uneremarque pralable la lecture de ces pages est quaucune personne travaillant dans cedomaine na cess de salimenter au vu des multiples risques quil est toujours important derelativiser. Le but de cette thse nest videmment pas de diaboliser certains aliments ougroupes daliments.Lvaluation du risque alimentaire est un vaste domaine comportant plusieurs spcialits.

    Ceci explique en particulier le caractre pluridisciplinaire de lunit INRA-Mt@risk danslaquelle a t eectue la thse.En eet, les aliments peuvent contenir diverses substances (contaminants chimiques, ad-

    ditifs, pesticides, bactries pathognes) qui, lorsquelles sont ingres en grandes quantits oude manire rpte, peuvent avoir des eets nfastes sur la sant. Ltude des moyens dac-tions de ces direntes substances fait appel aux comptences de mdecins, toxicologues,vtrinaires et autres biologistes ainsi qu celles des pidmiologistes. Les chimistes ou mi-crobiologistes doivent aussi dvelopper des techniques analytiques de pointe pour tre enmesure de quantier des doses trs faibles de contaminants ou autres substances pathognes.Par ailleurs, ltude du comportement des consommateurs ncessite lexpertise dconomisteset de sociologues, dune part, et de mdecins nutritionnistes, dautre part. Enn, lvalua-tion du risque alimentaire ncessite le recours des bases de donnes complexes dont laconstruction et la gestion requirent des comptences informatiques certaines.Le statisticien peut intervenir dans un grand nombre des tapes constituant une analyse

    1http ://www.ems2005.no2http ://www.telecom.gouv.fr/programmes/7pcrd

    15

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 16 CHAPITRE 1. INTRODUCTION

    du risque alimentaire : de nombreux modles ont dj t dvelopps dans le cadre de lamicrobiologie prvisionnelle (modles de croissance bactrienne, McMeekin et al. (1993) ;modlisation dose-rponse, Daudin & Duby (2002)) ; des modles conomtriques (Deaton& Muellbauer, 1980) permettent dautre part de dcrire la demande en biens alimentaires ;les modles dpidmiologie (voir par exemple Clayton & Hills, 1993) tentent de mettre envidence le lien entre une forte exposition et le dveloppement dune maladie ou dun eetspcique... On pourrait encore citer de multiples exemples o les comptences du statisticienpermettent, partir de donnes exprimentales ou denqute, de quantier un phnomneet lincertitude y arant.

    Dans le cadre de cette thse, nous nous concentrons sur lvaluation du risque li la pr-sence de contaminants chimiques dont la toxicit est avre et chronique. Le danger est dansce cas beaucoup plus sournois puisque cest lexposition chronique, i.e. sur une priode trslongue, qui peut avoir des eets nfastes sur la sant des individus. Plus prcisment, pourchaque contaminant chimique susceptible davoir ce type deet, les mdecins et toxicologuesdterminent une dose tolrable par lorganisme humain partir dtudes exprimentales chezlanimal (Dybing et al., 2002) : si cette dose est dpasse tout au long de la vie ou du moinssur une longue priode, lindividu est considr comme risque. Cette dose est appele DoseJournalire Tolrable (DJT) ou Dose Hebdomadaire Tolrable (DHT) selon la priode consi-dre et est exprime relativement au poids corporel de lindividu. Nous cherchons dans cetravail essentiellement estimer la probabilit que lexposition un contaminant dpassecette dose tolrable et faisons rfrence cette quantit en terme de risque. Certains mde-cins pensent en particulier pouvoir expliquer la recrudescence de maladies comme le cancercomme une consquence de certains comportements alimentaires qui, dun point de vue nu-tritionnel, ne semblent pourtant pas poser le moindre problme. Par exemple, lochratoxineA, mycotoxine prsente en particulier dans les crales, le caf, le vin, les raisins et tous lesaliments " grains", est class comme un agent cancrigne et agirait sur le systme urinaire(Boizic et al., 1995) : les aliments en cause ont pourtant pour la plupart une image plu-tt positive en terme de sant. Les enjeux sont donc importants : la quantication prcisedu risque est essentielle en vue de politiques de scurit sanitaire e cientes. On pourra enparticulier sintresser limpact de normes toxicologiques sur certains aliments ou de re-commandations nutritionnelles : est-ce que le fait de limiter la contamination du vin, mesureenvisage par la Communaut Europenne, rduira de manire signicative le risque li la prsence dochratoxine A? Est-ce quune campagne dinformation encourageant certainespopulations limiter leurs consommations de tel ou tel produit permettra de rduire demanire signicative leur exposition ? Autant de questions qui ncessitent le dveloppementdoutils statistiques adquats.

    Lobjectif de ce chapitre introductif est de prsenter de manire gnrale le domaine dap-plication et de synthtiser les principaux apports de cette thse, tant au niveau statistiquequau niveau du domaine dapplication. Nous dressons dabord un panorama de lanalysedes risques alimentaires qui permettra de situer le contexte de ce travail. Nous prsentonsensuite lensemble des donnes disponibles en France dans le cadre de lvaluation du risquechimique qui nous intresse plus particulirement, quil sagisse de donnes de consomma-tion alimentaire ou de contamination des aliments. Nous dcrivons ensuite les direntesmthodes usuelles dvaluation de lexposition un risque alimentaire avant de prsenter les

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 1.1. LANALYSE DE RISQUE ALIMENTAIRE 17

    principaux rsultats de la thse, chapitre par chapitre.La plupart des travaux prsents ont fait lobjet dune publication ou sont en cours

    de rvision pour des revues internationales. Nous reproduisons ces articles dans un TomeAnnexe la thse, intitul Statistical Methods for Food Risk Assessmment.

    1.1 Lanalyse de risque alimentaire

    Lanalyse de risque, telle que dnie dans les comits dexperts3 et par la FAO (FoodAgricultural Organization, www.fao.org), se dcompose en trois tapes : Lapprciation du risque : il sagit de lidentication du danger, lestimation de laprobabilit de sa survenue et limportance des eets nfastes.

    La gestion du risque : il sagit didentier les direntes mesures de diminution durisque pralablement apprci et de quantier, en incluant les incertitudes arentes,la rduction de risque selon chaque scnario an de dterminer des solutions jugesacceptables. Ces mesures peuvent prendre plusieurs formes : introduction de teneursmaximales en contaminant sur certains aliments, retrait du march de certaines den-res, recommandations nutritionnelles... Dans ce cadre, les impacts conomiques detelles mesures sont tudies et mis en balance avec les rductions de risque attendues.

    La communication sur le risque : elle peut sappliquer tout moment de lanalyse derisque entre les responsables de lestimation du risque, les responsables de la gestiondu risque et les autres parties intresses (milieux professionnels, consommateurs).

    Ce processus peut tre appliqu divers types de risques ou de bnces mais nousciblerons plus particulirement les risques alimentaires dans la suite.Lapprciation du risque, souvent appele valuation du risque, a fait lobjet dun numro

    spcial de Food and Chemical Toxicology (Vol. 40, n 2et 3, mars 2002) auquel le lecteurpourra se rfrer pour une description plus dtaille. Elle suit galement un schma simpleo plusieurs questions doivent tre traites : lidentication du danger (Barlow et al., 2002) et la caractrisation du danger (Dybinget al., 2002)Il sagit didentier les couples aliments-pathognes pour lesquels existent un danger,i.e. pouvant provoquer des eets nfastes sur la sant et dtudier les mcanismesdaction du toxique ainsi que sa cintique dans lorganisme (absorption, mtabolismeet limination). Ceci requiert des techniques de toxicologies in vitro ou in vivo chez

    3Plusieurs comits dexperts se runissent tant au niveau national ou international pour traiter de cesquestions de risque alimentaires. Citons pour la France, lAgence Franaise de Scurit Sanitaire des Aliments(AFSSA) ; pour lUnion Europenne, lAutorit europenne de scurit des aliments (EFSA pour EuropeanFood Safety Authority) et les comits internationaux dexperts appels par la commission Codex Alimenta-rius, cre en 1963 par lorganisation des nations unies pour lalimentation et lagriculture (FAO de langlaispour Food Agricultural Organization) et lorganisation mondiale de la sant (OMS ou WHO de langlaispour World Health Organization) : le JECFA (Joint FAO/WHO Expert Committee on Food Additivesand contaminants) qui traite les risques lis aux additifs et aux contaminants chimiques, le JMPR (JointFAO/WHO Meetings on Pesticide Residues) qui value le risque li aux rsidus de pesticides et le JEMRA(Joint FAO/WHO Meetings on Microbiological Risk Assessment) qui traite le risque microbiologique. Nousinvitons le lecteur se reporter aux sites internet de ces dirents acteurs pour plus de dtails sur leurs rlesrespectifs.

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 18 CHAPITRE 1. INTRODUCTION

    lanimal. Il en rsulte des relations dose-rponse entre la dose ingre et le ou les eetsnfastes considrs ou plus simplement des doses tolrables par lorganisme, dabordpour lanimal puis pour lhomme.

    lvaluation de lexposition (Kroes et al., 2002) et la caractrisation du risque (Renwicket al., 2003)Il sagit de quantier lexposition des individus dune population donne lagent pa-thogne tudi sur une priode su samment longue en comparaison des eets tudis.Il sagit donc dvaluer la consommation des aliments incrimins et leur contaminationpour estimer lexposition. Il sagit ensuite de comparer lexposition aux doses tolrablesou relations dose-rponse obtenues dans ltape de caractrisation du danger.

    Cest cette dernire tape qui nous intresse principalement dans cette thse. En eet,nous ne remettrons pas en cause le fait quil existe un danger, ni la dose partir de laquelleles eets nfastes peuvent se produire, mais garderons toutefois lesprit la manire dontcette quantit est dtermine an de relativiser les rsultats. En eet, les doses obtenues dansltape de caractrisation du danger sont ensuite transposes lhomme via des facteurs descurit intra et inter espces, parfois grossiers, qui laissent une grande incertitude autourde ces valeurs toxicologiques de rfrence. Des travaux statistiques sont galement entreprisdans les tapes didentication et caractrisation du danger (Edler et al., 2002), notammentpour le calibrage de relations dose-rponse.

    On peut distinguer et parfois opposer plusieurs types de risques.

    Dabord, selon que les eets nfastes se produisent peu de temps aprs une ingestionponctuelle forte dose ou quils se manifestent plusieurs annes plus tard aprs des ingestionsrptes faible dose. On parle respectivement de risque aigu (acute en anglais) et de risquechronique (Carriquiry et al., 1990). Un risque aigu typique est par exemple la listriose ouautre toxi-infection alimentaire dont lagent pathogne est bactrien. Un exemple simplede danger dans le cadre du risque chronique est le dveloppement de cancers. La causealimentaire de ce type de danger est souvent di cile prouver du fait de leur caractremultifactoriel. Lune des particularits de lanalyse dun risque chronique est que les dosestolrables par lorganisme sont en gnral dtermines pour une vie entire par extrapolationdexpriences ralises in vivo chez le rat par exemple. La di cult majeure est alors dequantier lexposition sur une vie entire...

    On peut aussi opposer les risques chimiques (additifs alimentaires, contaminants, sub-stances aromatisantes, migrants des emballages alimentaires et des rsidus de pesticides etde mdicaments vtrinaires) aux risques microbiologiques (souches bactriennes, Jaykus,1996). Lune des dirences majeures entre ces deux types de risque est quen milieu favorableles bactries peuvent crotre (ou dcrotre) alors que la teneur en contaminant chimique dunaliment est suppose stable au cours du temps, bien que variable selon laliment dans les deuxcas. Les donnes de contamination ne sont par consquent pas utilises de la mme manire :par exemple, les rsultats de plans de surveillance, ralises sur laliment brut, peuvent treintgrs pour lvaluation dun risque chimique en utilisant des facteurs de recettes, alorsque dans lvaluation dun risque microbiologique, il faut valuer la teneur en bactries aumoment de la consommation de laliment ou bien modliser la croissance / dcroissance toutau long de la chane alimentaire (Haas et al., 1999).

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 1.2. LES DONNES DISPONIBLES EN FRANCE ET LEURS PARTICULARITS 19

    Dans le cadre de la thse, nous nous sommes principalement intresss au risque chroniqueli la prsence de contaminants chimiques. Cependant, pour certains rsidus de pesticides,on peut la fois tudier des risques chroniques et aigus ; de mme, bien que les risquesmicrobiologiques soient principalement aigus, des thmatiques de recherche mergent quantau risque ou bnce de long terme li labsorption rgulire de faibles doses de bactries.

    1.2 Les donnes disponibles en France et leurs parti-cularits

    Les objets principaux du statisticien dans le cadre de lvaluation de risque alimentaire li la prsence de contaminants chimiques dans les aliments sont les donnes de consommationainsi que les analyses prcisant la teneur en contaminant pour ces mmes aliments, appelesdonnes de contamination. Une bonne connaissance de ces donnes est indispensable an depouvoir proposer les modlisations adquates et dterminer si les hypothses du modle choisisont bien vries empiriquement. Ce sont mme souvent les caractristiques des donnesqui guident les recherches de modle. Etant amens utiliser ces donnes dans tout le corpsde la thse, nous avons dcid de les prsenter globalement dans cette introduction.

    1.2.1 Consommation alimentaire des individus

    La consommation alimentaire est value de plusieurs manires. Quatre types de donnessont en gnral utiliss : Les donnes de production permettent davoir une ide des quantits moyennesconsommes : ce type de donnes tend surestimer la consommation individuellerelle mais a lavantage dtre disponible pour la plupart des pays. La FAO les uti-lise pour dterminer des rgimes alimentaires types pour les direntes rgions dumonde (voir http ://www.who.int/foodsafety/chem/gems/en/index.html pour plus dedtails). Cinq rgimes (probablement 13 trs bientt) ont t mis en place pour pro-mouvoir et faciliter lvaluation de certains risques chimiques.

    Les enqutes de mnages sont de deux types : les premires sintressent plus la dpense (recueil de tickets de caisse de supermarchs par exemple) et les secondesrecueillent aussi les quantits achetes (comme les donnes du panel franais SECODIPdcrites dans lannexe 2.A.2). Serra-Majem et al. (2003) ont montr que ce type dedonnes peut donner une bonne ide des quantits consommes (pour le Canada etlEurope) bien que la consommation de certains aliments soit en gnral sous value(poisson, viande, lgumes frais ou secs) ou survalue (sucres, crales).

    Les enqutes individuelles sont principalement de deux types : celles demandant lenqut de noter chaque aliment consomm (carnets) et celles faisant appel leurmmoire (mthodes de rappel). Les carnets de consommations alimentaires sont remplispar les enquts pendant un ou plusieurs jours (sept pour lenqute INCA dcriteen annexe 2.A.1). Les mthodes de rappel consistent interroger lindividu sur sesconsommations passes, celles dune journe (rappel de 24h) ou bien plus globalementles habitudes de consommations (questionnaire de frquence).

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 20 CHAPITRE 1. INTRODUCTION

    Enn, les repas dupliqus permettent dobtenir des donnes prcises sur la com-position des aliments ingrs mais donnent moins dinformation sur le comportementalimentaire proprement dit.

    En ce qui concerne lvaluation du risque alimentaire, lidal est bien sr de disposer dedonnes de consommation individuelle prcises sur une priode assez longue. En eet,ds que lon sintresse des expositions chroniques, cest la consommation individuelle delong terme qui importe. Il nexiste actuellement pas de donnes de ce type en France. Uneautre caractristique importante est la donne du poids corporel des individus ncessairedans loptique de la comparaison de lexposition la DJT/DHT, dose tolrable exprim eng ou ng de contaminant par kilogramme de poids corporel par priode (jour ou semaine).Un panorama des donnes franaises de consommation est fourni dans lannexe 2.A.

    Dans les applications de cette thse, nous utilisons principalement lenqute individuellede consommation alimentaire (INCA, 1999) ou les donnes dachats des mnages du panelSECODIP (annes 1996 2001).Les donnes INCA (CREDOC-AFSSA-DGAL, 1999) fournissent le dtail de lensemble

    des consommations de 3003 individus sur une semaine ainsi que le poids corporel des indi-vidus. Ceci fait de cette base de donnes une source prcieuse pour lvaluation du risquealimentaire et seront utilises dans les chapitres 2, 3 et 4. Elle prsente cependant de mul-tiples biais principalement dus la courte dure de lenqute et lutilisation de la mthodedes quotas pour la slection des individus (Deville, 1991, pour une critique de ces mthodes).Les donnes SECODIP (Socit dEtudes de la Consommation, de la DIstribution et de

    la Publicit, qui sappelle dornavant TNS Secodip, http ://www.secodip.fr) sont constituesdes achats alimentaires hebdomadaires (quantits et prix) de mnages franais sur des p-riodes longues (en moyenne quatre ans). Ces donnes permettent donc dvaluer le comporte-ment alimentaire de long terme et sont trs utilises par les conomistes de la consommationpour modliser les dcisions de consommation. Elles ne permettent cependant pas dtudierle rgime alimentaire total du fait de lexistence de deux sous-panels disjoints nenregistrantpas les mmes types dachats et de lexclusion de lautoconsommation et de la restaurationhors foyer. Dans le cadre de lvaluation de risque, elles prsentent des inconvnients ma-jeurs : les quantits sont agrges au niveau des mnages dont on connat la composition entermes dge et de sexe et les poids corporels des individus ntaient pas demands jusquen2001. Nous dveloppons dans le chapitre 5 un outil permettant de dcomposer ces donnesmnage en donnes individuelles en vue de quantier le risque de long terme.

    1.2.2 Contamination

    Les donnes de contamination sont trs htrognes. Elles sont constitues de diversessries danalyses (plans de contrle) eectues par la Direction Gnrale de lAlimentation(DGAL) et la Direction gnrale de la Concurrence, de la Consommation et de la Rpressiondes Fraudes (DGCCRF) ou encore par des o ces nationales interprofessionnelles de liresagro-alimentaires comme lONIVINS (pour le vin) ou par des instituts de recherches spcia-liss (IFREMER pour les produits de la mer) ou par des centres techniques... Dans certainscas, comme, par exemple, pour des contaminants encore peu tudis en France, on ne dis-pose que de valeurs moyennes ou bien dintervalles de contamination sur dirents aliments

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 1.2. LES DONNES DISPONIBLES EN FRANCE ET LEURS PARTICULARITS 21

    recueillis dans la littrature.

    Lutilisation de donnes analytiques pose le problme du traitement de la censure (gauche) des valeurs releves. En eet, de nombreux rsultats danalyses sont infrieurs lalimite de dtection ou de quantication. La limite de dtection (LOD) est dnie commetant la plus petite quantit dune substance examiner dans un chantillon, pouvant tredtecte mais non quantie comme une valeur exacte. La limite de quantication (LOQ)est dnie comme tant la plus petite quantit dune substance examiner pouvant tredose dans les conditions exprimentales dcrites avec une justesse et une reproductibilitdnies. Ces limites varient donc selon la technique analytique retenue et laliment sur lequelest eectu lanalyse. Une donne de la forme "

  • 22 CHAPITRE 1. INTRODUCTION

    1.2.3 Appariement des donnes de consommation et de contami-nation

    Reste ensuite apparier les donnes de consommation aux donnes de contamination,cest dire faire correspondre les deux nomenclatures. Pour cela, il est souvent ncessairede crer des groupes daliments dont la contamination est similaire. Un point essentiel de cerapprochement de nomenclature est lutilisation de facteurs de recettes (processing) qui per-mettent dattribuer une contamination des plats composs de plusieurs ingrdients (Counilet al., 2005a; Verger et al., 2005). Le choix du nombre de ces groupes et des aliments lesconstituant peut avoir une inuence importante sur le niveau dexposition et est souventdirig par le mode destimation retenu pour cette dernire. En eet, si lon souhaite dispo-ser pour chaque groupe daliments dun nombre important danalyses, on aura tendance agrger davantage des aliments semblables en termes de contamination. Cette question estdi cile et requiert souvent la comptence de spcialistes en toxicologie, en nutrition et ensciences agro-alimentaires. Une tude de sensibilit ce choix a t mene pour les produitsde la mer, pour plus de dtails, se reporter Tressou et al. (2004a), article donn dans leTome Annexe.

    1.3 Les mthodes usuelles dvaluation de lexposition

    Pour un contaminant donn, notons P le nombre daliments vecteurs, C = (C1; :::; CP )la consommation dun individu quelconque de poids corporel ! en chacun de ces alimentset Q = (Q1; :::; QP ) leur contamination. Lexposition au contaminant tudi de cet individu,exprime en unit relative de poids corporel, est alors

    D =

    PPp=1QpCp

    !:

    On omettra dans la suite le poids corporel en considrant directement les consommationsrelatives, i.e. exprimes par kg de poids corporel. On retiendra donc que lexposition uncontaminant (ou dose ingre) est D =

    PPp=1QpCp; o C = (C1; :::; CP ) est la consommation

    relative.En pratique, on ne dispose pas de la contamination de chaque aliment consomm (hormis

    dans les tudes de repas dupliqus pour lesquelles de telles analyses peuvent tre menes), ilest donc ncessaire destimer la distribution de lexposition.Quand les donnes ne sont disponibles quen version agrge, i.e. sous la forme, dune

    part, dune moyenne de consommation par groupe de produit cp et du 95ime percentile(P95), c0:95p par exemple, et dautre part, dun indicateur de contamination par groupe deproduit, la contamination moyenne qp par exemple, les valuateurs de risque ne construisentpas une distribution dexposition mais donnent seulement : un estimateur de lesprance de lexposition : D =

    PPp=1 qp:cp,

    un "estimateur" de lexposition dun fort consommateur de lun des produits : parexemple, lexposition des forts consommateurs des aliments du groupe 1 est appele"exposition au P95 de consommation des aliments du groupe 1" et est dnie par

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 1.3. LES MTHODES USUELLES DVALUATION DE LEXPOSITION 23

    D(1)0:95 = q1:c0:951 +

    PPp=2 qp:cp:

    Ce type de calcul "grossier" est quali de "dterministe" ou "point estimate" au niveauinternational. Il est utilis dans une premire approche, le plus souvent conservative, dequantication du risque. En eet, si les "estimateurs" de lexposition obtenus en utilisantdes contaminations relativement leves sont trs faibles en comparaison des doses tolrablespar lorganisme, il nest pas utile de proposer des modles plus labors. Une telle pratiquesemble toutefois discutable.

    1.3.1 Construction de la distribution dexposition

    Le choix de la procdure de construction de la distribution de lexposition un conta-minant dpend principalement des donnes disposition. Une synthse des mthodes dva-luation usuelles de lexposition est propose dans Kroes et al. (2002).Pour simplier, si P dsigne le nombre daliments (ou groupes daliments) supposs conta-

    mins, trois cas de gures se prsentent :

    1. Les consommations et contaminations sont sous forme agrge, typiquement une moyenneet un cart-type de consommation et de contamination de chaque aliment p = 1; :::P .

    2. Les contaminations, plus rares, sont sous forme agrge et une enqute de consomma-tion fournit les consommations individuelles dtailles de chaque aliment p pour unnombre n dindividus

    3. Les consommations et les contaminations sont disponibles sous forme dtaille : pourchaque aliment p, plusieurs teneurs en contaminant ont t mesures.

    Lhypothse dindpendance entre consommation et contamination nest gnralementpas remise en cause dans le cas de contaminants chimiques puisque la contamination dunaliment nest pas conditionnel au comportement des consommateurs. De plus, les contami-nations de deux produits sont supposes indpendantes. Par contre, les consommations deplusieurs aliments prsentent une structure de dpendance complexe.Dans le cas 1, pour tenir compte des deux sources de variabilit que sont la consommation

    et la contamination, les valuateurs de risque utilisent des mthodes qualies de param-trique. Elles consistent en lajustement de lois paramtriques usuelles pour approcher lesdistributions de consommation et de contamination.Pour les contaminations, la loi lognormale est la plus utilise bien quelle sajuste mal

    aux queues de distributions. Pour remdier cela, des solutions comme lutilisation de loisparamtriques tronques ou la combinaison de plusieurs lois paramtriques direntes (parexemple, pour la tendance centrale et la queue de la distribution) sont envisages (commu-nication personnelle, P. Verger).Pour la consommation, si les distributions marginales de consommation sont estimes

    paramtriquement, il faut ensuite procder un nouvel ajustement pour prendre en comptela structure de corrlation de ces consommations. Ceci fait appel lestimation de copulesen dimension P; avec P potentiellement grand. La mthode dIman & Conover (1982) men-tionne dans Gauchi & Leblanc (2002) et Albert & Gauchi (2002) consiste simuler lesdistributions de consommation selon les ajustements marginaux pralablement eectus et

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 24 CHAPITRE 1. INTRODUCTION

    rordonner les chantillons simuls de sorte que la structure de corrlation des consom-mations soit respecte (utilisation de copules normaux Nelsen, 1999). Une autre solution estdutiliser une distribution log-normale multidimensionnelle, relativement simple simulerds que la matrice de variance-covariance des consommations est connue mais qui sadapteramal la prsence de multiples zros.La distribution de lexposition est alors approche par des simulations de type Monte

    Carlo. Lintroduction de ces mthodes, couramment utilises dans les domaines de la phy-sique, chimie, conomie, est beaucoup plus rcente dans le domaine de lvaluation de risque(Finley et al., 1994). Si fC est la densit multidimensionnelle des vecteurs de consommationset que fQ1 ; ; fQP sont les densits (unidimensionnelles) des contaminations, la distribu-tion fD de lexposition est une fonctionnelle de fC

    Qp

    fQp : Elle est approche en tirant

    alatoirement un grand nombre B de valeurs selon fD:Dans le cas 2, lexposition peut tre construite en considrant un niveau xe de conta-

    mination pour chaque aliment ou groupe daliments. Ce niveau est dtermin partir desdonnes de contamination observes : il peut sagir de la moyenne, de la mdiane pour avoirune estimation raliste de lexposition ou bien encore dun percentile lev de contamination(le P95 ou le P99) pour obtenir une valeur dexposition "au pire des cas" et avoir une visionplus conservative.Si cip dsigne la consommation en produit p de lindividu i exprime relativement son

    poids corporel (consommation relative) et qp dsigne le niveau x de la contamination pourlaliment p; lexposition de lindividu i est

    Di =

    PXp=1

    qpcip:

    Lestimateur de la distribution de lexposition pour une population de taille n est la fonctionde rpartition empirique des expositions ainsi construites, dnie par

    Fn(x) =1

    n

    nXi=1

    1l (Di x) :

    Cette approche est appele "distributionnelle" au niveau international. Cependant dansla mesure o le niveau de contamination est suppos x comme dans le calcul "dterministe"ci-dessus, le terme de "dterministe" est celui que nous avons le plus souvent retenu danscette thse. Ceci constitue un exemple des discussions sans n sur le vocabulaire quil convientde xer au mieux dans ce cadre pluridisciplinaire.Par ailleurs, toujours dans le cas 2, la variabilit des donnes de contamination peut de

    nouveau tre prise en compte en utilisant les distributions paramtriques, notes prcdem-ment fQ1 ; ; fQP et une simulation de type Monte Carlo. On qualie ce type de modle desemi-paramtrique. Dans ce cas, les simulations de type Monte Carlo peuvent tre relative-ment fantaisistes et font apparatre des confusions entre approximation de type Monte Carloet bootstrap. En eet, une approximation de la distribution dexposition consiste tireralatoirement avec remise B (>> n) vecteurs de consommation (tirage selon la fonction de

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 1.3. LES MTHODES USUELLES DVALUATION DE LEXPOSITION 25

    rpartition empirique des consommations) et aecter chaque consommation cip une valeurde contamination tire selon fQp : Un intervalle de conance pour la moyenne dexpositionpeut alors tre obtenu par bootstrap en rptant M fois lapproximation prcdente.Dans le cas 3, si Lp analyses sont ralises pour estimer la teneur en contaminant du

    produit p et que qpjp dsigne la teneur en contaminant du produit p lors de la jp-me analyse(jp = 1; :::; Lp; p = 1; :::; P ); lestimateur de la distribution de lexposition dune populationde taille n est la fonction de rpartition des expositions pouvant rsulter de la combinaisonde tels niveaux de contamination et des consommations cip observes. Elle scrit en faitsimplement

    Fn;L1;:::;LP (x) =1

    nXi=1

    L1Xj1=1

    :::

    LPXjP=1

    1l

    PXp=1

    qpjpcip x

    !; (1.1)

    o = nQp

    Lp:

    Cet estimateur plug-in de la distribution dexposition ne peut en pratique tre calcul car est trop grand (il vaut 1021 dans notre application sur lochratoxine A). La distributionde lexposition est alors approche par une simulation de type Monte Carlo de taille B.Celle-ci consiste procder un tirage alatoire avec remise des consommations dune partet des contaminations dautre part. Lestimateur de la distribution dexposition est alors dela forme

    FB(x) =1

    B

    X(i;j1;:::;jp)2L

    1l

    PXp=1

    qpjpcip x

    !;

    o L dsigne un sous ensemble dindices (i; j1; :::; jp) de taille B d). Dans le cas de contaminantschimiques pour lesquels le risque est chronique, des doses journalires et hebdomadaires to-lrables (DJT, DHT) sont dtermines en extrapolant les rsultats trouvs sur les animaux.Ces DJT/DHT sont des doses pour une vie entire du fait du caractre chronique du risque :comme la consommation de long terme est trs di cile estimer, nous ne pouvons valuerdirectement une exposition de long terme et comparons donc une exposition de court terme(une semaine) ces doses tolrables. De ce fait, la probabilit de dpasser la DJT/DHTdoit tre perue plus comme un indice de risque que comme une mesure du danger rel.Certains travaux (Nusser et al., 1996; Wallace et al., 1994; Homann et al., 2002) proposentdes modlisations permettant destimer une consommation de long terme partir de me-

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 26 CHAPITRE 1. INTRODUCTION

    sures de court terme par rduction de la variance intra-individuelle. Ces mthodes utilisentune transformation normalisante pralable (par exemple, de type Box-Cox) et une analysede la variance. Cependant elles ne prennent pas en compte lvolution des comportementsde consommation au cours du temps mais lissent la variabilit de la consommation journa-lire. Dans le cadre de cette thse, nous navons pas appliqu de telles mthodes. Il semble,daprs les travaux de Counil et al. (2005a), que lutilisation dune enqute de 7 jours permetgalement de lisser de manire importante les consommations extrmes (faibles ou leves).Nous travaillons davantage dans loptique dune modlisation dynamique du phnomne enproposant dutiliser des donnes mnage de long terme (au moins une anne) dcomposes.Ce type dindividualisation nous conduira une nouvelle notion dexposition et de risque delong terme (Chapitre 5).

    1.4 Principaux rsultats de la thse

    Le but essentiel de cette thse est de fournir, dans divers cadres, une valuation statistiquedu risque dni comme la probabilit de dpasser une dose tolrable.Un premier travail (Chapitre 2) consister modliser les queues de distributions de

    lexposition un contaminant en ayant recours la thorie des valeurs extrmes. Ceci nousa permis de quantier des risques trs faibles. Cependant, les contaminants sur lesquels lesattentes de modlisation sont les plus importantes, prsentent des risques qui ne relventpas de la thorie des valeurs extrmes. Les mthodes plus classiques destimation dans cecadre utilisent les distributions dexposition construites par tirages alatoires au sein desdonnes de consommations et des donnes de contamination dcrites plus haut. Un desobjets de cette thse a t de valider par la thorie asymptotique ces mthodes de calcul trsutilises en pratique. Nous avons montr que lestimateur de la probabilit de dpasser unedose tolrable scrit comme une U-statistique gnralise incomplte. Cette constatationpermet de driver les proprits asymptotiques de lestimateur plug-in du risque et dobtenirdes mesures dincertitude (chapitre 3). An de tenir compte de la censure gauche desdonnes de contamination, nous avons alors dvelopp des mthodes destimation dans lecadre de la thorie des modles de dure (chapitre 4). Cependant, la dnition du risquecomme la probabilit de dpassement de la dose tolrable est discutable du fait que ladose tolrable est dnie sur vie entire et que nous utilisons principalement des donnes deconsommation sur une semaine (INCA). Comme les seules donnes disponibles en France surle long terme (quelques annes) sont agrges au niveau des mnages, nous avons mis au pointune technique de dcomposition de donnes mnage en donnes individuelles an destimerlexposition de long terme. Cette mthode permet de proposer une nouvelle dnition durisque de long terme (chapitre 5).Nous discutons brivement les principaux rsultats obtenus dans les dirents chapitres

    de la thse.

    1.4.1 Les risques alimentaires : un phnomne extrme?

    Trs utilise en hydrologie et en nance, la thorie des valeurs extrmes (EVT) permetde prdire des vnements rares non observs, ou partiellement observs, et de quantier des

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 1.4. PRINCIPAUX RSULTATS DE LA THSE 27

    phnomnes extrmes (Embrechts et al., 1999; Reiss & Thomas, 2001; Beirlant et al., 2004).Loriginalit de ce chapitre rside davantage dans lapproche propose pour lvaluation desrisques faibles que dans son contenu mathmatique. Ce travail sera prochainement publidans un ouvrage sur lvaluation des risques alimentaires.

    Lestimateur plug-in (ou empirique) de cette probabilit de dpassement dun seuil nepeut tre infrieur 1=n si n est la taille de lchantillon des expositions individuelles.Les enqutes de consommation individuelle ne portant au plus que sur quelques milliers deconsommateurs, ceci rend impossible la quantication de risques trs faibles, de lordre de106 ou 105 bien que ce type de risque puisse tre inacceptable lchelle de la populationentire. La mthode dvaluation du risque propose consiste ajuster une distribution detype Pareto la queue de distribution de lexposition, pralablement construite partirde donnes de consommation et de contamination. On fait dabord lhypothse que pour xsu samment grand

    P (D > x) = Cx1=;

    oX est la variable alatoire reprsentant lexposition un contaminant, C est une constanteet est linverse de lindice de Pareto qui sinterprte directement comme un indice de risque.

    Lestimateur le plus frquemment utilis dans ce cadre est lestimateur de Hill (1975). SiD1; :::; Dn sont les expositions un contaminant de n individus indpendants alors lestima-teur de Hill scrit

    Hk;n =1

    k

    kXi=1

    log(Dni+1;n) log(Dnk;n);

    o k dsigne le nombre de valeurs extrmes retenir.

    En pratique, cet estimateur de varie fortement en fonction de k ; son biais tant impor-tant pour k petit et sa variance grande pour k grand. Ceci peut en partie sexpliquer par lefait que les donnes ne suivent pas strictement une loi de Pareto mais sont perturbes parune fonction dite fonction variation lente L (typiquement un log, un log itr). Lhypothseinitiale sur la queue de distribution de lexposition prend alors la forme, pour x su sammentgrand

    P (D > x) = Cx1=L(x);

    o L est une fonction variation lente.

    Lintroduction de la fonction variation lente nest pas simplement un jouet math-matique, qui rendrait les aspects techniques plus compliqus (et donc plus attractifs) auxchercheurs. Des fonctions variation lente peuvent apparatre trs naturellement lorsquonmodlise par exemple des phnomnes agrgs ou que lon considre des mlanges de popu-lations ayant des risques dirents (Feuerverger & Hall, 1999).

    En tenant compte de cette fonction variation lente, nous avons adapt une technique dedbiaisage de lestimateur de Hill en considrant des classes de fonctions de type puissance(1 + Dx) ou logarithme ((log x)): Cette technique, inspire de Beirlant et al. (1999) etFeuerverger & Hall (1999), a t mise en oeuvre sur des donnes simules et permet dedterminer un estimateur de de biais plus faible que lestimateur de Hill. Notre rsultatest tabli en montrant que les espacements en log, renormaliss, Zi = i(log(Dni+1;n) log(Dni;n)) se comportent asymptotiquement comme des variables alatoires exponentielles

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 28 CHAPITRE 1. INTRODUCTION

    dont la moyenne dpend de et des paramtres de la fonction variation lente considre.Nous estimons alors par maximum de vraisemblance, pour chaque valeur de k; les direntsparamtres du modle.Cette mthode permet en outre de dterminer le nombre de valeurs extrmes qui forment

    la queue de la distribution par un arbitrage entre rduction du biais et rduction de lavariance de lindice de Pareto. Les deux mthodes de correction de biais sont comparessur des donnes simules selon plusieurs hypothses. Nous montrons alors empiriquementque lintroduction dune fonction variation lente de type puissance permet de corrigersignicativement le biais. Nous parvenons ainsi quantier des risques trs faibles, P (D > d),infrieurs 1=n; ds que la dose tolrable d appartient la queue de distribution. De plus,lestimation des "Value at Risk" (Embrechts et al., 1999), dnies comme linverse de lafonction de rpartition en un point y proche de 1, permet danalyser prcisment les queuesde distribution dexposition.Nous proposons ensuite deux outils permettant de caractriser les populations risque.

    Le premier bas sur un modle de type probit(Gouriroux, 1989) permet de dterminer lesfacteurs favorisant lappartenance la zone risque. Par ailleurs, la modlisation des excsau del dun seuil dexposition selon une loi de Pareto gnralise dont lindice dpend decovariables permet de mettre en vidence les dterminants du risque. Lestimation de ce typede modle est ralise par des techniques de maximum de vraisemblance.En guise dillustration des possibilits et limites des outils proposs, nous prsentons les

    analyses de risques lis lacrylamide dans lalimentation totale et au mthylmercure dans lesproduits de la mer. Le cas de lacrylamide montre comment la mthode dveloppe permetde quantier un risque trs faible lorsque lestimateur plug-in de la probabilit de dpasserun seuil est nul. Nous montrons galement sur lexemple de lacrylamide que la comparaisondes queues de distribution dexposition de direntes sous-populations permet une analyseplus ne que la comparaison des percentiles levs (P95). Ainsi les "Value at Risk" dordre1 sur un million sont maximales pour les enfants de 7 10 ans et trs leves galementpour les hommes adultes dont le P95 dexposition nest pourtant pas trs dirent de celuidu reste de la population. Lvaluation du risque li au mthylmercure illustre une limitede lutilisation de la mthode propose : comme la DHT nappartient pas la queue dedistribution dtermine par le modle, lestimation de la probabilit de dpasser la DHT parces outils extrmes nest pas approprie. Par ailleurs, les outils permettant de caractriser lespopulations risque ont permis de montrer, par exemple, que les retraits, cadres suprieurset employs sont signicativement plus exposs au mthylmercure que les autres CSP.Lapplication de ces mthodes issues de lEVT lvaluation de risque li la prsence

    de mtaux lourds dans les produits de la mer a fait lobjet dune publication dans un journalde Toxicologie (Tressou et al., 2004a).

    1.4.2 Evaluation empirique des risques

    Le caractre fortement multidimensionnel des donnes de consommation rend lestimationde la probabilit de dpassement dune dose tolrable plus di cile quil ny parat. En eet, laconsommation alimentaire est un phnomne prsentant de fortes corrlations, positives oungatives entre certains aliments (qui peuvent, en termes conomiques, tre complmentaires

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 1.4. PRINCIPAUX RSULTATS DE LA THSE 29

    ou substituts : le th et le caf sont par exemple des aliments substituts alors que le caf et lesucre sont plutt complmentaires). Les consommations des dirents aliments ne peuventdonc tre modlises marginalement. Par ailleurs, la prsence de nombreux rgimes alimen-taires (produits consomms ou non) rend la modlisation paramtrique des consommationsimpossible.An de quantier les risques plus levs, par exemple pour lochratoxine A prsente dans

    un grand nombre daliments, nous avons choisi un cadre totalement non paramtrique quiconduit considrer des estimateurs de type plug-in (cf. (1:1)).En supposant que les contaminations des dirents aliments sont indpendantes entre

    elles et indpendantes de la consommation des aliments, nous montrons que cet estimateurempirique de la probabilit dune dose tolrable d scrit comme une U-statistique gnralise.Lestimateur plug-in de la probabilit de dpasser une dose d prend en eet la forme

    d (Demp) = PDemp

    PXp=1

    QpCp > d

    !=1

    nXi=1

    L1Xj1=1

    :::

    LPXjP=1

    1l

    PXp=1

    qpjpcip > d

    !;

    o Demp dsigne la distribution empirique jointe des consommations (C = (C1; :::; CP )) etdes contaminations (Qp; p = 1; :::; P ) dj dnie en (1:1) :Cette classe de statistique introduite dans les annes 40 par P. R. Halmos et W. Hoeding

    comprend un grand nombre de statistiques usuelles (moyenne, variance, statistiques de testset autres estimateurs largement utiliss). La thorie sur les U-statistiques (Hoeding, 1948;Lee, 1990) fournit des outils unis et puissants pour ltude de lestimateur plug-in. Enparticulier, nous obtenons le comportement asymptotique de lestimateur plug-in du risqueet la validit du bootstrap pour lestimation de sa variance. Sous certaines conditions sur lestailles des chantillons, on peut montrer que

    N1=2 [d (Demp) d (D)] !N!1

    N 0; S2 ;o N = n+

    Pp Lp, D dsigne la distribution jointe des consommations et des contaminations

    et S2 une variance que nous estimons par des techniques de jackknife et de bootstrap (voirEfron & Tibshirani, 1993, pour une introduction) reposant sur la dcomposition de Hoedingdes U-statistiques gnralises (Hoeding, 1961).En pratique, seule la version incomplte de cette U-statistique (voir Blom, 1976, pour un

    descriptif des proprits des U-statistiques incompltes) peut tre calcule en ayant recours une simulation de type Monte Carlo : vecteurs de consommations et valeurs de contaminationsont indpendamment tirs dans les distributions empiriques des donnes de consommation,dune part, et de contamination, dautre part. Lestimateur du risque scrit alors

    d;B (Demp) = 1B

    X(i;j1;:::;jp)2L

    1l

    PXp=1

    qpjpcip > d

    !;

    o L dsigne un sous ensemble dindices (i; j1; :::; jp) de taille B

  • 30 CHAPITRE 1. INTRODUCTION

    samment grand, en particulier devant la taille des chantillons disponibles de consommationet de contamination.Les thormes asymptotiques proposs et le recours aux U-statistiques incompltes per-

    mettent de proposer des choix raisonnables du nombre de simulations eectuer. En eet, laplupart des logiciels proposant des valuations de risque similaires encouragent lutilisationdun nombre trs important de simulations qui ne sont pas toujours indispensables. Nousproposons galement plusieurs mthodes de construction dintervalles de conance fondessur deux estimateurs de la variance asymptotique : (i) un estimateur de type bootstrap (ii) unestimateur de type jackknife reposant sur la dcomposition de Hoeding de la U-statistiquede dpart. Lestimateur (ii) est obtenu en utilisant le fait que la variance S2 scrit commeune somme pondre des variances des gradients de la U-statistique. Comme les gradientsdordre 1 sont des U-statistiques simples, leur variance peut facilement tre estime par ja-ckknife en utilisant des estimateurs de ces gradients (cf. Arvesen, 1969). Lutilisation dun telestimateur de S2 permet de mieux comprendre comment la variance du risque se dcompose.Nous montrons ensuite que les intervalles de conance de type "basic bootstrap" sont

    su sants et que le recours des mthodes t-percentiles (studentisation de la statistique parlcart-type issu de (ii)) namliore que peu les intervalles de conance en terme de probabilitde couverture.Ces outils ont t utiliss pour quantier le risque li la prsence dochratoxine A dans

    les aliments. Nous montrons que les enfants sont la population la plus risque. Nous tudionsgalement limpact de lintroduction de limites maximales de contamination pour le vin oules crales (prconises par lUnion Europenne) et concluons labsence dune rductionsignicative du risque. Cependant les estimations de risque obtenues restent conditionnellesau traitement des donnes censures pralablement eectu et ceci rduit considrablementla puissance de loutil lors de comparaisons de populations ou lors de ltude de limpact demesures sanitaires. Nous proposons dans le chapitre suivant de modliser cette censure.Ce travail a fait lobjet de deux publications : la premire dans une revue de Toxicologie

    (Tressou et al., 2004b) et la seconde, plus technique, dans Biometrics (Bertail & Tressou,2005)Par ailleurs, dans le cadre dun travail sur la combinaison de sources de donnes par vrai-

    semblance empirique (Crpet et al., 2005, non inclus dans le cadre de cette thse mais donndans le tome annexe), cette approche par les U-statistiques a permis de simplier lcrituredes contraintes du modle et le recours aux versions incompltes de ces U-statistiques arendu les calculs ralisables dans le cas multidimensionnel (plusieurs produits contaminspar la mme substance), la dcomposition de Hoeding permettant en eet de linariserlestimateur du risque.

    1.4.3 Modlisation de la censure des donnes de contamination

    Lestimateur plug-in du risque dni dans la chapitre 3 dpend fortement de la mthodede substitution des donnes de la forme "

  • 1.4. PRINCIPAUX RSULTATS DE LA THSE 31

    Nous proposons par consquent destimer la distribution des donnes de contamination parun estimateur de ce type.

    Lestimateur plug-in du risque scrit alors comme une fonctionnelle des distributions deconsommation et de contamination. Il prend la forme

    e(d) = PreD (D > d) =Z1l

    PXp=1

    qpjpcip > d

    !dFn

    ci PQ

    p=1

    dFLp;KM(qpjp

    ;

    o Fn dsigne la distribution empirique des n donnes de consommation et FLp;KM lesti-mateur de Kaplan Meier des Lp donnes de contamination pour le produit p, censures gauche.

    Cette fonctionnelle possde une proprit dHadamard direntiabilit qui permet luti-lisation de la delta mthode fonctionnelle (von Mises, 1947; Gill, 1989; van der Vaart, 1998)pour driver le comportement asymptotique de e(d) partir de ceux des estimateurs desdistributions de consommation dune part (la distribution empirique des consommations) etde contamination dautre part (les estimateurs de Kaplan Meier des contaminations). Nousmontrons que p

    Nhe(d) (d)i GKMD (d);

    o GKMD (d) est une gaussienne centre dont la covariance peut se dcomposer en termesdpendant de la distribution des consommations, dune part, et des distributions de conta-mination, dautre part.

    En pratique, nous avons de nouveau recours une simulation de type Monte Carlo pourestimer cette quantit. Il su t en eet de tirer les valeurs de contamination selon lestima-teur de Kaplan Meier des donnes (sous la forme dun couple "valeur mesure et indicatricede censure") plutt que selon la rpartition empirique des donnes traites de manire d-terministe au pralable comme dans le chapitre prcdent.

    Des intervalles de conance sont galement dtermins par bootstrap dans un premiertemps, puis par double bootstrap et mthodes t-percentile, comme dans le chapitre prcdent.En prsence de censure, ces techniques de bootstrap requirent le rchantillonnage descouples "valeur mesure et indicatrice de censure" (Efron, 1981; Akritas, 1986) et lestimationrpte des FLp;KM :

    Les conclusions de ce travail sont trs similaires celles du chapitre prcdent en termestechniques : les intervalles de conance de type "basic bootstrap" sont de nouveau retenus.

    Comme prcdemment, nous proposons une validation de ces intervalles de conance surdonnes simules et illustrons notre propos par lvaluation du risque relatif lochratoxineA. Les enfants restent la population la plus sensible et nous parvenons ici prendre desdcisions quant limpact de lintroduction de normes sanitaires sur certains produits oula comparaison de sous populations en saranchissant des traitements dterministes de lacensure.

    Ce travail fait galement lobjet dun article, en cours de rvision (Tressou, 2005).

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 32 CHAPITRE 1. INTRODUCTION

    1.4.4 Evaluation de lexposition individuelle de long terme partirde donnes mnage

    Toutes les techniques prsentes jusquici ont t appliques en utilisant les donnes deconsommation franaises INCA (Enqute nationale sur les consommations individuelles) quine porte que sur sept jours de consommation. Bien quelles soient qualies de "reprsen-tatives" de la population franaise, elles ne peuvent elles seules permettre lestimation dela consommation de long terme. La seule autre source de donnes disponible et valuantindirectement la consommation sur longue priode des Franais est le panel de donnesSECODIP qui rpertorie les achats alimentaires hebdomadaires dun nombre important demnages. Le dfaut majeur de ces donnes est que lchantillon est constitu de mnages etnon dindividus proprement dits. En eet, mme si lon peut supposer que les achats alimen-taires permettent dapprocher (du moins en partie) la consommation des aliments, ceux cine donnent aucune information sur la rpartition de ces consommations entre les direntsmembres du mnage. Nous proposons donc une mthode de dcomposition des donnes m-nage en donnes individuelles principalement fonde sur lhypothse que la structure dgeset de sexes des individus dun mnage est le facteur essentiel dterminant cette dcomposi-tion. Cette question de la dcomposition apparat dans dautres domaines dapplication, voirpar exemple en conomie les travaux de Engle et al. (1986).Inspire par les travaux de Chesher (Chesher, 1997, 1998), la mthode propose consiste

    crire les quantits individuelles inconnues comme une fonction f de lge ai;h et du sexesi;h des individus (et ventuellement de certaines caractristiques socio-dmographiques wi;hou du temps) et la quantit "mnage" comme la somme de ces fonctions pour les direntsindividus du mnage. Le modle le plus simple scrit alors

    Yh =

    nhXi=1

    f(ai;h; si;h) + "i;h;

    o nh dsigne la taille du mnage.Chesher (1997) utilise cette approche pour valuer les apports nutritionnels moyens par

    ge et sexe. Il propose une estimation non paramtrique de cette fonction en considrantlge comme une variable discrte et en supposant que les individus dun mme mnage sontindpendants. Il propose par ailleurs de multiples corrections pour prendre en compte lebiais relatif lutilisation de donnes dachats des mnages qui ne sont quun proxy de laconsommation.Pour lestimation de la fonction f; nous proposons lutilisation de splines (de Boor, 1978;

    Eubank, 1988; Green & Silverman, 1994) en considrant lge comme continu : le modle r-sultant aprs sommation par mnage peut tre considr comme un modle mixte (Robinson,1991; Ruppert et al., 2003). Il scrit en eet sous la forme

    Yh = Xh + Zhu+ "h;

    o est le paramtre des eets xes, u reprsente leet alatoire et "h lerreur rsiduellersultant des erreurs dapproximation au niveau individuel. Les vecteurs Xh et Zh dpendentdes ges et sexes des membres du mnage h, du nombre dindividus le composant et ven-

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 1.4. PRINCIPAUX RSULTATS DE LA THSE 33

    tuellement dautres caractristiques sociodmographiques du mnage ainsi que de la liste denoeuds utilises pour le spline.Ce type de modle, trs bien dcrit dans Ruppert et al. (2003), est estim par maximum

    de vraisemblance restreint (REML, Patterson & Thompson (1971)). Nous avons, dans unpremier temps, dcompos une quantit unidimensionnelle (exposition sur une anne) pourchaque mnage en supposant les individus indpendants au sein dun mnage. Une modica-tion de la structure de variance-covariance du modle mixte nous permet dintroduire de ladpendance entre les individus dun mme mnage. La variance de lerreur rsiduelle "h estalors fonction de taille du mnage nh: Le test dindpendance entre les individus conduit aurejet de lindpendance comme nous le pensions. Nous tudions ensuite certaines extensionsdu modle de base Dabord, nous introduisons certaines variables socio-dmographiques de manire li-naire dans le modle individuel. Des tests de type rapport de vraisemblance nouspermettent de dterminer les covariables signicatives pour dcrire le phnomne.

    Nous proposons ensuite dintroduire une dimension temporelle en dcomposant desquantits multidimensionnelles prsentant une dpendance. Les expositions de chaquesemaine pour un mnage sont fortement corrles et la dcomposition de ces expositionsmnage en expositions individuelles impose une nouvelle modication de la structurede variance-covariance du modle mixte.

    Enn, nous montrons comment dcomposer la consommation de plusieurs produits : lesvaleurs obtenues peuvent ainsi tre utilises dans une valuation non paramtrique delexposition un contaminant ou bien dans le cadre de lestimation des consommationsindividuelles proprement dites.

    Ces extensions requirent lestimation de structure de variance-covariance de plus en pluscomplexes.La mthode de dcomposition des donnes mnage, bien quimparfaite, permet dobtenir

    des sries dapports hebdomadaires en contaminants pour chaque individu sur des priodesrelativement longues. On peut donc, partir de ces sries et destimations du poids corporeldes individus, identier les individus dont lexposition est durablement au dessus de la dosetolrable et rendre ainsi plus pertinente la comparaison la dose tolrable gnralementdtermine sur vie entire. Dautres proprits des contaminants chimiques sont alors prendre en compte dans ce cadre dynamique : chaque contaminant est limin naturellementdu corps humain dans des proportions particulires. Par exemple, les toxicologues montrentque, sans nouvel apport en mercure, il faut six semaines pour rduire de moiti la quantit demercure initialement prsente dans lorganisme dun individu (Smith & Farris, 1996). Cettedure est appele la demie-vie du contaminant. Ce phnomne de dgradation progressivedu contaminant et la srie dexpositions individuelles hebdomadaires exprimes par unitsde poids corporel, note ici (Dt)t=1;:::;T ; incitent dnir une nouvelle quantit que nousappelons "exposition cumule" un contaminant, note St. Il sagit de la somme des apports(Dt) en contaminant, convenablement pondrs pour prendre en compte la dgradation, surune priode de temps choisie (t = 1; :::; T ). Ainsi une date t xe, le poids des apportscourantsDt est de 1 et ceux des apports antrieurs (Ds; s < t) sont infrieurs 1 et de plus enplus faibles quand t s augmente. Si dsigne le facteur dlimination ou dgradation, alorson peut exprimer lexposition cumule la date t en fonction de celle de la date prcdente

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 34 CHAPITRE 1. INTRODUCTION

    parSt = exp()St1 +Dt:

    Dautre part, les toxicologues attestent quaprs 5 ou 6 demie-vies du contaminant ltatstationnaire est atteint : il faut donc sintresser aux valeurs dexpositions cumules pour tsu samment grand, on parlera alors dexposition de long terme. Cette quantit peut trecompare lexposition de long terme de rfrence obtenue en cumulant des apports constam-ment gaux la dose hebdomadaire tolrable convenablement pondrs. Un individu est alorsconsidr comme risque si son exposition de long terme dpasse la rfrence. Cette manirede caractriser le risque de long terme est nouvelle et de ce fait inhabituelle pour les mdecinset toxicologues, elle est actuellement en cours de validation auprs dexperts du domaine (A.Renwick, J. Schlaer).La quantication du risque de long terme relatif la prsence de mthylmercure dans les

    produits de la mer. Ce travail fait lobjet dun article en collaboration avec Olivier Allais dulaboratoire de recherche sur la consommation (INRA-CORELA, Ivry sur Seine).

    1.4.5 Finalisation informatique des recherches

    De nombreux logiciels proposent des outils de calcul dexposition et fournissent des esti-mateurs des grandeurs dintrt et des graphiques dcrivant la distribution de lexposition.Citons par exemple le logiciel Monte Carlo Risk Assessment (MCRA, Boer et al., 2005)dvelopp en collaboration par le RIKILT et Biometris (Universit de Wageningen, Pays-Bas) qui permet la fois lvaluation des risques aigus et chroniques (en utilisant la mthodeNusser et al. (1996)) ou encore le Central Risk & Exposure Modelling e-solution (CREME)de lIEFS (Institute of European Food Studies) et du Trinity Centre for High PerformanceComputing (Trinity College Dublin, Ireland) incorporant des procdures particulires pourtraiter le risque li aux migrants des emballages alimentaires.Un logiciel (baptis CARAT pour Chronic & Acute Risk Assessment) a t dvelopp

    au sein de lunit Mt@risk. Une partie des mthodes proposes dans cette thse (calculdterministe ou non paramtrique de lexposition, avec intervalles de conance par boots-trap, Chapitre 3, modlisation de la censure des donnes de contamination, Chapitre 4) ainsiquun systme daide au rapprochement des nomenclatures consommation et contaminationseront bientt disponibles via une interface JAVA. Ceci permettra de rendre accessible cer-taines techniques de simulation usuelles des non-statisticiens ainsi que les outils spciquesdvelopps au sein de lunit.A terme, les nouveaux outils (utilisation de la thorie des valeurs extrmes, Chapitre 2 ;

    dcomposition de lexposition mnage en expositions individuelles et calcul de lexpositionde long terme, Chapitre 5) dvelopps dans le cadre de cette thse, ou dautres travaux,constitueront des modules supplmentaires du logiciel.

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • Chapitre 2

    Lvaluation des petits risques : lathorie des valeurs extrmes

    Le recours la thorie des valeurs extrmes parat naturel dans le cadre de lvaluationdes risques alimentaires. Ce sont en eet les individus forts consommateurs de produits trscontamins qui constituent la population la plus risque. Trs utilise en hydrologie et ennance, la thorie des valeurs extrmes (EVT) permet de quantier des vnements raresnon observs, ou partiellement observs (Embrechts et al., 1999; Reiss & Thomas, 2001).Nous proposons dans ce chapitre dadapter des modles de type Pareto gnralis au cadrede lvaluation du risque alimentaire. Ceci permet de quantier et caractriser le risque, enparticulier lorsquil est faible.Dans une premire partie, nous rappelons brivement quelques lments thoriques es-

    sentiels de la thorie des valeurs extrmes en insistant plus particulirement sur leur inter-prtation en termes de risque alimentaire. Lindice de Pareto, intervenant dans ces modles,sinterprte en particulier comme un indice de risque. Nous rappelons les estimateurs usuelsde cet indice de risque ainsi que leurs proprits. Le plus connu est lestimateur de Hill(1975) : il prsente dans notre cadre un biais important essentiellement d au fait que cer-taines sous-populations encourent des risques dirents.Dans une deuxime section, nous montrons comment lintroduction de fonction variation

    lente dans la queue de distribution permet de tenir compte de ce phnomne et dexpliquerle biais des estimateurs usuels.Dans une troisime section, nous tudions diverses mthodes de correction du biais de

    lestimateur de Hill inspires de Beirlant et al. (1999) et de Feuerverger & Hall (1999). Nousprsentons rapidement, dans le contexte des risques alimentaires, ces diverses mthodes decorrection de biais qui sont fondamentales pour obtenir des estimateurs de risque prcis.Nous montrons sur des donnes simules pourquoi il est trs important dans notre cadre detenir compte de ces corrections.Enn, dans la section 2.4, nous prsentons deux outils permettant dune part, de dtermi-

    ner les caractristiques socio-dmographiques favorisant lappartenance une zone risque,et dautre part, de modliser les excs au-del dun certain seuil en fonction de facteurssocio-dmographiques. Il est important de noter ici que les facteurs en jeu dans chacun desmodles proposs peuvent tre dirents.

    35

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 36 CHAPITRE 2. VALEURS EXTRMES ET RISQUE ALIMENTAIRE

    En guise dapplication, nous cherchons dans une dernire partie valuer le risque li lexposition certains contaminants : lacrylamide prsent dans les aliments riches encarbohydrates et frits (les frites...) et le mthylmercure prsent essentiellement dans lesmollusques et crustacs (les moules...).

    2.1 Valeurs extrmes et indice de Pareto

    2.1.1 Valeurs extrmes

    Lensemble des rsultats exposs dans cette section vise synthtiser la base de la thoriedes valeurs extrmes dans le cas univari. On pourra galement se rfrer par exemple auxouvrages de Embrechts et al. (1999) ou de Reiss & Thomas (2001). Bien que la thorie desvaleurs extrmes soit de plus en plus utilise dans les sciences environnementales, ce typedanalyse est peu, voire pas du tout, utilis en toxicologie et en analyse de risque alimentairealors que ces techniques peuvent sans doute aider ltude quantitative des risques. Notonsque suite ces travaux, la dpendance entre des expositions extrmes plusieurs substances,contaminants chimiques et nutriments est par exemple analyse dans Paulo et al. (2004).Lobjet de cette section est donc de rappeler et de donner les rsultats essentiels de cette

    thorie. Nous essaierons de donner une interprtation simple des quantits introduites entermes de risque alimentaire. Les rsultats de cette section nous permettront de justierles choix de certaines formes fonctionnelles qui seront faits ensuite dans la modlisation durisque dexposition un contaminant.Dans toute cette partie, on suppose que lon dispose dobservations X1; X2; : : : Xn ind-

    pendantes de mme fonction de rpartition F (x) = Pr(X x). On note linverse gnralisede F par

    F (x) = inf(y 2 R; F (y) x):Le point terminal de F (i.e. la plus grande valeur possible pour Xi pouvant prendre la valeur+1) est donn par

    s(F ) = sup(x; F (x) < 1);

    et la fonction de survie par

    F (x) = Pr(X > x) = 1 F (x):

    Ainsi pour 2]0; 1[; on note x = F () le quantile dordre de la distribution.En terme de risque alimentaire, les Xi reprsentent dans la suite le niveau dexposition

    alimentaire globale de chaque individu i un certain contaminant. Ces expositions indi-viduelles sont pralablement construites de manire dterministe, comme propos dans lasection 1.3.1, et supposes indpendantes. Pour illustrer notre propos nous considrons es-sentiellement le cas du mercure, mtal lourd, prsent dans peu daliments essentiellementles produits de la mer. Si lon connat par exemple un niveau d0 au-del duquel ce conta-minant peut tre dangereux, appel dans la suite seuil de toxicit, F (do) reprsente doncla proportionde personnes exposes un risque sanitaire dans la population. Ce seuil de

    tel-0

    0139

    909,

    ver

    sion

    1 - 4

    Apr

    200

    7

  • 2.1. VALEURS EXTRMES ET INDICE DE PARETO 37

    toxicit peut tre une dose hebdomadaire tolrable (DHT), une dose journalire admissible(DJA) ou encore bien une DHT/10 ou une DJA/10 et plus gnralement nimporte quelseuil d0 x. Inversement dans une optique de calibrage, si e


Recommended