+ All Categories
Home > Documents > analyse génomique

analyse génomique

Date post: 04-Mar-2016
Category:
Upload: mokermi
View: 221 times
Download: 0 times
Share this document with a friend
Description:
analyse génomique
31
7/21/2019 analyse génomique http://slidepdf.com/reader/full/analyse-genomique 1/31  
Transcript
Page 1: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 1/31

 

Page 2: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 2/31

 

COURS

D’ANALYSE DES GENOMES

 A ANNNNEEEE UUNNIIVVEERRSSIITT A AIIRREE 

22001133--22001144 

** ** ** ** ** ** 

CCooddiir r eecctteeuur r ss dduu CCoouur r ss :: 

BBeer r nnaar r dd DDUUJJOONN eett SSttéépphhaannee LLEE CCRROOMM 

CChheef f  ddee TTr r aavvaauuxx :: 

LLiioonneell FFRR A ANNGGEEUULL 

** ** ** ** ** ** 

LE COURS SE DEROULE DU 4 NOVEMBRE AU 20 DECEMBRE 2013

 AU CENTRE D’ENSEIGNEMENT DE L ’INSTITUT P ASTEUR (P AVILLON LOUIS M ARTIN, B ATIMENT09) 

28, RUE DU DOCTEUR ROUX, 75724 P ARIS CEDEX 15

CONFERENCES ET COURS : 

- DU4 AU 8 NOVEMBRE 2013 :  S ALLE DE COURS 2 (CENTRE D’ENSEIGNEMENT, PLM, BATIMENT 09)- DU12 NOV. AU 13 DEC.2013 : S ALLE DE COURS 4 (BATIMENT SOCIAL 06) 

- DU16 AU 20 DECEMBRE 2013 : S ALLE DE COURS 2 (CENTRE D’ENSEIGNEMENT, PLM, BATIMENT 09) 

TRAVAUX PRATIQUES : SALLE DETP 2EME ETAGE DU CENTRE D’ENSEIGNEMENT(PLM, BATIMENT09) 

Page 3: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 3/31

 

PPRREESSEENNTT A A TTIIOONN DDUU CCOOUURRSS 

Page 4: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 4/31

 

Préambule au cours d’Analyse des Génomes 2013-2014

La Génétique est la Science qui étudie l’hérédité. Or, quiconque s’interroge sur lesdifférences entre un objet physique, par exemple un nuage, et un organisme vivant, parexemple une souris, arrivera tôt ou tard à la conclusion inévitable qu’il n’y en a qu’une:l’hérédité. Car, comme les nuages, les organismes vivants suivent les lois de la physico-chimie (voir Schrödinger, 1944). Ils sont constitués des mêmes atomes. Mais, alors qu’unnuage se forme à une date et en un lieu donnés comme la conséquence d’un ensemble devaleurs précises d’humidité, de pression et de température sans souvenir de la présenceéventuelle d’un autre nuage, similaire ou non, à une date antérieure, une souris naît à partir dedeux autres souris préexistantes qui, elles-mêmes, avaient des parents, etc  … Pour saformation à partir des atomes et des molécules qui la constitueront, une souris hérite, dèsl’oeuf, du fruit de l’évolution de tous ses ancêtres, proches et lointains, tandis que le nuage partde zéro. Les êtres vivants ont donc, en plus de la physique, une histoire portée de générationen génération par le matériel héréditaire. Connaître ce matériel héréditaire et sonfonctionnement c’est donc lire l’histoire des êtres vivants, comprendre leur complexité et,finalement, appréhender ce qui les distingue du monde inanimé. C'était toujours l’objet mêmede la Génétique depuis son origine même si les méthodes d’analyse n’ont longtemps permis delever que quelques pans du voile. Avec l’analyse des génomes, notre connaissance dumatériel héréditaire devient exhaustive et, s’éloignant progressivement des systèmes modèlesqui furent si précieux à la Génétique, la Génomique explore maintenant le monde vivant dansson intégralité et, progrès techniques aidant, à travers tout le spectre d'échelles qui relie lesmolécules élémentaires aux populations naturelles. Des horizons insoupçonnés se découvrent.Les notions classiques font place à des visions nouvelles qui nous permettent mêmed’imaginer des mondes que la Biologie synthétique essai de construire. Pour bien appréhender

ces idées, un bref retour en arrière s’impose.

La Génétique, science des génomes

Les bases de la génétique moléculaire

Au cours du siècle dernier, nos connaissances sur le matériel héréditaire ont progresséd’une manière considérable. Depuis les chromosomes eucaryotes, corpuscules observablesau microscope au cours des divisions cellulaires dont le comportement trahissait leur rôle dansl’hérédité pour ceux qui connaissaient les lois de Mendel, on est passé à l’ADN  grâce aux

bactéries (Avery et al., 1944, Watson et Crick, 1953). Puis, on a décrit la structure fine du gène grâce aux bactériophages (Benzer, 1961) et déchiffré le code génétique  grâceessentiellement à la Biochimie (Crick et al., 1961, Nirenberg et al.,  1961, Nishimura etal.,1965). Avec les opérons bactériens, on découvrait des principes de régulation del'expression des gènes qui semblaient universels (Jacob et Monod, 1961). On savait, grâce auxchampignons, qu’à chaque gène correspondait une protéine (Beadle et Tatum, 1941). Et ledogme central de la Biologie moléculaire (datant de 1953, voir figure) nous indiquait commentles  ARNs, jouant le rôle d'intermédiaires, étaient impliqués dans l'expression des gènes pourformer ces protéines. Nul ne doutait alors que ces principes étaient universels et certains,pensant que l'on avait compris l'essentiel, se détournèrent à ce moment de la biologiemoléculaire des gènes pour s'intéresser au développement des organismes, aufonctionnement du système nerveux ou à d'autres problématiques jugées plus complexes.

Page 5: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 5/31

 Les ARNs 

Pourtant, la Génétique moléculaire devait révéler encore bien d'autres surprises sanslesquelles l’analyse des génomes aujourd’hui serait incompréhensible. D'abord, on découvritque les ARNs peuvent être retrotranscrits sous forme d'ADN pouvant être intégré au matérielgénétique et donc transmis à la descendance (Temin et Mizutani, 1970, Baltimore, 1970). Dèslors, les  ARNs  n'étaient plus seulement des intermédiaires de l'expression des gènes, ils

pouvaient donner naissance au matériel héréditaire. Ensuite, dès que l'on a pu étudierdirectement la structure moléculaire des gènes, grâce aux techniques de l’ADN recombinant etdu Génie génétique (développées à partir de 1973), celle-ci est immédiatement apparuebeaucoup plus complexe qu'on ne l'imaginait. Et même surprenante. On découvrit les introns,séquences internes des ARNs transcrites de l'ADN mais éliminées des molécules d'ARNfinales par épissage des séquences qui les entourent, les exons (Berget et al. 1977, Chow etal., 1977, Glover et Hogness, 1977, Jeffreys et Flavell, 1977, Gilbert, 1978). On parlait degènes mosaïques que l’on commençait à séquencer en essayant d’interpréter les résultatsselon les principes du dogme central de la biologie moléculaire.

Figure 1 : Evolution du dogme central de la biologie moléculaire. De simples intermédiaires de l'expression desgènes en 1953, les ARN sont progressivement devenus "le cœur du génome fonctionnel", l'ADN n'étant que laforme chimiquement stable de l'information génétique qui passe les générations et est donc le véhicule de l'héréditédes organismes modernes. L'histoire de la biologie moléculaire et les technologies disponibles font que ce sont lesséquences d'ADN qui sont déterminées et stockées dans les bases de données, avec celles des protéines déduites.Ce n’est que depuis l’application des nouvelles techniques de séquençage aux ARN (par intermédiaire de copies ADN) que l’on peut enfin étudier en profondeur la variété des molécules d’ARN dans les cellules, y compris cellesde courte durée de vie, et que l'on a compris que la quasi-totalité du génome est transcrit en un très grand nombrede molécules d'ARNs partiellement chevauchantes et dont l'immense majorité sont non-codantes.

Page 6: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 6/31

 

En réalité, on était en train de mettre en lumière le rôle central des ARNs, les gènesn’en étant que le reflet. On sait maintenant qu'il existe plusieurs catégories d'introns et lesdifférents mécanismes de l'épissage des ARNs ont été identifiés. On découvrit que, dans laplupart des cas, ce sont les ARNs eux-mêmes qui catalysent ces réactions d’épissage (voirplus loin) même si, pour ce faire, ils sont parfois associés à des protéines. Sans entrer dans lesdétails pourtant très significatifs, l'idée importante ici est qu'entre le gène et son produit

s'intercalent une série de réactions qui modifient, souvent considérablement, les séquencesdes populations de molécules d'ARNs présentes dans la cellule. Or, c’est le séquençage del’ADN qui s’est développé en donnant naissance à la génomique, les molécules d’ARNs, elles,sont chimiquement très réactives, et leur séquençage direct (sans faire une copie ADN) reste,pour l’instant, inaccessible à une échelle globale (voir plus loin).

Les débuts du séquençage de l’ADN

Les premières méthodes qui permirent de déterminer rapidement l'ordre de successiondes nucléotides le long des molécules d'ADN (séquencer l'ADN) datent de 1977 (Sanger et al., 1977, Maxam et Gilbert, 1977). C’est une date critique. Avant, on savait conceptuellement ce

que devait être un gène et ses mutations, mais sans espoir d’en connaître réellement lecontenu informatif précis. Après, on allait pouvoir déchiffrer ce contenu, vieux rêve de tous lesgénéticiens. Ces méthodes sont aujourd'hui reléguées aux musées (voir plus loin), mais ils'agissait alors d'un progrès considérable qui faisait suite à des années de recherches au coursdesquelles avaient été explorées différentes pistes permettant de déterminer des séquencescourtes d’ADN comme, par exemple, les opérateurs bactériens. Ce n’est donc qu’à partir de1977 que l’on a commencé à connaître l'information génétique contenue dans les gènes. Uneaccélération considérable des découvertes de la génétique moléculaire s'ensuivit. Lesmutations n'étaient plus uniquement des signatures conceptuelles associées à des phénotypesparticuliers dans des conditions définies du laboratoire. On en découvrait maintenant la naturechimique et, en conséquence, on allait pouvoir les créer chimiquement de façon déterminée.Toute l'histoire de la mutagénèse dirigée débutait, suivie plus tard de celle de la synthèsechimique des gènes et maintenant de celle des génomes entiers (voir plus loin).

Comme le dogme central de la biologie moléculaire associé au code génétiquepermettent de prédire les séquences des protéines à partir de celles des gènes (auxmodifications près introduites au niveau des ARNs), au début des années 1980s on séquençaitles gènes pour avoir la séquence des protéines. Mais le séquençage d’ADN restait laborieux etle souci était d’éviter la duplication des efforts. Naissaient alors les premières bases dedonnées permettant de mettre à la disposition de la communauté scientifique les séquencesd'ADN et celles, déduites, de protéines. Peu à peu, comme ces répertoires s'enrichissaient, lescomparaisons de séquences devenaient possibles. Graduellement, elles allaient prendre le passur les expériences. En même temps, on s'intéressait aux séquences régulatrices de

l'expression des gènes que l'on pouvait maintenant manipuler dans des systèmes artificielsd'expression génétique. On s'intéressait évidemment aussi aux premiers gènes morbidesidentifiés chez l'homme. On espérait en tirer rapidement des traitements (et des retombéesfinancières !). On s'intéressait aux génomes des organelles, des plasmides et des virus dontles tailles limitées permettaient d'obtenir les séquences complètes en seulement …. quelquesannées de travail ! C’était l’époque du Génie génétique triomphant. Certains, pensant alors quel’on avait tout compris, ne rêvaient que d’applications. Elles furent décevantes pour la plupartcar très prématurées.

Page 7: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 7/31

 

Figure 2 : Une brève histoire de la biologie moléculaire jusqu'à la génomique actuelle.

L’ingénierie génomique

C'est pourtant à cette époque que furent découverts les premiers outils d'ingénierie desgénomes. Des endonucléases  dont la spécificité de séquence permettait d'envisager cibler unsite unique dans un génome entier. La première catégorie d'enzymes de cette nature, appeléemaintenant homing endonucleases, avait été découverte à partir d' un intron mobile d'un gènemitochondrial de levure présentant des anomalies de transmission héréditaire lors descroisements (Jacquier et Dujon., 1985, Colleaux et al.,  1986, Colleaux et al.  1988, Dujon,2005a). Tout sauf le chemin direct souhaité par les tenants actuels de la recherche sur projets

prédéfinis ! De très nombreuses homing endonucleases sont connues actuellement issuesd'une variété d'organismes ou synthétisées artificiellement pour des applications précises. Unedeuxième catégorie d'endonucléases site-spécifiques est représentée par les protéines à doigtde zinc et, plus récemment, une troisième catégorie a été fabriquée artificiellement paringénierie de molécules naturelles et synthétiques, les TALLE nucleases ou TALLEN. Avec cesoutils, et tout ce que l'on a appris sur les génomes (voir plus loin), on peut raisonnablementespérer maintenant qu'une véritable ère de Génie génomique s'ouvre à nous.

Les multiples fonctions des ARNs

Pendant ce temps, les ARNs continuèrent de nous surprendre. D'abord, on découvrit

qu'ils subissent des éditions, c'est-à-dire que leur séquence est modifiée de façon précise etdéterminée, changeant ainsi l'information génétique qu'ils étaient censés véhiculer. On

Page 8: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 8/31

connaît maintenant beaucoup de mécanismes différents d'édition. Dans certains cas, l'éditionpeut être tellement massive qu'elle crée des messagers traduits en protéines là où il n'y a pasde gène reconnaissable correspondant. C’est le cas des mitochondries dans le grand groupeeucaryote des Excavates (voir figure). Mais surtout on découvrit que les ARNs sont capablesde catalyser   des réactions chimiques (Cech et al., 1981, Altman, 1981). D’abord cellesconcernant leur propre structure (transesterifications   permettant l'épissage des introns,hydrolyse des liaisons phosphodiester permettant la maturation des ARNs précurseurs). Maisaussi toute une variété d'autres réactions biochimiques. Aujourd'hui on sait que les ARNs sont

impliqués, comme catalyseurs ou comme co-facteurs, dans une variété de réactionsessentielles à la vie cellulaire telles que la synthèse protéique  au niveau du ribosome,l'élongation des télomères   (Greider and Blackburn, 1989), le transport  des protéines, lesprocessus de maturation ou de modifications chimiques d'autres ARNs et, bien sûr, le contrôlede l’expression d’autres gènes ainsi que des éléments mobiles, des séquencs virales ou desséquences répétées dans les génomes. On découvrit des machineries complexes chez leseucaryotes, impliquant des petits ARNs, pour ces dernièrs types d’activités (Fire et al., 1998).Le nombre des petits ARNs et la variété de leurs propriétés ont augmenté très vite grâce, enparticulier, aux nouvelles méthodes de séquençage.

Le séquençage des génomes et le développement de la Génomique

Les motifs

Au milieu des années 1980s, les applications potentielles du génie génétique etd’autres considérations plus stratégiques, voire politiques, allaient motiver le séquençage desgénomes entiers, à commencer par celui de l'homme. Plusieurs années s'ensuivirent au coursdesquelles hésitations, conflits et rebondissements ne furent pas rares. Contrairement auxidées simples, les progrès les plus décisifs ne vinrent pas toujours de là où on les attendait.Comme dans toute recherche véritable d'ailleurs. Des bactéries (comme Haemophilusinfluenzae), la levure de boulangerie Saccharomyces cerevisiae et le nématode Caenorhabditiselegans  devaient jouer, chacun à leur manière, des rôles essentiels dans le programme"génome humain" alors qu'ils étaient des initiatives indépendantes (lire, par exemple, Vassarotti

et al.,1995, Goujon, 2001, Brown, 2003). Ironiquement, alors que certains ne voyaient dans cesgénomes que des tremplins technologiques pour le génome humain, c’est sur le planconceptuel que les choses commençaient à bouger.

Les surprises

Les premiers génomes séquencés (Fleischmann et al. 1995, Goffeau et al. 1996) nousrappelèrent rapidement à quel point des connaissances fondamentales nous manquaient. Avecle génome de la levure, trois surprises majeures attendaient les généticiens. D’abord, il y avaitdans le génome beaucoup plus de gènes pour chaque fonction que ce que la génétique laissaitprévoir. En d’autres termes, les cribles génétiques classiques mêmes les plussystématiquement appliqués n’arrivaient jamais à l’exhaustivité. Ensuite, beaucoup de gènesavaient des séquences entièrement nouvelles, sans similarité dans les bases de donnéesexistantes. Une explication triviale était que ces bases de données étaient très incomplètes, cequi n’était pas faux. Mais même aujourd’hui chaque nouveau génome séquencé fait apparaîtreune fraction non nulle de tels gènes qu’on désigne donc comme « orphelins ». Une autreexplication commune à l’époque était que ces gènes orphelins n’étaient pas des vrais gènes.Ce qui n’est pas nécessairement faux non plus pour certain d’entre eux. Mais leur nombreélevé exclu la généralisation de cette hypothèse. Une réalité plus intéressante, compriseseulement maintenant, est que certains des gènes orphelins sont en réalité des gènes créésde novo dans les différentes lignées évolutives. Enfin, la troisième surprise était que nombrede gènes étaient dupliqués. Ceci était incompréhensible dans la vision classique de mutationsaléatoires soumises à la sélection naturelle. On sait maintenant que cette redondance  est

vraie pour tous les génomes, même si le cas de la levure était particulier. En d'autres termes,la nature ne connaît pas les génomes minimums dont rêvent les ingénieurs. La raison est àrechercher dans la dynamique évolutive perpétuelle des génomes (voir plus loin).

Page 9: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 9/31

 

Les chiffres

Actuellement, de nombreux génomes bactériens ont été séquencés entièrement oupartiellement (plus de 26.000 projets sont mentionnés sur le site GOLD(http://www.genomesonline.org/). Il en va de même d'environ six cents génomes d' Archaea (undéficit important comparé aux bactéries) et d'un nombre rapidement croissant d’eucaryotes

(environ 4.000 sont terminés ou en cours). Historiquement, ce fut la levure Saccharomycescerevisiae avec son génome d'environ 13 millions de nucléotides (Mb) le premier eucaryoteséquencé (Goffeau et al. 1996, 1997). Puis, alors que le nombre de génomes bactériensaugmentait, on a vu apparaître successivement les séquences de génomes eucaryotes plusgrands tels que ceux de Caenorhabditis elegans, (97 Mb, Sulston, Waterston et Consortium,1978), un nématode servant de modèle expérimental, et d' Arabidopsis thaliana  (115 Mb,Arabidopsis Genome Initiative, 2000), une crucifère modèle. Ces débuts étaient très laborieux.Ils nécessitaient plusieurs années de travail de consortiums de laboratoires qui établissaientd'abord une cartographie détaillée des génomes avant un séquençage ordonné des segmentspar la méthode de Sanger. Chacun de ces projets marquait une étape importante de lagénomique naissante.

Le génome humain

Au tournant de l'an 2000, un premier assemblage du génome de Drosophilamelanogaster  (160 Mb) était publié, démontrant la faisabilité d'un séquençage aléatoire total,dit shotgun (Adams et al., 2000). Il s'agissait d'une étape importante dans la course au génomehumain. Celui-ci (environ 3100 Mb) a été déclaré terminé dans une première version en 2001 (Collins et al., 2001, Venter et al., 2001). C'était un travail considérable qui avait impliqué pourl'International Human genome Consortium, le séquençage chromosome par chromosome, parl'intermédiaire de clones BAC ancrés sur une cartographie génétique, et qui s'est terminé parune compétition contre un groupe privé travaillant par séquençage total aléatoire (shotgun).Compétition biaisée car, alors que les séquences chromosome par chromosome duConsortium international étaient rendues immédiatement publiques, celles du groupe privé

restaient confidentielles. Une version plus complète et révisée du génome humain fut publiéepar l'International Human genome Sequencing Consortium (2004). Il s'agissait toujours d'un"génome théorique", c'est-à-dire d'un équivalent haploïde de plusieurs individus. Aujourd'hui,les génomes de plusieurs personnes vivantes sont séquencés et certains scientifiques connusont souhaité voir leurs génomes publiés les premiers. Après plusieurs autres génomes dereprésentants de différentes populations ayant permis les premières comparaisons, un vasteprojet d'étude du polymorphisme a été lancé impliquant le séquençage de plus d'un millierd'individus appartenant à 14 populations (1000 genomes international initiative). Avec lesgénomes individuels, on découvre qu'au-delà des SNPs et indels, le polymorphisme génétiqueentre les individus implique de grandes variations structurales dont l'importance était sous-estimée, telles que de larges délétions, duplications ou inversions (Korbel et al., 2007) et desréarrangements balancés (Chen et al., 2008). Les variations du nombre de copies de segmentsde chromosomes (CNVs) sont maintenant reconnues comme une source majeure depolymorphisme des génomes. L'analyse des données de polymorphisme est en train de nousapporter de nombreuses informations sur les variations entre individus (Abecassis et al., 2012),l'origine des indels (Montgomery et al., 2013), les évènements de rétroduplications (Abyzov etal., 2013) ou encore les variations fonctionnelle d'expression des gènes (Lappalainen et al., 2013) pour ne citer que quelques exemples. Des espoirs considérables apparaissent dans ledomaine des cancers (Khurana et al., 2013) en particulier grâce à la possibilité d'identifier desallèles à faible pénétrance Whiffin et al., 2013).

Page 10: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 10/31

 

Les grands génomes

Après la première version du génome humain apparurent les génomes d'autresvertébrés qui devaient jouer un rôle fondamental dans l'interprétation du génome humain. Ils'agit du Fugu  (365 Mb, Aparicio et al.,  2002), un poisson téléostéen, et de son cousin

Tetraodon negroviridis  (Jaillon et al.,  2004). C'est avec ce dernier que, par comparaisondétaillée, l'on réussit à déduire que le génome humain devait compter seulement 23.000 gènesenviron. Vinrent aussi les génomes du riz (420-466 Mb, Goff et al. 2002, Yu et al., 2002, Yu etal.,  2005), d’ Anopheles gambiae  (278 Mb, Holt et al., 2002), un moustique vecteur de lamalaria, d'autres nématodes (Stein et al., 2003, Mitreva et al., 2005), de la souris (Waterston etal., 2002, Mouse genome consortium, 2002), du rat (Gibbs et al., 2004), du poulet (Hillier et al.,2004, du chimpanzé (Mikkelsen et al., 2005) et d'autres grands primates. Ensuite, apparurentles génomes du peuplier, du chien, de la vigne, du cheval, du bananier, de l'ornithorhynque, duconcombre, de la papaye, du ver à soie pour ne citer que quelques exemples. Il est devenuimpossible de suivre cette accélération. Malgré cette abondance, chaque nouveau génomecontinue de nous révéler des surprises. Tous ces génomes ne sont pas nécessairementséquencés de manière complète. À cause de leur taille même, ou des difficultés inhérentes à

leur complexité, on réalise le séquençage à un certain niveau de couverture  moyenne1

,variable selon les besoins. Il reste des trous ou des zones de basse qualité dans lesséquences déposées dans les bases de données. Il faut s'en souvenir même si les progrès dela Génomique comparative permettent de s'en accommoder. Et surtout les méthodes deséquençage ayant considérablement évolué (voir plus loin), les problèmes se posentaujourd’hui de manière totalement différente pour les nouveaux génomes étudiés.

La génomique évolutive

En parallèle des grands génomes cités, le séquençage total ou partiel de beaucoupd'autres génomes eucaryotes de taille plus modeste était devenue chose courante au débutdes années 2000 en utilisant la méthode Sanger. Ceci a ouvert la voie à un nouveau champ de

recherches dans lequel la dimension évolutive prenait de plus en plus de place par rapport à ladimension fonctionnelle. Plusieurs dizaines d'espèces de levures ont été séquencées, (Soucietet al., 2000, Wood et al., 2002, Cliften et al., 2003, Kellis et al., 2003, Jones et al., 2004, Dujonet al., 2004, Dietrich et al, 2004, Kellis et al., 2004, Loftus et al., 2005, Dujon, 2005b, 2006,Novo et al, 2009, Dujon, 2010), et autant de champignons divers (Galagan et al., 2003, 2005,Machida et al., 2005, Nierman et al., 2005, Dean et al., 2005, Kaiper et al., 2006, Martin et al., 2008, 2010, Ma et al.,  2009,). On a séquencé des microsporidies (la première étaitEncephalitozoon cuniculi, Katinka et al., 2001), des parasites comme le Plasmodium falciparum (Gardner et al, 2002), agent de la malaria et son cousin P. yoelii yoelii (Carlton et al., 2002) etd'autres Apicomplexes comme Cryptosporidium hominis  (Xu et al.,  2004), les trypanosomesTrypanosma brucei  (Berriman et al., 2005) et T. cruzi  (El-Sayed et al., 2005), la leishmanieLeshmania major  (Ivens et al., 2005), des amibes comme Entamoeba histolytica (Loftus et al., 2005) ou Dictyostelium discoideum (Eichinger et al., 2005) etc ... A mesure que l’efficacité deséquençage augmentait, la génomique évolutive a pu également s’adresser aux organismespluricellulaires. Douze espèces de Drosophiles ont été séquencées et comparées pourcomprendre l'évolution de ce groupe d'insectes (Drosophila 12 genomes consortium, 2007). Lepoint critique était l’existence de centres de séquençage capables de générer et de traiter desgrands volumes de données.

1  Dans un séquençage aléatoire, la couverture est donnée par le nombre de nucléotides totaux séquencés rapporté à la taille du génome. SiL est la longeur moyenne (en nucléotides) de chaque lecture, N le nombre total de lectures effectuées et G la taille du génome (en

nucléotides), la couverture C s'exprime par C= NL/G). On a l'habitude d'exprimer ce rapport par un nombre de X (ex. 3X: couverture typiqued'un séquençage exploratoire, 6X: couverture typique d'un brouillon assemblé de séquence (draft), 10 -12 X: couverture standard d'uneséquence qui sera soumise à finition). Tous ces chiffres correspondent aux séquençages génomiques réalisés selon la méthode de Sanger jusqu’en 2007 environ. Avec l'arrivée des nouvelles technologies, des couvertures beaucoup plus élevées sont obtenues et le problème desfinitions est abandonné faute de pouvoir le traiter (voir chapitre).

Page 11: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 11/31

 

Le Génoscope

En France, le Génoscope d'Evry, qui n'est pourtant que d'une taille modeste vis-à-visde ses concurrents étrangers, a réalisé le séquençage complet du chromosome 14 humain(Heilig et al., 2003), du poisson Tetraodon (Jaillon et al., 2004), de la Paramécie (Aury et al., 2006), de la vigne (Jaillon et al., 2007), d'une algue brune Ectocarpus silicosus (Cock et al.,

2010), de l'urochordé Oikopleura, pour ne citer que les plus grands projets. Depuis une dizained’années, il a réalisé plusieurs centaines de projets génomes au service de la communautéscientifique française et européenne, en plus du séquençage de régions génomiques d'intérêtparticulier, de la recherche de mutations, de banques d'ADN complémentaires etc ...

Les curiosités biologiques

Avec les génomes, la Biologie traditionnelle redevient d'actualité. Par exemple, on aséquencé les nucléomorphes de symbiontes récents tels que Guillardia thêta, une Cryptophyteconsidérée à tort comme une algue rouge (Douglas et al., 2001) et Bigelowiella natans, unChlorarachniophyte considéré à tort comme une algue verte (Gilson et al.,  2006). Cesnucléomorphes représentent en réalité les restes des noyaux d’une algue rouge ou verte,

respectivement, après leur absorption par d’autres eucaryotes unicellulaires ayant ainsi acquisla photosynthèse de manière endosymbiotique (Curtis et al., 2012). De la même façon, on aséquencé le génome d'une ascidie, Ciona intestinalis  pour explorer la base évolutive desChordés (Dehal et al., 2002). On s'intéresse aussi aux annélides et aux mollusques car ce sontdes Lophotrochozoaires, une branche animale longtemps inexplorée au niveau génomique etqui présente de nombreuses caractéristiques intéressantes dans le plan de formation du corps.Loin d'être une activité réductionniste à l'extrême comme certains l'imaginent, l'étude desgénomes ouvre des voies nouvelles, d'une efficacité inconnue auparavant, pour tous ceux quiconnaissent l'Histoire naturelle  et ses remarquables observations. On s'intéresse auxsymbioses, au parasitisme, et à toutes les interactions des organismes dans la nature.

Génomique populationnelle et métagénomique

De plus, pour un nombre croissant d’organismes on séquence, pour les comparer, denombreux individus d’une même espèce. On parle de reséquençage. C’est évidemment le caspour l’homme, mais aussi pour de nombreux microorganismes (voir par exemple Liti et al., 2009). Avec cette stratégie, la génomique rejoint la génétique des populations, enl'enrichissant d'une quantité de données que cette dernière ne pouvait pas obtenir par lesméthodes traditionnelles. C'est là, l'un des défis majeurs de l'enseignement de la Biologiemoderne, tant ces disciplines sont restées trop longtemps séparées (voir Lynch, 2007). Demême, l'analyse des génomes nous affranchit de la nécessité d'isoler les organismes étudiés,ce qui n'est pas toujours possible. Au contraire, on peut s'intéresser directement à despopulations naturelles, ou même des écosystèmes. On parle de métagénomique.Actuellement, on découvre plus d'espèces nouvelles par le séquençage métagénomique quepar les méthodes traditionnelles. L'étendue de la biodiversité des espèces devient accessibleaux nouvelles méthodes de séquençage (Sogin et al.,  2006). Les océans deviennent deschamps d'exploration systématique. Un projet piloté par des équipes françaises et leGénoscope (Tara Océans) a été lancé pour cataloguer des virus, des bactéries et deseucaryotes unicellulaires des océans du monde entier (Karsenti et al.,  2011). Plusieurscentaines de prélèvements ont été effectués et les échantillons sont caractérisés par leséquençage et l’analyse des morphologies cellulaires (Karsenti, 2012). Les échantillonsocéaniques montre de nombreux virus dont l’importance écologique est probablement grande(Hingamp et al., 2013 ). Les sols aussi sont évidemment étudiés pour leur importanceagronomique ou forestière mais également pour suivre les effets de diverses pollutions (Monier,et al., 2011). Au fur et à mesure que les résultats arrivent, on mesure l'ampleur de ce qui nous

reste à découvrir, même dans des systèmes limités comme les flores intestinales de l'hommeou des animaux pour lesquels des programmes internationaux ont déjà livrés leurs

Page 12: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 12/31

 

premiers résultats (Qin et al.,  2010). On parle maintenant couramment de microbiome  pourdésigner les flores microbiennes dont les compositions peuvent maintenant être intégralementdécrites par la métagénomique sans nous limiter aux micro-organismes cultivables.

La phylogénomique 

Enfin, c'est tout l'arbre du vivant qui est revu (et souvent corrigé) avec les données desgénomes. Il suffit pour s'en convaincre de regarder l'arbre actuel des eucaryotes (Baldauf et al., 2003, Keeling et al., 2005, voir figure) et de le comparer avec les versions antérieures, mêmerelativement récentes. A la phylogénétique succède une phylogénomique dont les principessont encore objet d'actives recherches, vu la complexité du problème. La congruence destopologies des arbres devient un problème très compliqué si l'on souhaite y intégrer toutes lesdonnées des génomes. Les arbres obtenus dépendent du lot de gènes utilisé pour établir laphylogénie. Les raisons de ce phénomène sont complexes et encore mal comprises. Leshybrides naturels et les transferts génétiques horizontaux sont probablement beaucoup plusfréquents qu'on ne l'imagine.

Figure 3 : L'arbre phylogénétique des eucaryotes compte neuf lignées principales regroupées ici en cinq branchesmajeures (Keeling et al, 2005). Le nombre de génomes séquencés complètement ou partiellement (rouge gras)montre un fort déséquilibre entre les cinq principales branches (GOLD octobre 2011). La génomique a encore àfaire un long travail d’exploration avant qu’une description équilibrée du monde vivant devienne disponible.

Page 13: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 13/31

 

Chez les bactéries, on constate que de nombreux segments de génomes varient entre isolatsd'une même espèce, reflets d'intenses échanges génomiques au sein des populations. Lanotion même d'espèce  s'estompe. On en vient à considérer un génome bactérien en deuxparties, le "cœur" formé des gènes à transmission verticale (donc propre à la phylogénie) et les"ajouts" reflet d'une intense dynamique horizontale, les propriétés biologiques de l'organisme,ses capacités à s'adapter à des niches écologiques ou, par exemple, à devenir pathogènes,

étant la résultante finale des deux parties (Danchin et al., 2007). Évidemment, certainsorganismes, dont l'homme, ont une reproduction sexuée  obligatoire, structurant lespopulations selon les lois de la génétique classique. Mais beaucoup d'autres, surtout lesmicroorganismes ou les champignons mais aussi les plantes ou même certains animaux, ontdes phases d'expansion clonale  considérable dont on retrouve la signature dans lesgénomes. Avec la perte fréquente de la sexualité dans de nombreuses lignées demicroorganismes eucaryotes, la notion d'espèce s'estompe encore plus.

Le problème de l’échantillonage taxonomique

A mesure que se précise l'arbre du vivant, on réalise à quel point nos connaissances

actuelles sur les génomes sont biaisées. Si l'on reporte les nombres de génomes connus surles différentes branches évolutives des eucaryotes, on s'aperçoit que l'essentiel des donnéescorrespond à deux grandes divisions évolutives, celle des Opistokontes qui rassemble tous lesanimaux et les champignons et celle des Viridiplantae  c’est-à-dire les plantes et les alguesvertes. Si un nombre raisonnable de données existent pour le complexe des Chromalveolata regroupant les Apicomplexes, les Ciliés, les Algues brunes, les Oomycètes et qulque autreslignées, en revanche pratiquement rien n'est connu des génomes des deux autres grandsgroupes, Excavata  et Rhizaria, alors que les rares données disponibles suggèrent quebeaucoup de surprises nous attendent. Les modes de financement de la recherche ne sont pasétrangers à ces biais de nos connaissances. Mais la curiosité des chercheurs est également encause. Si l'on ne peut enseigner que ce que l'on connaît, la recherche elle, consiste àétudier ce que l’on ne connaît pas déjà !

Les nouvelles méthodes de séquençage

La période Sanger (1977-2007)

La méthode de Sanger   était basée sur la synthèse in vitro  de copies d'ADNcomplémentaire à un brin matrice par les polymérases. La méthode de Maxam et Gilbert étaitbasée sur la dégradation chimique des molécules d'ADN. Les deux méthodes impliquaient lemarquage terminal des molécules et leur séparation selon leur taille par électrophorèse à hauterésolution, toutes les molécules d'une même réaction de séquençage ayant une extrémitécommune (origine) et l'autre dépendant de la nature du nucléotide terminal. Malgré leur apportconsidérable à la Biologie, les méthodes initiales de séquençage ne permettaient pas uneaugmentation d'échelle significative car elles nécessitaient trop d'interventions manuelles.Plusieurs perfectionnements techniques, couplés aux progrès parallèles de l'informatique,allaient graduellement changer le paysage jusqu’au milieu des années 2000. On peut citer lamise au point, puis l'utilisation de nucléotides fluorescents  qui, couplée à l'électrophorèsecapillaire, allait permettre la construction de toute une génération d'automates (séquenceurs)existant encore aujourd'hui bien que de moins en moins utilisés. Avec les machines les pluspuissantes de cette génération technologique, on pouvait déterminer en parallèle 96séquences d'environ 750 nucléotides de long chacune, soit environ 70 000 nucléotides par"run" de deux à trois heures. Ce sont ces méthodes de séquençage appliquant les principes

fondamentaux de la méthode Sanger qui, associées à des développements informatiquesadaptés permettant d'assembler, finaliser et annoter de très grands génomes, ont permisl'extraordinaire développement de la génomique jusqu’à il y a quelques années.

Page 14: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 14/31

 

Les nouvelles méthodes de séquençage

Mais la situation a radicalement changée au milieu des années 2000 (voir par exemple,Seo et al.,  2005, Margulis et al.,  2005, Shendure et al.,  2005) avec l'arrivée de nouvellesméthodes de séquençage souvent appelées NGS  (pour Next Generation Sequencing).Contrairement aux perfectionnements techniques précédents ces nouvelles méthodes

appliquent des principes différents de ceux des méthodes historiques. Elles ont été renduespossibles autant par les progrès de la biologie moléculaire (nouvelles molécules, nouvellesréactions) que par ceux de l'ingénierie (miniaturisation, traitement des images). Avec le NGS,la Biologie est entrée dans une nouvelle ère pour plusieurs raisons. D’abord, les quantités deséquences produites sont beaucoup plus élevées que celles obtenues par la méthode Sanger.Par exemple, un "run" sur une machine utilisant le pyroséquençage produit environ un millionde séquences de longueur moyenne 500 nucléotides, soit un total de plus de 500 millions denucléotides (à comparer aux 70.000 nucléotides des méthodes précédentes). Autre exemple,un "run" sur une machine utilisant la synthèse en phase solide peut produire plusieurs milliardsde lectures de longueur de 100 nucléotides ou plus, soit un total de plusieurs centaines demilliards de nucléotides. C’est actuellement cette dernière technologie qui est la plus utiliséedans le monde. Sa puissance est telle que, souvent, plusieurs échantillons sont mélangés,

après étiquetage moléculaire, pour être soumis à un séquençage unique. Les séquencesélémentaires sont ensuite aisément triées en utilisant les étiquettes avant d’être traitées. Lestechniques encore en développement basées sur l'analyse de molécules uniques ont desrendements un peu plus faible mais permettent d'envisager d'allonger la longueur de chaquelecture, ce qui est un point essentiel pour l'assemblage de novo de génomes inconnus.

La profondeur de lecture, élément critique

Avec ces nouvelles techniques, on entend souvent que le coût du séquençage a chutéen quelques années de plus de 5 ordres de grandeur. Une performance rarement atteinte.C’est ce qui a permis au séquençage d’ADN une devenir une technologie centrale pour denombreuses applications (agronomie, environnement, cancer, génétique médicale, recherche

d’empreintes, criminologie etc  …). On parle même de son application en routine dans lessimples laboratoires d’analyse médicale. Mais ce n’est pas cet aspect économique qui est leplus intéressant. Avec les nouvelles techniques de séquençage, la multiplication des lecturesest telle qu’elle permet enfin d’atteindre des nombres comparables à ceux des moléculesd’ARN dans une cellule ou au nombre de molécules d’ADN d’un organisme pluricellulaire oud’une population de microorganismes. L’étude exhaustive  se substitue à l’échantillonnagealéatoire. Ensuite, les méthodes NGS n'utilisent plus le clonage de l'ADN dans des vecteursd'E. coli qui fut la signature universelle du génie génétique depuis plus de 35 ans et celle de lagénomique pendant une quinzaine d'années. La séparation des molécules d'ADN à séquenceret leur amplification se fait maintenant entièrement in vitro par PCR dans des micelles ou surdes supports solides. Avec les nouvelles technologies à molécules uniques, il n'y a même plusd'amplification par PCR. Ce sont les molécules d'ADN présentes dans l'organisme étudié quisont directement séquencées. Avec l'énorme avantage de pouvoir identifier, en plus de laséquence des 4 nucléotides fondamentaux, les modifications chimiques que ces moléculespeuvent porter et qui sont effacées par l'amplification par PCR.

Une révolution épistémologique

Evidemment, les bases de données et les logiciels  d’analyse doivent s'adapter auxénormes quantités de données produites par ces nouvelles méthodes. Il n'est plusenvisageable de stocker les données brutes de manière pérenne. Ces méthodes ont déplacéles limites des problèmes techniques vers des problèmes d'informatique. Dans cette nouvelleBiologie qui émerge, la composition des équipes de recherche et la formation de leurs

membres, donc des étudiants, changent totalement. L’effort d’analyse des données surpassecelui de la production des données. Mais les véritables changements ne se limitent pas auvolume des données à traiter. Le changement d'échelle  induit un changement de nature desquestions étudiées. Les systèmes modèles traditionnels des laboratoires (bactéries, levures,

Page 15: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 15/31

 

drosophile, souris, etc  …) perdent de leur importance. Tous les organismes existantsdeviennent étudiables. Ce sont leurs particularités biologiques qui font le degré d'intérêt de leurétude. Les populations naturelles elles-mêmes deviennent accessibles à l'étude génomique,sans se limiter aux espèces cultivables. L'évolution, les structures des populations, leurhistoire, les forces de sélection auxquelles elles ont été soumises deviennent lisibles dans les

génomes. La génomique de la biodiversité révolutionne notre connaissance des écosystèmeset des relations entre organismes au sein de ces derniers. La métagénomique dépasse lecatalogue existant d'espèces déjà identifiées (très incomplet) pour nous ouvrir des mondesentièrement inconnus. Les ADN fossiles deviennent analysables sans avoir besoin, d'abord, deles recopier en ADN moderne. En résumé, le changement quantitatif a induit unchangement qualitatif  dans nos façons d’aborder la Biologie.

Retour sur les bases du système génétique

Avec le nouveau séquençage, la transcriptomique cesse d'être essentiellementquantitative (mesure des quantités de transcrits par hybridation sur des arrays  ou par

séquençage d'étiquettes) pour devenir analytique (les molécules d'ARN présentes dans unecellule sont séquencées directement et quantitativement). Au lieu de se contenter deconsidérer les ARNs comme de simples intermédiaires de l'expression des gènes, ce sont lesmultiples formes de ceux-ci qui deviennent analysables, y compris celles à courte durée de vie(Jacquier, 2009, Pelechano et al., 2013) qui correspondent au fait que la transcription desgénomes eucaryotes est générale et non limitée aux gènes que l'on sait définir. Le séquençagemassif d'ARN (par l'intermédiaire d'ADN complémentaire soumis à séquençage massif) devientdonc l'outil de choix pour annoter les génomes (Denoeud et al.,  2008). De nouveaux petitsARNs non codants sont découverts. Et même les variations stochastiques intercellulairesdeviennent analysables grâce aux nouvelles méthodes de séquençage. (Newman et al., 2006).

La génomique fonctionnelle

Le problème

Si déterminer les séquences des génomes devient de plus en plus facile, il ne s'agittoujours que du point de départ d'une recherche, pas de son but. Dans la plupart des cas, onaura besoin de relier ces séquences à des fonctions biologiques, domaine plus complexe parceque moins bien défini. Eliminons ici tout de suite toutes les recherches qui s'adressent à lafonction d'un gène ou d'un petit groupe de gènes dans un système expérimental particulier.C'est le domaine de la génétique classique, pas celui de la génomique. Aujourd'hui on dispose,si on le veut, de tous  les gènes. Le problème n'est donc plus de connaître les fonctions decertains gènes, ni même de chacun, mais de comprendre comment, ensemble, ils déterminentun phénotype. On entre dans une nouvelle science (en réalité le cœur historique de laGénétique, savoir comment le génotype détermine le phénotype) que l'on tend maintenant àappeler "Systems Biology"  et dans laquelle on essaie de reconstituer toutes les interactionsfonctionnelles à tous les niveaux de complexité hiérarchiques, du gène à l'organisme. Ceciimplique naturellement un effort de modélisation théorique pour intégrer des données denature, de complexité, de précision et fiabilité différente. La génomique fonctionnelle est lapartie expérimentale nécessaire pour l'acquisition de ces données. Elle est très diversifiée ets'applique, selon les modèles étudiés, avec plus ou moins de facilité et de succès.

Page 16: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 16/31

 Transcriptome classique

Parce qu'elle était le premier eucaryote séquencé complètement, mais aussi et surtoutparce qu'elle permet des expériences plus aisées qu'ailleurs, la levure Saccharomycescerevisiae a joué un rôle important dans l'émergence des nouvelles méthodes de génomiquefonctionnelle. C'est avec cette levure que l'on a d'abord validé la méthode SAGE (Velculescu etal., 1995, 1997) puis les "microarrays" (DeRisi et al., 1997, Laskari et al., 1997), utilisés pour

quantifier les transcrits, mais aussi maintenant pour les hybridations génomiques comparatives(CGH) qui permettent d'identifier les variations du nombre de copies de gènes qui sont unélément essentiel de l'évolution et du polymorphisme entre individus (Lage et al., 2003). Les"microarrays" permettent aussi l'étude des séquences de régulation ou la sélection (ChIp-CHIP) de séquences fixées à des protéines (Harismendy  et al., 2003) ou encore, avec les"tiling arrays", de déterminer tous les polymorphismes de séquences entre individus. Encombinant ces méthodes avec la génétique classique (croisement et étude des descendants),on obtient ce que l'on désigne par "genetical genomics" ,  la stratégie la plus puissanteactuellement pour identifier les déterminants des caractères complexes tellement importantpour l'agronomie, les biotechnologies ou la médecine, sans oublier l'étude des processusessentiels de la vie cellulaire (méiose, réplication, recombinaison, conversion, réparation).

Interactome et mutants systématiques

C'est encore avec la levure que les premières cartes d'interactions de protéines ont étéétablies (Fromont-Racine et al., 1997, Uetz et al., 2000, Ito et al., 2000, 2001, Zhong et al.2003) à partir de la technique de double-hybride  (Fields et Song, 1989) ou en utilisant denouvelles méthodes de marquage et de purification des protéines et des complexes (Gavin etal., 2002, Ho et al., 2002). Pour ces raisons, et d'autres, tous les gènes de levure ont étéclonés dans des vecteurs d'expression qui permettent, avec des marquages fluorescentsd'examiner la localisation intracellulaire des protéines, ou de développer des matrices ("proteinchips") de toutes les protéines (Zhu et al., 2001, Kumar et al., 2002a, Michaud et al., 2002,2003, Ghaemmaghami et al., 2003,). La levure était le premier organisme pour lequel on adisposé d'une collection quasi-complète de mutants de délétion de chaque gènes. Des

collections équivalentes existent maintenant pour certaines bactéries et d’ autres levure. Dansces collections, chaque mutant est marqué moléculairement, permettant ainsi de le repêcher àpartir de populations (Shoemaker et al., 1996, Winzeler   et al., 1999, Giaever, 2002). Lacollection de mutants de levure a été utilisée directement pour cribler des phénotypes divers(Birrel et al., 2001, Aburatani et al., 2003) y compris ceux qui sont importants pour rechercherdes gènes morbides chez l'homme (Steinmetz et al.,  2002). De plus, d'astucieusesconstructions moléculaires faites à partir de transposons permettent des expériences demutagenèse aléatoire à partir desquelles les gènes mutés et les protéines correspondantesdeviennent immédiatement identifiables car marqués moléculairement (Ross-Macdonald et al.,1999, Bidlingmaier et al., 2002). Chez les autres eucaryotes pour lesquels de telles collectionssont difficiles à construire, on a construit des collections d'ARN interférant qui permettent decribler tout un génome en éteignant les gènes un à un sans avoir besoin de les déléter.

Interactions génétiques

C'est toujours avec la levure, grâce à la puissance de sa génétique, que l'on adéveloppé les cribles de phénotypes synthétiques  les plus perfectionnés, c'est-à-dire describles nous permettant de rechercher toutes les interactions fonctionnelles entre un gène mutédonné et tous les autres gènes de la cellule (Tong et al., 2001). Grâce à l'accumulation delarges collections de données sur les réseaux transcriptionnels, les interactions protéiques, lescomplexes macromoléculaires ou les interactions génétiques, la levure permet maintenantd'envisager la modélisation des interactions dynamiques qui ont lieu dans une celluleeucaryote et d'imaginer leur évolution (voir, par exemple, Tavazoie et al., 1999, Friedman et al.,

2000, Schwikowski et al., 2000, Ideker et al., 2001, Edwards et al., 2002, Harrison et al., 2002a, Jansen et al., 2002, Tong et al., 2002, Werner-Washburne et al., 2002, Bar-Joseph etal., 2003, Famili et al., 2003, Forster et al., 2003, Herrgard et al., 2003, Kelley et al., 2003,

Page 17: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 17/31

 

Milo et al., 2002, Qian et al., 2003, Ranish et al., 2003, Segal et al., 2003, Stuart et al., 2003,Vasquez et al., 2003, Wagner, 2003, Wuchty et al., 2003, Yu et al., 2003). Cette liste, qui n'estpas exhaustive et qui ne tient pas compte des résultats les plus récents, suffit à illustrerl'ampleur des changements en cours de la Biologie (voir par ex. Costanzo et al., 2010).

Le cœur du problème

Ce bref tableau ne doit cependant pas nous faire croire qu'il ne reste plus qu'àassembler les éléments. Plus on approfondi l'étude et plus on s'aperçoit que les éléments eux-mêmes sont plus complexes qu'on ne le pensait. Même le gène devient difficile à cerner. Avecle projet d'analyse fonctionnelle du génome humain (ENCODE Project Consortium, 2007), ons'est immédiatement aperçu à quel point la complexité des transcrits fait qu'il devientimpossible de définir les limites des gènes (Gerstein et al. 2007). Chez l’homme comme chezla levure, on voit maintenant que, loin du concept initial un gène – un produit, les génomes sonttranscrits en une multitude d’isoformes d’ARN partiellement chevauchants et de durée de vieextrêmement variable (Pelechano et al., 2013). Les molécules d’ARN qui, finalement, servirontd’intermédiaires pour la synthèse protéique (le premier dogme central de la Biologiemoléculaire) ne représentent qu’une infime partie de la population de molécules d’ARN

produites dans la cellule. En d’autres termes coder des protéines n’est pas le rôle principal desgènes ! Et d’ailleurs dans notre propre génome, seules 2% des séquences servent à cettefonction, nous laissant 98 % à mieux comprendre.

Qu’est-ce qu’un génome ?

Le texte des génomes

Quand on a séquencé un génome, on dispose du texte intégral qui détermine l’ordre, lacomplexité et le fonctionnement de l’organisme qui le porte. Ce texte contient de plus en tracel’histoire de ses ancêtres et les limites de ses possibilités évolutives futures. Les variations

d’expression dites épigénétiques  ne changent rien à ce déterminisme fondamental: lesmécanismes épigénétiques sont eux-mêmes déterminés génétiquement. Ce qu’il est importantde comprendre est que le déterminisme génétique n’est pas nécessairement simple et direct etencore moins monogénique. Il nous reste à interpréter le texte des génomes en termesfonctionnels et ceci est loin d'être résolu. La difficulté est encore accrue par les variations entreindividus d’une même population. Croire que l’on dispose du génome d’une espèce parcequ’on a séquencé l’un de ses représentants est une erreur commune. Combien de gens ontclamé qu’après l’annonce du  génome humain, on allait (enfin) passer à la post-génomique etse sont évidemment retrouvés frustrés par l’absence de retombées immédiate. Mais quepouvait-on conclure d’une référence ? Sauf de jouer son rôle de référence comme on le voitmaintenant que l’on dispose des variations individuelles.

Combien de gènes ?

De plus, à la simple question: combien de gènes dans un génome particulier séquencéavec le plus grand soin, la réponse est rarement précise. Chez l'homme, le débat fut même vifil y a quelques années (Roest-Crollius et al.  2000) avant que l'on comprenne que ledéterminisme génétique n'est pas une relation simple et univoque entre un gène et sa fonction.Mais même chez la levure, plus de quinze ans après la première séquence intégrale et malgrél'intensité des études fonctionnelles, on en est encore à modifier le nombre de gènes car on enavait oublié quelques centaines, surtout les plus courts, et annotés quelques centaines d'autresqui, après analyse, se sont révélés ne pas exister (Blandin et al., 2000, Zhang et Wang, 2000,Harrison et al., 2002b, Kumar et al., 2002b, Oshiro et al., 2002, Kessler et al., 2003, Kellis et

al., 2003). Une partie de ces problèmes est à relier au fait que la limite est floue entre un gène,un pseudogène et un proto-gène (Carvunis et al., 2012). Quelques mutations peuvent suffirepour passer de l’un à l’autre. Chez la levure, on estime à près de 1900 (un tiers du génomeenviron) le nombre de proto-gènes capables en quelques mutations

Page 18: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 18/31

 

de donner naissance à des nouveaux gènes fonctionnels. On voit que les projets de Biologiesynthétique, pourtant extrêmement prometteurs en termes de possibilité de synthèse degénomes (Dymond et al., 2011, Cooper et al., 2012), ont peut-être encore des progrès à faireavant d’être compétitifs avec la nature. Mais s’il est si difficile de définir les modèles de gènes,il ne faut pas oublier qu’en définitive chaque génome n’est en réalité que l’instantané d’unprocessus de changements permanents. Et cette dynamique évolutive devra être prise en

compte pour interpréter les génomes.Des références à revoir

Actuellement, beaucoup des génomes entièrement séquencés sont mal annotés. C'estl'un des problèmes importants que l'on doit résoudre. L'augmentation très rapide du nombre deséquences disponibles, due aux nouvelles technologies devrait nous y aider en mettant lagénomique comparative à l'échelle nécessaire pour étudier le monde vivant réel et non plusseulement les systèmes modèles. La généralisation du "RNA seq" devrait aussiconsidérablement aider. En même temps, ce sont les ordinateurs qui, seuls, seront capablesd'interpréter les textes des génomes tant ils seront nombreux dans le futur. Les utilisateurs,eux, ne pourront qu'interroger ces derniers, qui ne pourront répondre que dans un vocabulaire

standardisé, à condition qu'on leur en ait donné un. Quand on parle de fonctions, les effortsactuels de standardisation du vocabulaire sont donc indispensables (Reference GenomeGroup of the Gene Ontology Consortium, 2009). Mais on reste loin du compte car la notionmême de fonction est imprécise. En Biologie, elle représente souvent davantage l’idée que l’onse fait d’un phénomène que le phénomène lui-même.

Le gène

Si, à force de mieux connaître les gènes, on ne sait plus très bien ce qu'ils sont, c'estpeut-être qu'en réalité, ils n'existent pas. Du moins pas comme objet moléculaire précisémentdéfinissable. A ce sujet, l’étudiant pourra consulter utilement un récent ouvrage qui retrace lanotion de gène au cours du développement de la Génétique (Deutsch, 2012). Après tout,

comme le disait Johanssen lui-même quand il proposa le terme en 1906, « le gène n’est riend’autre qu’un petit mot facile à utiliser ». C’est l’intégration physique des gènes le long deschromosomes et leur intégration fonctionnelle au sein des génomes, c’est à dire la génomique,qui fait leur intérêt. On notera d’ailleurs que, contrairement à ce que l’usage actuel tend àsuggérer, le mot génome  n’est pas récent. Il a été proposé pour la première fois par H.Winckler en 1920 pour désigner le lot complet de tous les facteurs héréditaires d’un organismevivant, observable à l’époque sous la forme des chromosomes qui les portent (Winckler, 1920).Plus que dans les avancées technologiques indéniables de la génomique, c’est dans cecaractère intégré qu’il faut rechercher la véritable dimension nouvelle de la génomique.

Le cours d’Analyse des Génomes

Le bref historique ci-dessus n’a pour but que d’essayer de mieux faire comprendre auxétudiants l’origine et la signification des concepts qu’ils seront appelés à manipuler. Le cours apour finalité d’amener les étudiants à comprendre les principes fondamentaux de lagénomique, à découvrir ses méthodes et à réfléchir à ses implications dans tous les aspects dela Biologie. Pour des raisons pratiques, seules quelques unes des technologies modernes de lagénomique pourront être abordées expérimentalement. Les nouvelles technologies qui mettentl'accent sur les volumes de résultats obtenus se prêtent malheureusement mal à desdémonstrations de salles de travaux pratiques et il est possible que certains étudiants attiréspar les expériences en éprouvent une frustration. Plusieurs systèmes biologiques distincts ontété choisis pour illustrer ces principes et méthodes. Dans tous les cas, on insistera sur les

bases fondamentales des stratégies mises en jeu. Le traitement des résultats servira à illustrerl’utilisation des méthodes de l’informatique sans lesquelles aucune analyse des génomes nepourrait être possible. Étant donné la spécificité de ce domaine, des notions de

Page 19: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 19/31

 

bases en Informatique elle-même seront données aux étudiants. Les conférences théoriquesont été choisies pour illustrer différentes facettes de la génomique appliquées à des questionsbiologiques fondamentales et pour compléter les thèmes qui ne pourront pas être abordésexpérimentalement. Elles seront données par des spécialistes renommés du domaine que jevoudrais remercier vivement ici de bien vouloir consacrer un peu de leur temps et de leur talent

à cet enseignement.

Figure 4 : Une vision hypothétique du futur de la génomique, inspirée de ce que l'on entrevoitdes développements actuels. Mais n'oublions pas ce que disait Jean Dutourd  "La seule chosedont on soit sûr, en ce qui concerne l'avenir, c'est qu'il n'est jamais conforme à nos prévisions". 

Page 20: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 20/31

Abecassis, G.R., et al., 2012) An integrated map of genetic variation from 1092 human genomes. Nature 491 : 56-65.

Aburatani S, et al.,  (2003) Discovery of novel transcription control relationships with gene regulatory networksgenerated from multiple-disruption full genome expression libraries. DNA Res. 10, 1-8.

Abyzov, A. et al., (2013) Analysis of variable retroduplications in human populations suggests coupling ofretrotransposition to cell division. Genome Res. Epuc ahead of print.

Adams M. D., et al., (2000) The genome sequence of Drosophila melanogaster . Science 287, 2185-2195Altman, S. (1981) Transfer RNA processing enzymes. Cell, 23: 3-4.Aparicio, S. et al., (2002), Whole-genome shutgun assembly and analysis of the genome of Fugu rubripes. Science

297, 1301-1310

Arabidopsis Genome Initiative (2000) Analysis of the genome sequence of the flowering plant Arabidopsis thaliana.Nature 408, 796-815Aury, J-M. et al., (2006) Global trends of whole-genome duplications revealed by the ciliate Paramecium tetraurelia.

Nature 444: 171-178.Avery, O. T., Mac Leod, C. M. , McCarthy, M. (1944) Studies on the chemical nature of the substance inducing

transformation of pneumococcal types. J. Exp. Med. 98, 451-460.Baldauf, S.L. (2003) The deep roots of eukaryotes. Science, 300: 1703-1706.Baltimore, D. (1970) RNA-dependent DNA polymerase in virions of RNA tumor viruses. Nature 226, 1209-1211.Bar-Joseph Z, Gerber GK, Lee TI, Rinaldi NJ, Yoo JY, Robert F, Gordon DB, Fraenkel E, Jaakkola TS, Young RA,

Gifford DK. (2003) Computational discovery of gene modules and regulatory networks. Nat Biotechnol. 21,1337-1342

Beadle, G.W., Tatum, E.L. (1941) Genetic control of biochemical reactions in Neurospora. PNAS 15: 499-506.Benzer, S. (1961) On the topography of the genetic fine structure. Proc. Natl. Acad. Sci. USA. 47, 403-415.Berget, S.M., Moore, C., Sharp, P (1977) Spliced segments at the 5’ terminus of adenovirus 2 late mRNA. P.N.A.S.

74, 3171-3175.

Berriman, M., et al., (2005) The genome of the african trrypanosome Trypanosoma brucei. Science 309, 416-422Bidlingmaier S, Snyder M. (2002) Large-scale identification of genes important for apical growth in Saccharomyces

cerevisiae by directed allele replacement technology (DART) screening. Funct Integr Genomics. 1, 345-356Birrell GW, et al., (2001) A genome-wide screen in Saccharomyces cerevisiae  for genes affecting UV radiation

sensitivity. Proc. Natl. Acad. Sci. USA. 98, 12608-12613Blandin, G. et al., (2000) Genomic exploration of the Hemiascomycetous yeasts: 4- The Genome of Saccharomyces

cerevisiae revisited. FEBS Letters 487, 31-36.Brown, A. (2003) In the beginning was the worm. Columbia University Press, New York 244pp.Carlton, J.M. et al.,  (2002) Genome sequence and comparative analysis of the model rodent malaria parasite

Plasmodium yoelii yoelii. Nature 419, 512-519Carvunis, A. R.. et al. (2012) Proto-genes and de novo gene birth. Nature 487: 370-374.Cech, T.R. Zaug, A.J., Grabowski, P.J. (1981) In vitro  splicing of the ribosomal RNA precursor of Tetrahymena:

involvement of a guanosine nucleotide in the excsision of the intervening sequence. Cell, 27: 487-496.Chen, W. et al. (2008) Mapping translocation breakpoints by next-generation sequencing. Genome Res. 18: 1143-

1149.Chow, L.T., Gelinas, R.E., Broker, T.R. Roberts, R.J. (1977) An amazing sequence arrangement at the 5’ ends ofadenovirus 2 mRNA. Cell 12, 1-8.

Cliften, P., et al.,  (2003) Finding functional features in Saccharomyces  genomes by phylogenetic footprinting.Science 301, 71-76.

Cock, J.M. et al., (2010) The Ectocarpus genome and the independent evolution of multicellularity in brown algae.Nature 465: 617-621.

Colleaux, L. et al (1985) Universal code equivalent of a yeast mitochondrial intron reading frame is expressed into E.coli as a specific double strand endonuclease. Cell 44: 521-533.

Colleaux, L. et al. (1988) Recognition and cleavage site of the intron-encoded omega transposase. PNAS 85: 6022-6026.

Collins, F., and the International Human Genome Consortium (2001) The human genome. Nature 409, 813-958.Cooper, E. M. et al., (2012) The build-a-genome course. Methods Mol. Biol. 852: 273-2783.Costanzo M. et al., (2010) The genetic landscape of a cell. Science 327: 425-431.Crick, F. H. C. et al., (1961) General nature of the genetic code for proteins. Nature 192, 1227-1232.Curtis, B.A. et al. (2012) Algal genomes reveal evolutionary mosaicism and the fate of nucleomorphs. Nature 492:

59-65.Danchin, A., Fang, G., Noria, S. (2007) The extant core bacterial proteome is an archive of the origin of life.

Proteomics 7: 875- 889.Dean R.A. et al., (2005) The genome sequence of the rice blast fungus Magnaporthe grisea. Nature 434: 980-986.Dehal, P., et al., (2002) The draft genome of Ciona intestinalis: insights into chordate and vertebrate origins.

Science, 298, 2157-2167.Denoeud, F. et al., (2008) Annotating genomes with massive-scale RNA sequencing. Genome Biol. 9: R175DeRisi JL, Iyer VR, Brown PO. (1997) Exploring the metabolic and genetic control of gene expression on a genomic

scale. Science. 278, 680-686.Deutsch, J. (2012) Le gene. Un concept en evolution. Editions du Seuil.Dietrich et al., (2004) The  Ashbya gossypii genome as a tool for mapping the ancient Saccharomyces cerevisiae 

genome. Science 304, 304-307Douglas, S., et al., (2001) The highly reduced genome of an enslaved algal nucleus. Nature 410, 1091-1096.

Drosophila 12 genome Consortium (2007) Evolution of genes and genomes on the Drosophila phylogeny. Nature,450:203-218

Dujon B., et al., (2004) Genome evolution in yeasts. Nature 430, 35-44.

Page 21: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 21/31

Dujon, B. (2005a) Homing endonucleases and the yeast mitochondrial omega locus – A historical prespective. In"Homing endonucleases and inteins". (Belfort et al. Eds) Springer Berlin Heidelberg. pp. 11- 31

Dujon, B. (2005b) Hemiascomycetous yeasts at the forefront of comparative genomics. Curr Opin Genet Dev. 2005,6, 614-20

Dujon, B., (2006) Yeasts illustrate the molecular mechanisms of eukaryotic genome evolution. Trends in Genetics22, 375-387

Dujon, B, (2010) Yeast evolutionary genomics. Nature Genetics reviews 11: 512-524.Dymond, J.S. et al. (2011) Synthetic chromosme arms function in yeast and generate phenotypic diversity by design.

Nature 477: 471-476.Edwards AM, et al. (2002) Bridging structural biology and genomics: assessing protein interaction data with known

complexes. Trends Genet. 18, 529-536.Eichinger, L. et al., (2005) The genome of the social amoeba Dictyostelium discoideum. Nature 435, 43-57El-Sayed, N. M., et al., (2005) The genome sequence of Trypanosoma cruzi, etiologic agent of Chagas diseases.

Science 309, 409-415ENCODE Project Consortium (2007) Identification and analysis of functional elements in 1% of the human genome

by the ENCODE pilot project. Nature. 447: 799–816.Famili I, Forster J, Nielsen J, Palsson BO. (2003) Saccharomyces cerevisiae phenotypes can be predicted by using

constraint-based analysis of a genome-scale reconstructed metabolic network. Proc Natl Acad Sci U S A.100, 13134-13139.

Fields S, Song O. (1989) A novel genetic system to detect protein-protein interactions. Nature. 340, 245-246.Fire A, et al. (1998) Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans.

Nature 391, 806-811Fleischmann, R.D. et al., (1995) Whole-genome random sequencing and assembly of Haemophilus influenzae Rd,

Science 269, 496-512Forster J, Famili I, Fu P, Palsson BO, Nielsen J. (2003) Genome-scale reconstruction of the Saccharomyces

cerevisiae metabolic network. Genome Res. 13, 244-253Friedman N, Linial M, Nachman I, Pe'er D. (2000) Using Bayesian networks to analyze expression data. J Comput

Biol. 7, 601-620.Fromont-Racine M, Rain JC, Legrain P. (1997) Toward a functional analysis of the yeast genome through exhaustive

two-hybrid screens. Nat Genet. 16, 277-282.Galagan, J.E. et al. (2003) The genome sequence of the filamentous fungus Neurospora crassa. Nature 422, 859-

868.Galagan, J.E. et al. (2005) Sequencing of  Aspergillus nidulans and comparative analysis with  A. fumigatus and  A.

oryzae. Nature 438: 1105-1115.Gardner, M.J. et al., (2002) Genome sequence of the human malaria parasite Plasmodium falciparum Nature 419,

498-511Gavin AC, et al. (2002) Functional organization of the yeast proteome by systematic analysis of protein complexes.

Nature. 415, 141-147Gerstein MB, et al. (2007) What is a gene, post-ENCODE? History and updated definition. Genome Res. 6, 669-81

Ghaemmaghami S, et al. (2003) Global analysis of protein expression in yeast. Nature. 425, 737-741Giaever G, et al ., (2002) Functional profiling of the Saccharomyces cerevisiae genome. Nature. 418, 387-391Gibbs, R.A. et al.,  (2004) Genome sequence of the brown norway rat yields insights into mammalian evolution.

Nature 428, 493-521Gilbert, W. (1978) Why genes in pieces ? Nature 271, 501Gilson, P.R. et al., (2006) Complete nucleotide sequence of the chlorarachniophyte nucleomorph: nature’s smallest

nucleus. PNAS 103: 9566-9571.Goff, S.A., et al., (2002) A draft sequence of the rice genome (Oryza sativa L. ssp. japonica). Science 296, 92-100Glover, D.M., Hogness, D.S. (1977) A novel arrangement of the 18S and 28S sequences in a repeating unit of D.

melanogaster  rDNA. Cell 10, 167-176.Goffeau, A., et al. (1996) Life with 6000 genes. Science 274, 546-567.Goffeau A. et al., (1997) The yeast genome directory. Nature 387 suppl. 5-105.Goujon, P. (2001) From Biotechnology to Genomes: the meaning of the double helix. World Scientific Publishing Co.

PTE. Ltd. Singapore, 782 pp.Greider CW, Blackburn EH. (1989) A telomeric sequence in the RNA of Tetrahymena telomerase required for

telomere repeat synthesis. Nature 337: 331-337Harismendy O, et al. (2003) Genome-wide location of yeast RNA polymerase III transcription machinery. EMBO J.

22, 4738-4747.Harrison PM, et al. (2002a) A question of size: the eukaryotic proteome and the problems in defining it. Nucleic Acids

Res. 30, 1083-1090Harrison P, et al. (2002b) A small reservoir of disabled ORFs in the yeast genome and its implications for the

dynamics of proteome evolution. J Mol Biol. 316, 409-419Heilig, R., et al., (2003) The DNA sequence and analysis of human chromosome 14. Nature 421, 601-607Herrgard MJ, Covert MW, Palsson BO. (2003) Reconciling gene expression data with known genome-scale

regulatory network structures. Genome Res. 13, 2423-2434Hillier, L.W. et al.,  Sequence and comparative analysis of the chicken genome provide unique perspectives on

vertebrate evolution. Nature 432, 695-716Hingamp, P. et al. (2013) Exploring nucleo-cytoplasmic large DNA viruses in Tara Oceans microbial metagenomes.

ISME 7: 1678-1695.

Ho,Y, et al. (2002) Systematic identification of protein complexes in Saccharomyces cerevisiae  by massspectrometry. Nature. 415, 180-183

Holt, R.A., et al., (2002) The genome of the malaria mosquito Anopheles gambiae. Science 298, 129-149.

Page 22: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 22/31

Ideker T, et al. (2001) Integrated genomic and proteomic analyses of a systematically perturbed metabolic network.Science. 292, 929-934.

International Human Genome Sequencing Consortium (2004) Finishing the euchromatic sequence of the humangenome. Nature 431, 931-945

Ito T, et al. (2000) Toward a protein-protein interaction map of the budding yeast: A comprehensive system toexamine two-hybrid interactions in all possible combinations between the yeast proteins. Proc Natl Acad SciU S A. 97, 1143-1147.

Ito T, et al. (2001) A comprehensive two-hybrid analysis to explore the yeast protein interactome. Proc Natl Acad SciU S A. 98, 4569-4574.

Ivens, A.C., et al., (2005) The genome of the kinetoplastid parasite Leishmanaia major . Science 309, 436-442

Jacob, F, Monod, J. (1961) Genetic regulatory mechanisms in the synthesis of proteins, J. Mol. Biol. 3: 318-356Jacquier, A, Dujon, B.. (1985) An intron encoded protein is active in a gene conversion process that spreads anintron into a mitochondrial gene. Cell 41: 383-394.

Jacquier, A. (2009) The complex eukaryotic transcriptome: unexpected pervasive transcription and novel smallRNAs. Nat Rev Genet. 10: 833-844.

Jaillon, O. et al.,  (2004) Genome duplication in the teleost fish Tetraodon nibroviridis  reveals the early vertebrateprot-karyotype. Nature 431, 946-957

Jaillon, O. et al., (2007) The grapevine genome sequence suggests ancestral hexaploidization in major angiospermphyla. Nature 449: 463-467.

Jansen R, Lan N, Qian J, Gerstein M. (2002) Integration of genomic datasets to predict protein complexes in yeast. JStruct Funct Genomics. 2, 71-81

Jeffreys, A.J., Flavell, R.A. (1977) The rabbit beta-globin gene contains a large insert in the coding sequence. Cell12, 1097-1108.

Jones T., et al.,  (2004) The diploid genome sequence of Candida albicans. Proc. Nat. Acad. Sc. USA 101, 7329-7334.

Kaiper, J. et al. (2006) Insight from the genome of the biotrophic fungal plant pathogen Ustilago maydis. Nature 444:97-101.

Karsenti, E. et al. (2011) A holistic approach to marine eco-systems biology. PLoS Biol. E1001177.Karsenti, E. (2012) A journey from reductionist to systemic cell biology aboard the schooner Tara. Mol. Biol. Cell. 23:

2403-2406.Katinka M. D., et al., Genome sequence and gene compaction of the eukaryote parasite Encephalitozoon cuniciuli.

Nature 414, 45(2001) 0-453.Keeling P. et al., 2005 Trends in Ecology and Evolution, 20: 670-676Kelley BP, Sharan R, Karp RM, Sittler T, Root DE, Stockwell BR, Ideker T. (2003) Conserved pathways within

bacteria and yeast as revealed by global protein network alignment. Proc Natl Acad Sci U S A. 100, 11394-11399

Kellis, M. et al.  (2003) Sequencing and comparison of yeast species to identify genes and regulatory elements.Nature 423, 241-254

Kellis, M. et al. (2004) Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces

cerevisiae. Nature 428, 617-624Kessler MM, et al. (2003) Systematic discovery of new genes in the Saccharomyces cerevisiae genome. GenomeRes. 13, 264-271.

Khurana, E., et al. (2013) Integrative annotation of variants from 1092 humans: application to cancer genomics.Sciene 342: Epub ahead of print.

Korbel, J.O., et al (2007) Paired-end mapping reveals extensive structural variation in the human genome. Science 318: 420-426.

Kumar A, et al. (2002a) Subcellular localization of the yeast proteome. Genes Dev. 16, 707-719.Kumar A, et al. (2002b) An integrated approach for finding overlooked genes in yeast. Nat Biotechnol. 20, 58-63.Lage JM, et al. (2003) Whole genome analysis of genetic alterations in small DNA samples using hyperbranched

strand displacement amplification and array-CGH. Genome Res. 13, 294-307Lappalainen, T., et al., (2013) Transcriptome and genome sequencing uncovers functional variation in humans.

Nature 501: 506-511.Lashkari DA, et al. (1997) Yeast microarrays for genome wide parallel genetic and gene expression analysis. Proc

Natl Acad Sci U S A. 94, 13057-13062.Liti, G. et al. (2009) Population genomics of domestic and wild yeasts. Nature 458: 337-341.Loftus B.J. et al.,  (2005) The gernome of the basidiomycetous yeast and human pathogen Cryptococcus

neoformans. Science 307, 1321-1324.Loftus B.J. et al., (2005) The genome of the protist parasite Entamaoba histolytica. Nature 433, 865-868.Lynch, M. (2007) The Origins of Genome Architecture (Sinauer Associates, Sunderland, Massachusetts)Ma, L-J. et al.  (2009) Genomic analysis of the basal lineage fungus Rhizopus oryzae reveals a whole genome

duplication. PLoS Genetics 5:7 e1000549Machida, M. et al. (2005) Genome sequencing and analysis of Aspergillus oryzae. Nature 438: 1157-1161.Margulies, M. et al., (2005) Genome sequencing in microfabricated high-density picolitre reactors. Nature 437, 376-

380Martin, F. et al. (2008) The genome of Laccaria bicolor  provides insight into mycorrhizal symbiosis. Nature 452: 88-

92Martin, F. et al. (2010) Périgord black truffle genome uncovers evolutionary origins and mechanisms of symbiosis.

Nature 464: 1033-1038.

Maxam A.M., Gilbert, W. (1977) A new method for sequencing DNA. P.N.A.S. 74, 560-564.Michaud GA, Snyder M. (2002) Proteomic approaches for the global analysis of proteins. Biotechniques. 33, 1308-

1316.

Page 23: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 23/31

Michaud GA, et al. (2003) Analyzing antibody specificity with whole proteome microarrays. Nat Biotechnol. 21: 1509-1512.

Mikkelsen, T.S. et al., (2005) Initial sequence of the chimpanzee genome and comparison with the human genome.Nature 437, 69-87

Milo, R., et al. (2002) Network motifs: simple building blocks of complex networks. Science. 298, 824-827.Mitreva, M. et al., (2005) Comparative genomics of nematodes. Trends in Genetics 21, 573-581Monier, J.M. et al.,  (2011) Metagenomic exploration of antibiotic resistance in soil. Curr. Opin. Microbiol. 14: 229-

235.Montgomery, S.B. et al.  (2012) the origin, evolution, and functional impact of short insertion-deletion variants

identified in 179 human genomes. Genome Res. 23: 749-761.

Mouse Genome sequencing Consortium (2002) Initial sequencing and comparative analysis of the mouse genome.Nature 420, 520-562Newman JR, et al. (2006) Single-cell proteomic analysis of S. cerevisiae reveals the architecture of biological noise.

Nature 441, 840-846.Nierman W.C. et al.,  (2005) Genomic sequence of the pathogene and allergenic filamentous fungus Aspergillus

fumogatus. Nature 438: 1151-1156.Nirenberg, M., W., Matthaei, J. H. (1961) The dependence of cell-free protein synthesis in E. coli  upon naturally

occuring or synthetic polyribonucleotides P.N.A.S. 47, 1588-1602.Nishimura, S., Jones, D.S., Khorana, H.G. (1965) The in vitro synthesis of copolypeptides containing two amino-

acids in alternating sequence dependant upon a DNA-like polymer containing two nucleotides in alternatingsequence. J. Mol. Biol. 13, 302-324.

Novo M, et al. (2009) Eukaryote-to-eukaryote gene transfer events revealed by the genome sequence of the wineyeast Saccharomyces cerevisiae EC1118. Proc Natl Acad Sci USA. 106: 16333-16338.

Oshiro G, et al. (2002) Parallel identification of new genes in Saccharomyces cerevisiae. Genome Res. 12, 1210-1020.

Pelechano, V, Wei, W., Steinmetz, L. M. (2013) Extensive transcriptional heterogeneity recealed by isoform profiling.Nature 497: 127-131.

Qian J, et al. (2003) Prediction of regulatory networks: genome-wide identification of transcription factor targets fromgene expression data. Bioinformatics. 19, 1917-1926

Qin J. et al. (2010) A human gut microbial gene catalogue established by metagenomic sequencing. Nature 464:59-67.

Ranish JA, et al.  (2003) The study of macromolecular complexes by quantitative proteomics. Nat Genet. 33, 349-355.

Reference Genome Group of the Gene Ontology Consortium (2009) The Gene Ontology’s Reference GenomeProject: A Unified Framework for Functional Annotation across Species. PLoS Computational Biology 5:7e1000431.

Roest Crollius H, et al. (2000) Estimate of human gene number provided by genome-wide analysis using Tetraodonnigroviridis DNA sequence Nat Genet. 25, 235-238.

Ross-Macdonald P, et al.  (1999) Large-scale analysis of the yeast genome by transposon tagging and gene

disruption. Nature. 402, 413-418Sanger, F., Nicklen, S., Coulson, A.R. (1977) DNA sequence with chain terminating inhibitors. P.N.A.S. 74, 5463-5467.

Schrödinger, E. (1944) What is Life ? Cambridge University Press.Schwikowski B, Uetz P, Fields S. (2000) A network of protein-protein interactions in yeast. Nat Biotechnol. 18, 1257-

1261.Segal E, et al. (2003) Module networks: identifying regulatory modules and their condition-specific regulators from

gene expression data. Nat Genet. 34, 166-176Seo, T.S. et al.,  (2005) Four-color DNA sequencing by synthesis on a chip using photocleavable fluorescent

nucleotides. Proc. Nat. Acad. Sc. USA 102, 5926-5931Shendure J., et al.  (2005) Accurate multiplex polony sequencing of an evolved bacterial genome. Science , 309,

1728-1732Shoemaker DD, et al.  (1996) Quantitative phenotypic analysis of yeast deletion mutants using a highly parallel

molecular bar-coding strategy. Nat Genet. 14:450-456Sogin ML, et al. (2006) Microbial diversity in the deep sea and the underexplored "rare biosphere". Proc Natl Acad

Sci U S A. 103, 12115-12120.Souciet , J.L. et al.,  (2000) Genomic exploration of the Hemiascomycetous yeasts: 1- A set of yeast species for

molecular evolution studies. FEBS Letters 487, 3-149.Stein, L. D. et al., (2003) The genome sequence of Caenorhabditis briggsae: a platform for comparative geneomics.

PLoS Biol. E45.Steinmetz LM, et al., (2002) Systematic screen for human disease genes in yeast. Nat Genet. 31, 400-404.Stuart JM, Segal E, Koller D, Kim SK. (2003) A gene-coexpression network for global discovery of conserved genetic

modules. Science. 302, 249-255Sulston, J., Waterston, R., and Consortium (1998) Genome sequence of the nematode C. elegans: a platform for

investigating biology. Science 282, 2012- 2018Tavazoie S, et al., (1999) Systematic determination of genetic network architecture. Nat Genet. 22, 281-285Temin, H., and Mizutani, S. (1970) RNA-dependent DNA polymerase in virions of Rous sarcoma virus. Nature 226,

1211-1213.Tong AH, et al.,  (2001) Systematic genetic analysis with ordered arrays of yeast deletion mutants. Science. 294,

2364-2368.Tong AH, et al., (2002) A combined experimental and computational strategy to define protein interaction networks

for peptide recognition modules. Science. 295, 321-324.

Page 24: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 24/31

Uetz P, et al. (2000) A comprehensive analysis of protein-protein interactions in Saccharomyces cerevisiae. Nature.403, 623-627

Vassarotti, A. et al., (1995) Structure and organization of the European Yeast Genome Sequencing Network. Journalof Biotechnology 41, 131-137

Vazquez A, Flammini A, Maritan A, Vespignani A. (2003) Global protein function prediction from protein-proteininteraction networks. Nat Biotechnol. 21, 697-700

Velculescu VE, Zhang L, Vogelstein B, Kinzler KW. (1995) Serial analysis of gene expression. Science. 270, 484-487

Velculescu VE, et al.,  (1997) Characterization of the yeast transcriptome. Cell. 88, 243-251.Venter, C., and Consortium (2001) The human genome. Science 291, 1153-1351

Wagner A. (2003) How the global structure of protein interaction networks evolves. Proc R Soc Lond B Biol Sci. 270,457-466.Waterston, R. et al., (2002) Initial sequencing and comparative analysis of the mouse genome. Nature 420, 520-562.Watson, J..D., Crick, F. H. C. (1953) A structure for deoxyribonucleic acid. Nature 171, 737-738.Werner-Washburne M, et al.,  (2002) Comparative analysis of multiple genome-scale data sets. Genome Res. 12,

1564-1573.Whiffin, N., et al. (2013) Deciphering the genetic architecture of low-penetrance susceptibility to colorectal cancer.

Hum. Mol. Genet. (Epub ahead of print).Winckler H. (1920) Vererbung und Ursache der Parthenogenese im Pflanzen- und Tierreich. Fischer, Jena,

Allemagne.Winzeler EA, et al.  (1999) Functional characterization of the S. cerevisiae  genome by gene deletion and parallel

analysis. Science. 285, 901-906Wood V, et al., (2002) The genome sequence of Schizosaccharomyces pombe. Nature. 415, 871-880Wuchty S, Oltvai ZN, Barabasi AL. (2003) Evolutionary conservation of motif constituents in the yeast protein

interaction network. Nat Genet. 35, 176-179.

Xu, P. et al., (2004) The genome of Cryptosporidium hominis. Nature 431, 1107-1112Yu, J. et al., (2002) A draft sequence of the rice genome (Oryza sativa L. ssp indica). Science 296, 79-91Yu, J. et al., (2005) The genomes of Ozyza sativa: a history of duplications. PLoS Biology 3, E38Yu H, Luscombe NM, Qian J, Gerstein M. (2003) Genomic analysis of gene expression relationships in

transcriptional regulatory networks. Trends Genet. 19,422-427.Zhang CT, Wang J. (2000) Recognition of protein coding genes in the yeast genome at better than 95% accuracy

based on the Z curve. Nucleic Acids Res. 28, 2804-2814.Zhong J, et al.,  (2003) A Strategy for Constructing Large Protein Interaction Maps Using the Yeast Two-Hybrid

System: Regulated Expression Arrays and Two-Phase Mating. Genome Res. 13; 2691-2699.Zhu H, et al.,. (2001) Global analysis of protein activities using proteome chips. Science. 293, 2101-2105

 _____________________

Paris, 15 Octobre 2013

Bernard Dujon

Page 25: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 25/31

COURS D'ANALYSE DES GENOMES 2013-2014

1ère SE MA IN E

Travaux Pratiques 1 : Initiation de la transcription chez la bactérieStreptococcus agalactiaeElisabeth SAUVAGE, Isabelle ROSINSKI-CHUPIN 

Lundi 4 novembre 2013

9h00-10h00   Accueil des élèves  Secrétariat de la Scolarité Présentation générale du Cours Bernard DUJON & Stéphane Le CROM (codirecteurs)

Lionel FRANGEUL (chef de travaux)

10h00-12h00 Introduction à l'étude des génomes  Bernard DUJON 

(Institut Pasteur)

13h30-17h30 Introduction à la bioinformatique Lionel FRANGEUL(Institut Pasteur)

Mardi 5 novembre 2013

9h00-10h30 

Conférence  : Les technolog ies de séquençage de l’ADN Stéphane Le CROM(Université Pierre et Marie Curie)

10h45-12h00  Présentation  des  Travaux  Pratiques  : Isabelle ROSINSKI-CHUPIN Initiation de la transcription chez Streptococcus agalactiae   (Institut Pasteur) 

13h30-14h30 Présentation des conditions de manipulation  Corinne FAYOLLE, Isabelle LEQUEUTREet traitement des déchets dans la salle de TP  (Institut Pasteur)

14h30-17h30 Travaux  Pratiques  S. agalactiae : - Purification des ARNs bactériens, traitement à la Dnase

 

Mercredi 6 novembre 2013 

9h00-12h00 Travaux  pratiques  S. agalactiae  :- Déplétion des ARNs ribosomiques, précipitation à l’éthanol

13h30-17h30 Cours  : Unix 1 Lionel FRANGEUL Cours  : Les bases de données relationnelles  (Institut Pasteur) 

Jeudi 7 novembre 2013 

9h00-12h00 Travaux  pratiques S. agalactiae  :- Contrôle de la qualité des ARN sur bioanalyseur Agilent et visite de la Génopole

13h30-17h30 Cours  : Unix 2 Lionel FRANGEUL(Institut Pasteur) 

Cours  : Les bases de données biologiques Corinne MAUFRAIS (Institut Pasteur)

Vendredi 8 novembre 2013 

9h00-10h00 Travaux  pratiques  S. agalactiae  :- Traitement par la TAP

10h00-11h30  Cours  : Transcription chez les Procaryotes  Isabel le ROSINSKI-CHUPIN(Institut Pasteur)

11h45-12h30 Travaux  pratiques S. agalactiae  :- Extraction au phénol chloroforme et précipitation à l’éthanol

14h00-18h00 Cours  : Unix 3 Lionel FRANGEUL(Institut Pasteur) 

Travaux  pratiques bioinformatique  :- Recherche multicritère dans les banques de données biologiques

Page 26: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 26/31

 

2ème SE MA IN E

Travaux Pratiques 1 : Initiation de la transcription chez la bactérieStreptococcus agalactiaeElisabeth SAUVAGE, Isabelle ROSINSKI-CHUPIN 

Bio-informatique et traitement des données issues du s équençage génomiqueLionel FRANGEUL, Corin ne MAUFRAIS, Chris tophe RUSNIOK, Stéphane LE CROM 

Lundi 11 novembre 2013

Férié

Mardi 12 novembre 2013

9h00-10h30  Conférence  : Introduction aux virus de plante et métagénomique phytov irale Thierry CANDRESSE(INRA, Université de Bordeaux)

10h45-12h00 Travaux  pratiques S. agalactiae  :- Fabrication des banques (Ligation de l’adaptateur 5’)

13h30-17h30 Cours  : Alignement de 2 séquences Corinne MAUFRAISCours  : Blast  (Institut Pasteur) Travaux  pratiques bioinformatique  :- Exercices pratiques Unix 

Mercredi 13 novembre 2013

9h00-17h30 Travaux  pratiques  S. agalactiae :- Fabrication des banques

Jeudi 14 novembre 2013

9h00-13h00 Travaux  pratiques  S. agalactiae :- Analyse sur bioanalyseur Agilent et contrôles sur gel d’agarose

14h30-17h30 Cours  : Unix 4 Lionel FRANGEULTravaux  pratiques  bioinformatique  : (Institut Pasteur) - Exercices pratiques Unix 

Vendredi 15 novembre 2013

9h00-12h00 Travaux  pratiques bioinformatique  :- Blast

13h30-17h30 Travaux  Pratiques  bioinformatique  : - Annotations IPF (1ère partie)

Page 27: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 27/31

3ème SE MA IN E

Travaux Pratiques 1 : Initiation de la transcription chez la bactérieStreptococcus agalactiae  Elisabeth SAUVAGE, Isabelle ROSINSKI-CHUPIN 

Bio-informatique et traitement des données issues du s équençage génomiqueLionel FRANGEUL, Corin ne MAUFRAIS, Chris tophe RUSNIOK, Stéphane LE CROM 

Lundi 18 novembre 2013

9h00-10h30  Conférence  : Annotat ion syntax ique et fonct ionnelle de génomes bac tér iens Claudine MEDIGUEdans un cont exte de génomique comparative  (Génoscope, Evry)

10h45-12h15  Conférence  : Les génom es des virus - une richess e sans précédent Simon WAIN-HOBSON(Institut Pasteur)

13h45-17h30 Travaux  Pratiques  bioinformatique :  - Annotations IPF (2ème partie)

Mardi 19 novembre 2013

9h00-10h30 

Conférence  : Plasticité du génome bactérien Didier MAZEL(Institut Pasteur)

10h45-12h15  Conférence  : Génomique comparative d’une espèce bactérienne modèle : Marie TOUCHONEscherichia coli   (Institut Pasteur)

13h45-17h30 Travaux  Pratiques bioinformatique  :- Exercices Unix appliqués à la biologie

Mercredi 20 novembre 2013

9h00-12h00 Cours  : Alignements multiples, recherche de motifs, HMM Corinne MAUFRAIS 

(Institut Pasteur)

13h30-17h30 Travaux  Pratiques bioinformatique  : - Alignements, recherche de motifs

Jeudi 21 novembre 2013

9h00-10h30 Conférence  : Les éléments transposables chez les Eucaryotes Cécile NEUVEGLISE(INRA, Thiverval Grignon)

10h45-12h00 Présentations des thèmes scientifiques pour l’examen oral

13h30-15h15 Travaux  pratiques  bioinformatique :- Comparaison de génomes annotés

15h30-17h30 Travaux  Pratiques  bioinformatique :- Exercices Unix appliqués à la biologie

Vendredi 22 novembre 2013

9h00-10h30 Conférence  : The Transcriptom e of Entamoeba histolytic a Chung-Chau HON(Institut Pasteur)

10h45-12h15  Conférence  : Impact des transposons sur la dynamique et l'organisation du Mireille BETERMIER

génome de la paramécie  (CNRS, Gif-sur-Yvette)

13h45-17h30 Cours  : Annotations relationnelles Lionel FRANGEUL Travaux  Pratiques  bioinformatique : (Institut Pasteur) - Dotter

Page 28: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 28/31

 

4ème SE MA IN E

Travaux Pratiques 1 : Initiation de la transcription chez la bactérieStreptococcus agalactiaeLionel FRANGEUL, Isabelle ROSINSKI-CHUPIN 

Bio-informatique et traitement des données issues du s équençage génomiqueLionel FRANGEUL, Corin ne MAUFRAIS, Chris tophe RUSNIOK, Stéphane LE CROM 

Lundi 25 novembre 2013

9h00-12h00 Travaux  pratiques bioinformatique  :- Annotation des séquences eucaryotes

13h30-17h30 Travaux  pratiques  bioinformatique S. agalactiae :- Analyse des résultats du mapping des transcrits chez Streptococcus agalactiae 

Mardi 26 novembre 2013

9h00-10h30 Conférence  : Analys e de données ChIP-seq Morgane THOMAS-CHOLLIER(ENS, Paris)

10h45-12h15 Conférence  : La transcription dite "pervasive"  chez les eucaryotes :   Alain JACQUIERl'exemple de la levure  (URA 2171 CNRS, Institut Pasteur) 

13h30-17h30 Travaux  pratiques bioinformatique S. agalactiae  :- Analyse des résultats du mapping des transcrits chez Streptococcus agalactiae 

Mercredi 27 novembre 2013

9h00-10h30 Conférence  : La fidélité de la traduction chez les eucaryotes : approche Olivier NAMYpar ribosome profiling  (IGM, Université Paris-sud, Orsay)

10h45-12h00 Cours  : Lionel FRANGEUL - Usage du code, ACP (Institut Pasteur) 

13h30-17h30 Travaux  Pratiques  bioinformatique  :- Usage du code, ACP

Jeudi 28 novembre 2013

9h00-10h30 Conférence  : Genome analysis of malaria parasites: A pathogens perspective Artur SCHERF(Institut Pasteur)

10h45-12h15 Conférence  : Paléogénomique des lignées humaines éteintes  Eva-Maria GEIGL

(Institut J. Monod, Université Paris-Diderot) 

13h30-17h30 Travaux  pratiques  bioinformatique S. agalactiae  :- Analyse des résultats du mapping des transcrits chez Streptococcus agalactiae 

Vendredi 29 novembre 2013

9h00-12h00 Travaux  pratiques  bioinformatique :- Annotation des séquences eucaryotes

13h30-17h30 Travaux  pratiques bioinformatique S. agalactiae  :- Analyse des résultats du mapping des transcrits chez Streptococcus agalactiae 

Page 29: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 29/31

 

5ème SE MA IN E

Travaux Pratiques 2 : Analyse d’un paysage épigénomique par ChIP-seq chez la drosoph ileSébastien BLOYER, Laure TEYSSET

Bio-informatique et traitement des données issues du s équençage génomiqueLionel FRANGEUL, Corin ne MAUFRAIS, Chris tophe RUSNIOK, Stéphane LE CROM 

Lundi 2 décembre 2013

9h00-11h00  Présentation  des  Travaux  Pratiques  : Sébastien BLOYER et Laure TEYSSET  Analyse d ’un paysage épigénomique par ChIP-seq chez la d rosoph ile  (UPMC, Paris) 

11h15-12h00 Travaux  Pratiques  épigénomique  :- Fixation de l’anticorps sur billes

13h30-18h00 Travaux  Pratiques épigénomique  :- Fixation des anticorps sur la chromatine

Mardi 3 décembre 2013

9h00-18h00 Travaux  Pratiques épigénomique  :- Lavage, élution et immunoprécipitations

Mercredi 4 décembre 2013

9h00-12h00 Travaux  Pratiques épigénomique  :- Purification de l’ADN immunoprécipité

13h30-15h00 Conférence  : Insights on chromosome organization: can simple  Romain KOSZUL

principles explain structural diversity?  (Institut Pasteur) 

15h15-17h15 Conférence  : PCR quantitative  Emmanuèle MOUCHEL-VIELH(CNRS, UPMC, Paris) 

Jeudi 5 décembre 2013

9h00-12h00 Travaux  Pratiques épigénomique  :- Test de ChIP par PCR quantitative

13h30-17h30 Travaux  Pratiques épigénomique  :

- Assemblage et mapping

Vendredi 6 décembre 2013

9h00-10h30 Conférence  : RNAi-based antiviral immunity  Carla SALEH(Institut Pasteur) 

10h45-12h15 Conférence  : Les petits ARN de plantes  Hervé VAUCHERET(INRA-AgroParisTech, Versailles) 

13h45-15h15 Visite du Musée Pasteur

15h30-17h30 Travaux  Pratiques épigénomique  :- Clustering

Page 30: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 30/31

 

6ème SE MA IN E

Travaux Pratiques 2 : Analyse d’un paysage épigénomique par ChIP-seq chez la drosoph ileSébastien BLOYER, Laure TEYSSET, Stéphane LE CROM, Lionel FRANGEUL  

Lundi 9 décembre 2013

10h45-12h15 Conférence  : Partenariat hôte-microbe et symb iose  Gérard EBERL (Institut Pasteur)

13h45-17h30 Travaux  Pratiques bioinformatique épigénomique  :- Analyse des résultats des PCR quantitatives

Mardi 10 décembre 2013

10h30-12h00 Conférence  : Organisation fonctionnelle et dynamique développementale  François ROUDIER 

de l’épigénome d’Arabidopsi e  (ENS, Paris)

13h30-17h30 Travaux  Pratiques bioinformatique épigénomique  :- Mapping et peak calling du ChIP-Seq

Mercredi 11 décembre 2013

10h30-12h00 Conférence  : Diatomée et métagénomique TARA Océan  Chris BOWLER(ENS, Paris)

13h30-17h30 Travaux  pratiques bioinformatique épigénomique  :- Analyse globale et corrélation ENCODE

Jeudi 12 décembre 2013

10h00-12h00 Conférence  : le pro jet ENCODE  Sarah DJEBALI (Center for Genomic Regulation Barcelone, Espagne)

13h30-15h30 Travaux  pratiques épigénomique  :- Bilan des analyses des résultats

15h45-16h45 Bilan final du Cours 

Vendredi 13 décembre 2013

Libre

Page 31: analyse génomique

7/21/2019 analyse génomique

http://slidepdf.com/reader/full/analyse-genomique 31/31

7ème SE MA IN E

MM OO DD A A LL II TT EE SS  DD EE SS  EE XX A A MM EE NN SS 

Examen écrit de bio-informatique : (salle de cours 2, PLM) Lundi 16 décembre 2013 à 10 heures, durée : 1h30 (Note sur 20, coefficient 1)

Contrôle continu con cernant les Travaux Pratiques «laboratoire» : Note attribuée par les deux équipes de Travaux Pratiques«Initiation de la transcription chez Streptococcus agalactiae» et «Analyse d’un paysage épigénomique par ChIP-seq chez ladrosophile» (Note sur 20, coefficient 1)

Examen oral : (salle de cours 2, PLM)Mercredi 18 décembre et Jeudi 19 décembre 2013 :

-1. Présentation d’une des parties expérimentales des travaux pratiques «Mapping des transcrits chez Streptococcus agalactiae »ou «Analyse d’un paysage épigénomique par ChIP-seq chez la drosophile» :

introduction, résultats expérimentaux, discussion, conclusionsDurée : 10 mn et questions du jury : 5 mn (Note sur 20, coefficient 1)

-2. Présentation d’un sujet choisi parmi les thèmes ci-dessous.

Durée : 10 mn et questions du jury : 5 mn (Note sur 20, coefficient 1)

Organisation de la p résentation orale

- Exposé non public de chaque étudiant devant le jury- Diapositives (PDF uniquement)- Photocopies des diapositives (4 diapositives par page) à prévoir pour chacun des membres du jury

Thèmes pour l’examen oral de Décembre 2013

N°  Thèmes 

1  Eléments mobiles dans les génomes 

2  Evolution des génomes 

3  Génomique des bactéries

Génomique des eucaryotes 

5  Epigénomique 

6  Génomique virale 

7  La transcription et ses produits

8  Méthodes de séquençage 

9 Métagénomique

Les thèmes définis ici sont volontairement larges. Chaque étudiant présentera un sujet précis du thème choisi. L’étudiant fera uneprésentation de 10 mn (plus 5 mn de questions) en s’appuyant sur les informations données pendant les travaux pratiques, lesconférences et par la bibliographie.Les questions du jury pourront porter sur tous les thèmes.

Directives :

Il faut :- Présenter un sujet précis du thème choisi

Il ne faut pas :- Faire une présentation générale du thème- Refaire une conférence qui a été donnée pendant le cours- Utiliser les diapositives d’un conférencier

Le jury appréciera :- L’originalité du sujet traité,- La pertinence et la précision des informations,- La rigueur du plan de la présentation,- La qualité de la présentation orale et des diapositives,


Recommended