Apport de la Génomique fonctionnelle chez la Drosophile
Etude de gènes humains impliqués dans des maladies.
What is Functional Genomics?
Functional genomics as a means of assessing phenotype differs from more classical approaches primarily with respect to the scale and automation of biological investigations. A classical investigation of gene expression might examine how the expression of a single gene varies with the development of an organism in vivo. Modern functional genomics approaches, however, would examine how 1,000 to 10,000 genes are expressed as a function of development. (UCDavis Genome Center)
Functional genomics refers to the development and application of global (genome-wide or system-wide) experimental approaches to assess gene function by making use of the information and reagents provided by structural genomics. It is characterized by high-throughput or large-scale experimental methodologies combined with statistical or computational analysis of the results (Hieter and Boguski 1997)
Completion of genome sequence projects marks the start of genome-based biology
How can genome information be exploited ?
Genome data
FunctionWhat genes do
Understanding expression and function in development
and differentiation
Understanding expression and function in disease
Genes
Genome structure
Biochemical
Biological
How genes worktogether
How genes canbe used Diagnostics Therapeutics
Genome based approaches to function - Functional Genomics
*DNA Microarrays - genome wide expression analysis of genes - Transcriptome
*Proteomics - defining proteins, their functions and interactions - Proteome
*Gene inactivation - defining function through gene silencing
*Phenotype analysis - defining function through gene mutagenesis - Phenome
Le système biologique
Drosophila melanogaster
La mouche « a ventre noir » « qui aime la rosée »
Les avantages du système:
- Cycle de vie court
- Développement externe
- Création et Entretien des stocks
peu onéreux
- Génome séquencé
- Séquence du génome de 6
autres espèces :Agencourt Bioscience project (2004) :
D. ananassae, D. erecta, D.grimshawi,
D. mojavensis and D. virilis.
TIGR (2004) : D. willistoni
- Génétiquement manipulable
- Génétiquement modifiable
Le génome de Drosophila melanogaster
4 Chromosomes
180Mb dont 120Mb d’ euchromatine
LevureS. cerevisiae
Nématode C.elegans
Drosophile Homme
taille physique (Mb) 13 100 180 3.000
nombre de gènes 6.200 19.100 13.600 ~30.000
taille des gènes (kb) 1,4 2,7 3 28
fréquence des gènes (par kb) 2 4,8 / 6 9 ~100
teneur en [G+C] 38% 36% nd 41%
fraction codante 68% 27% 13% 1,4%
nombre moyen d'exons par gène
1,04 5,5 4,6 8,7
taille moyenne des exons (pb) 1.450 218 150 145
taille moyenne des introns (pb) 500 267 487 ~3.300
Caractéristiques des génomes de levure, nématode, drosophile et de l'homme :
Génomes comparés
Mise au point de programmes automatiques : • Approche conceptuelle basée sur des études linguistiques des séquences d’ADN
• On connait (partiellement) la syntaxe et la grammaire:utilisation de modèles de Markov cachés qui, après apprentissage sur un organisme donné, vont différencier les régions géniques des régions intergéniques
Programmes adaptés aux génomes procaryotes et donnant de bon résultats pour les génomes eucaryotes possédant très peu
d’introns (Levure)
GeneMark, GLIMMER
Programmes adaptés aux génomes eucaryotes présentant une forte proportion d’introns
GeneMark.hmm, HMMgene, Eugene, GENIE, etc...
Utilisés en conjonction avec des algorithmes neuronaux déterminant
le départ de transcription (qui n’est pas toujours un ATG) Netstart
les sites d’épissage Netgene2, SpliceNet, etc...
Annotation du génome : Identifier tous les gènes dans un génome
Efficacité de ces programmes automatiques :
excellente chez les procaryotes (rendement de 98-99%)
chez les eucaryotes complexes : Les règles régissant la structure et l’organisation des gènes
eucaryotes sont plus complexe!
• Mauvaise identification des gènes annotés :
gènes interprétés comme deux gènes voisins
deux gènes voisins interprétés comme un seul gène
• Une étude et exhaustive de réannotation manuelle du génome de la drosophile révèle aussi une mauvaise identification des gènes (Janvier
2003)
Annotation du génome
Janvier 2003 : réannotation manuelle du génome de la drosophile………..
Nombre de gènes: quasi inchangé : 13601 (en 2000)-> 13676 (en 2003)
727 gènes trouvés par l’ancien programme GENIE erronés ont disparus802 gènes trouvés par nouveau progamme GenScan ajoutés
Structure de 85% des gènes modifiée:
1531 gènes initialement indépendants sont fusionnés en 602 nouveaux gènes
322 gènes morcelès en 675 nouveaux gènes
93 gènes réinterprétés complètement avec des mélanges de fusion et morcellement
Annotation du génome
Estimation du Nombre de protéines codées par un gène ? Promoteurs Alternatifs:
Nématode : 4 gènes codent 4 myosines différentesDrosophile : 1 seul gène code les 7 myosines connues
Promoteur alternatif 13% des gènes (estimation Janvier 2003)
Epissage Alternatif détermine une très grande partie de la diversité du protéome
Drosophile : DSCAM (connection neuronale) / 1 orthologue chez l’homme95 exons alternatifs 38016 protéines potentielles
48 / 50 clones cDNA identifiés sont différents
Homme: 85% du protéome humain est déterminé par l’épissage alternatifChrom 19 : 544 genes 1859 mRNAs en moy. 3.2 variant/gene
Nématode: 9516 genes 12816 mRNAs en moy 1.34 variant /gene
Polyadénylation alternative 6% des gènes de Drosophile (Janvier 2003)
La diversité du protéome est le reflet la complexité d’un organisme.
Le nombre total de gènes identifiés ne reflète pas le niveau de complexité des organismes étudiés
….. on ne sait pas estimer l’état d’expression d’un gène :
Information essentielle chez les organismes complexes où l’évolution se fait par la modulation de l’expression plus que par l'augmentation du nombre de gènes
Les jeux de protéines synthétisées vont être très différents d'un tissu à l'autre d’un instant t à un autre.
Le nombre total de gènes identifiés ne reflète pas le niveau de complexité des organismes étudiés
Comparaison des génomes eucaryotes séquencés
Core proteome = nombre de familles de protéines distinctes codées par le génome d’un organisme donné. Les gènes paralogues (gènes équivalents dans une même espèce) sont
comptés comme 1 Unité.
Core proteome de la Drosophile est seulement 2 fois plus grand que celui de la Levure.
Core proteome de la Drosophile et du Nématode de taille similaire malgré de grandes différences en terme de développement et morphologie.
Le Core proteome est constitué de gènes jouant un rôle essentiel dans tous les aspects du fonctionnement cellulaire.
Il semble que la majorité sinon tous les gènes du Core Protéome humain existent chez la drosophile.
Human
35000
10000
The Biological Core or Core Proteome
Comparaison protéomes prédits :
Homme , Drosophile, Nématode et Levure
Homme 3129Fly 1445Worm 1503Yeast 1441
Fonctions cellulaires de base :Métabolisme, traduction, Réplication –réparation de l’ADN
Nombre de groupes de protéines :
-1308 groupes de protéines contenant au moins 1 orthologue prédit dans chaque organisme (plusieurs groupes contiennent des paralogues)
- 504/1308 groupes de protéines contenant 1 orthologue prédit dans chaque organisme et 0 paralogues:
Fonctions Clésn’ayant pas subit de
duplicationni d’élaboration dans les
différents lignages
Ex : enzyme chaine respiratoire
biosynthèse nucléotides
Levure (unicellulaire):
0 dans cell communication0 dans défense immunity
Classement par catégories fonctionnelles
Comparaison protéomes prédits : Drosophile, Nématode et Levure
Core protéome : Drosophile 8065 , Nématode: 9453 , Levure 4383
Comparaison par alignement de séquences:
BLAST P et alignement d’au moins 80% de la longueur de la protéine de drosophile avec une autre séquence >>>sous estimation !!!
-20% des protéines de drosophile ont un orthologue putatif chez le nématode et la levure
Protéines impliquées dans des processus communs aux eucaryotes:réplication, transcription, traduction, division cellulaire…
- 35% des gènes de drosophile ont un orthologue putatif chez le nématode
-Développement des organismes pluricellulaires-Interactions cellule- cellule / cellule substrat -Protéines à homéodomaines, -Molécules d ’adhérence cellulaire…...
- certaines familles de protéines sont présentes seulement chez la drosophile-Protéines impliquées dans la réponse immunitaire
système immunitaire inné primitif similaire à celui des vertébrés -Protéines transmembranaires de fonctions inconnues-Protéines spécifiques (ex : cuticule)
Génome humain : 3200 Mb, ~30 000 gènes prédits2 duplications successives d ’un génome élémentaire non redondant (drosophile)
Conservation au niveau moléculaire des produits de gènes entre Drosophile et Homme
67% homologie avec protéome de drosophile
des produits de gènes entre Drosophile et nematode et levure 43% homologie avec protéome du nématode et de la levure46% homologie avec protéome de la levure
Gènes absents chez la drosophile/ homme: reflète différences physiologiques entre homme et drosophile:
hémoglobines (thalassémies)
réarrangement des gènes d’immunoglobuline (système immunitaire acquis)
Comparaison protéomes prédits :Homme , Drosophile, Nématode et Levure
The Berkeley Drosophila Genome Project (BDGP):
> 60% (177/289) de gènes humains impliqués dans des pathologies humaines ont des homologues évidents chez la drosophile.
‘The fly is an extremely useful model system for studying genes associated with disease in humans.’
‘The fly is an extremely useful model system for studying genes associated with disease in humans.’
289 human proteins used as queries to search a database consisting of the sum total of gene products (38,860) found in the complete genomes
of fly, worm, and yeast.
BLASTP searchesTBLASTN searches : control for potential frameshift errors in the Drosophila genome
sequence. Only two cases were manually corrected.
Results are scaled according to various levels of statistical significance,
Refelect the level of confidence in either evolutionary homology or functional similarity.
« + » : likely functional equivalent of the human protein (biological evidence)
« - » unable to identify a likely functional equivalent of the human protein.
< < <
no or weak sequence similarityE values >1 X 10–6
highest degree of sequence conservation.E values < 1 x 10-100
BDGP
BDGP
E. Bier. University of California San Diego :
714 Human genes from OMIM (Online Mendelian Inheritance in Man)
versus Drosophila genome
BLASTP , E value of 10-10
~76%(548/714) of the human disease genes had homologues in the fly
E. Fortini .University of Pennsylvania School of Medicine :
287 other Human genes from OMIM (Online Mendelian Inheritance in Man)
62 % (178/287) of the human disease genes had homologues in the fly
« Homophila is an ongoing project whose ultimate goal is to
facilitate communication between fly and human researchers. »
‘The fly is an extremely useful model system for studying genes associated with disease in humans.’
Transgenèse : élément transposable P , sytème UAS –GAL4
Expression dirigée d’une protéine humaine in vivo chez la drosophile grâce au système UAS-GAL4:
- Interactions entre protéine humaine et protéine(s) endogène(s)
- Perturbation d’une (de) voie(s) biologiques «normales
- Apparition d’un phénotype
Analyse du phénotype :
Microscopie, Microscopie Electronique, Immunodétection, Transcriptome
Recherche de modificateurs (interaction) Crible génétique pour des mutations second-site (« random ») ou Utilisation résultats du transcriptome (« targeted »)
Analyse de la fonction de gènes humains dans le système modèle drosophile
Utilisation d ’un élément transposable (élément P), pour introduirede façon stable et héritable un transgène dans le génome.
Promoteur minimum transposaseGène X
Origine de réplicationGène de résistance (i.e. AmpR)
Pieds (5’et 3’) de l’élément P
Gène marqueur de la transgénèse: mini w
TRANSGENESE
cDNA X miniwhite Plasmid sequences
Clonage
Generation of transgenic fruit flies by P-element transformation.
The P element, a mobile genetic element, can move from one place in the genome to another. This movement (transposition)
is catalyzed by transposase, which is encoded by the P element; the 3′ and 5′ ends of the P element are recognized by
transposase and are required for transposition to occur. To produce transgenic fruit flies by this method, the functionally different regions of the P element are incorporated into two
different bacterial plasmids. The donor plasmid contains three necessary elements: the transgene (orange); a marker gene
(green) used to indicate flies in which the plasmid DNA is transposed to a recipient chromosome; and both ends of the P element (dark purple) — 3′ P and 5′ P — flanking the other two
genes. It does not contain transposase. In this example, the marker is the dominant w+ allele, which confers red eye color.
The red bracket indicates the segment of the donor plasmid that can transpose into the fly genome. The other plasmid
carries the P element (encoding transposase) with mutations in one end, which prevent it from transposing. The two plasmids are co-injected into blastoderm embryos homozygous for the
recessive w− allele, which confers white eye color. Transposase synthesized from the gene on the P-element plasmid catalyzes
transposition of the donor plasmid DNA into the fly genome. Because transposition occurs only in germ-line cells (not in
somatic cells), all the G0 adults that develop from injected
embryos have white eyes. Mating of these flies with white-eyed flies will yield some G1 red-eyed progeny carrying the transgene
and the marker allele (w+) in all cells.
TRANSGENESE
Responder line:
UAS- GeneX
Activating line
DRIVER-GAL4
UAS-GeneXDRIVER-GAL4
ARNm Gal4
Gal4
Protéine Gal4
Protéine X
Gène X
mRNA X
Système UAS GAL4 : expression conditionnelle et tissu-spécifique
DRIVER-GAL4 : Embryo , Larva, AdultEyeWingMusclesNervous SystemOvary, testis………..
UAS-GENE X (UAS-cDNA)Drosophila
heterologous : human OVEREXPRESSION
UAS-dsRNA RNA interferenceLOSS OF FUNCTION
Sur-expression de gènes homologues à des gènes humains dans les disques imaginaux précusseurs de l’aile
Exemple de gènes humains impliqués dans des maladies neurodégénératives :
préséniline (Maladie d’ALZHEIMER)
Ye & Forte, 1999. J.Cell. Biol. 146:1351
Analyse de la fonction de gènes humains dans le système modèle drosophile
-Expression d’une protéine normale (27 glutamines) et mutante (78 glutamines)
-Phénotype: Oeil rugueux , Défauts de pigmentation, Inclusions nucléaires
N.M Bonini, Parkinsonism and Related Disorders 7 (2000) 171-175)
Sur-expression de gènes homologues à des gènes humains dans les disques imaginaux précusseurs de l’œil
Exemple de gènes humains impliqués dans des maladies neurodégénératives :
ataxine 3 Maladie de Machado-Joseph ; Ataxie spinale-cérébelleuse type 3
- Recherche de modificateur :Phénotype corrigé par la sur-expression de hsp70 (chaperone)
Mais l’existence de l’homologue drosophile du gène humain n’est pas forcément requise….
Exemple: gène -synucléine Maladie de Parkinson(N.M Bonini / Parkinsonism and related disorders 7 (2001) 171-175)
-Expression d’ -synucléine sauvage et mutantes
- Phénotype : défaut de locomotion
Aggravation du phénotype avec l’âge Présence de Corps de Lewy (neurones DOPA)
Sur-expression d’un gène humain impliqué dans une maladie neurodégénérative et ne possédant pas d’homologue drosophile
dans le système nerveux de la mouche
IBDML- Michel Piovant
Study of genes involved in cardiomyopathies :
Mais l’existence de l’homologue drosophile du gène humain n’est pas forcément requise….
Study of genes involved in hypertrophic cardiomyopathies :
gène MYBPC3 cardiac Myosin Binding Protein C
Mais l’existence de l’homologue drosophile du gène humain n’est pas forcément requise….
Myosin/Titin bindingMyosin binding
Actin binding
C0 C1 C2 C3 C4 C5 C6 C7 C8 C9 C10
MyBPC motif and phosphorylation siteIg Fn
Projectin6x
cMyBP-C
No c MyBP-C drosophila homolog
Drosophila model to approach human gene function
AIM:Identify the primary events associated with human
mutated proteins.Remodelling gene expression programs
HOW:Create transgenic flies allowing gene
overexpression or inactivation in a specific tissue:
Indirect Flight Muscles, dorsal vessel
Analyze the global changes in gene expression profiles using DNA microarrays:
Manufacture cDNA Nylon microarrays,
Evaluate transcriptome variations, Provide a biological explanation,
In vivo validation.
Activating lineIFM : SG29.1-GAL4
Responder linesUAS-cMyBPC
1. Create transgenic flies expressing cMyBP-C in Indirect Flight Muscles
WTt
Myosin/TitinMyosin
M6t
M0t
C0 C1 C2 C3 C4 C5 C6 C7 C8 C9
C0 C1 C2 C3 C4 C5 C6 C7 C8 C9
C0 C1 C2 C3 C4
C10
Actin
Stretch activation response Asynchronous muscles
Development and structure highly conserved
Organization of the Sarcomere conserved
Fly vs vertebrate striated muscles
IFM and vertebrate cardiac muscle:
Human protein expression site : Indirect Flight Muscles (IFM)
UAS-cMyBPCSG29.1-GAL4
EFFECTS OF HUMAN PROTEIN EXPRESSION IN DROSOPHILA IFM:
MI IZ Z
Z Z
Z
Transgenic cMyBP-C protein incorporates the Z-I region of the IFM sarcomere.
Kettin
cMyBP-C
merge
cMyBP-C
Reduction of sarcomere length ( -10% )
Fragilization fibers at the level of the Z band
Structural abnormalities of Transgenic IFM vs WT IFM sarcomere
SG29.1 -GAL4 M0t cMyBPC
0
10
20
30
40
50
60
70
80
90
100
1 3 5 7 9 11 13 15 17 19 21 23 25 27 days
% fl
ight
less
4 copies M0t 2 copies M0t 1 copy M0t
6 8 13
Expression of cMyBP-C in IFM leads to an age and dose dependent flightless phenotype
2. Analyze the global changes in gene expression profiles using DNA microarrays
COMPLEX TARGET
0.5 -1µg total RNA
reverse transcription (oligo dT primed)
33P labelling
PROBES
PCR amplification products
6000 cDNA clones (0,15 - 8,0 kb; 42% genome; Drosophila genome : 13 666 predicted genes)
« 3574 Nylon microarray »
Spotting onto Nylon
GMS 427 arrayer 1. Oligo-vector - Reproducibility of microarrays - Oligovector correction:
Intra-membrane comparison
2. Complex Target - WT IFM total RNA - MO cMyBP-C IFM total RNA 3 hybridizations / complex target
Oligo-vector 20 merscDNA
Hybridization:
Manufactured Drosophila cDNA nylon microarrays 3600 genes
M0t cMyBP-C IFM versus non transgenic control IFM8 day old adult flies.
2. Analyze the global changes in gene expression profiles using DNA microarrays
97 genes are transcriptionally deregulated:
DOWN 64 genes (46 known).
UP 33 genes (21 known).
What are the biological processes affected by the
expression of human cMyBPC in the Drosophila flight
muscle?
Example of genes differentially expressed in 8-day-old M0t transgenic IFM versus non transgenic IFM.
Genome « 3574 Filter » DOWN UPMuscle fiber 13 5 5 0Actin Binding 105 29 3 0Tropomyosin binding 3 3 3 0 Chaperones 37 12 4 0
Example of genes differentially expressed in 8-day-old M0 transgenic IFM versus non transgenic IFM.
Lowering Calmodulin expression in transgenic flies expressing cMyBP-C induced an age dependant suppression of the flightless phenotype .
0
10
20
30
40
50
60
70
80
90
100
1 3 5 7 9 11 13 15 17 19 21 23 25days
% f
light
less
2 copies M6t 2 copies M6t; Camk04243/+2 copies M6t; Cam03909/+
3. Genetic evaluation of candidate modifiers : Calmodulinin vivo validation
Interprétation des variations d’expression
Création d’un outil bioinformatique
Fly Genome Explorer
Thien Phong Vu Manh, Michel Piovant and Laurence Röder
Collaboration with DESS traineesMagalie Celton (Evry)Benoît Chauvin (Strasbourg)
http://www.fruitfly.org/
Quick search :tsh teashirt tin tinmanwg winglessace Format with images
Basic search:Format with imagesEx : Body part
all genes