Apport de la Génomique fonctionnelle chez la Drosophile Etude de gènes humains impliqués dans des...

Post on 03-Apr-2015

108 views 3 download

Tags:

transcript

Apport de la Génomique fonctionnelle chez la Drosophile

Etude de gènes humains impliqués dans des maladies.

What is Functional Genomics?

Functional genomics as a means of assessing phenotype differs from more classical approaches primarily with respect to the scale and automation of biological investigations. A classical investigation of gene expression might examine how the expression of a single gene varies with the development of an organism in vivo. Modern functional genomics approaches, however, would examine how 1,000 to 10,000 genes are expressed as a function of development. (UCDavis Genome Center)

Functional genomics refers to the development and application of global (genome-wide or system-wide) experimental approaches to assess gene function by making use of the information and reagents provided by structural genomics. It is characterized by high-throughput or large-scale experimental methodologies combined with statistical or computational analysis of the results (Hieter and Boguski 1997)

Completion of genome sequence projects marks the start of genome-based biology

How can genome information be exploited ?

Genome data

FunctionWhat genes do

Understanding expression and function in development

and differentiation

Understanding expression and function in disease

Genes

Genome structure

Biochemical

Biological

How genes worktogether

How genes canbe used Diagnostics Therapeutics

Genome based approaches to function - Functional Genomics

*DNA Microarrays - genome wide expression analysis of genes - Transcriptome

*Proteomics - defining proteins, their functions and interactions - Proteome

*Gene inactivation - defining function through gene silencing

*Phenotype analysis - defining function through gene mutagenesis - Phenome

Le système biologique

Drosophila melanogaster

La mouche « a ventre noir » « qui aime la rosée »

Les avantages du système:

- Cycle de vie court

- Développement externe

- Création et Entretien des stocks

peu onéreux

- Génome séquencé

- Séquence du génome de 6

autres espèces :Agencourt Bioscience project (2004) :

D. ananassae, D. erecta, D.grimshawi,

D. mojavensis and D. virilis.

TIGR (2004) : D. willistoni

- Génétiquement manipulable

- Génétiquement modifiable

Le génome de Drosophila melanogaster

4 Chromosomes

180Mb dont 120Mb d’ euchromatine

  LevureS. cerevisiae

Nématode C.elegans

Drosophile Homme

taille physique (Mb) 13 100 180 3.000

nombre de gènes 6.200 19.100 13.600 ~30.000

taille des gènes (kb) 1,4 2,7 3 28

fréquence des gènes (par kb) 2 4,8 / 6 9 ~100

teneur en [G+C] 38% 36% nd 41%

fraction codante 68% 27% 13% 1,4%

nombre moyen d'exons par gène

1,04 5,5 4,6 8,7

taille moyenne des exons (pb) 1.450 218 150 145

taille moyenne des introns (pb) 500 267 487 ~3.300

Caractéristiques des génomes de levure, nématode, drosophile et de l'homme :

Génomes comparés

Mise au point de programmes automatiques : • Approche conceptuelle basée sur des études linguistiques des séquences d’ADN

• On connait (partiellement) la syntaxe et la grammaire:utilisation de modèles de Markov cachés qui, après apprentissage sur un organisme donné, vont différencier les régions géniques des régions intergéniques

Programmes adaptés aux génomes procaryotes et donnant de bon résultats pour les génomes eucaryotes possédant très peu

d’introns (Levure)

GeneMark, GLIMMER

Programmes adaptés aux génomes eucaryotes présentant une forte proportion d’introns

GeneMark.hmm, HMMgene, Eugene, GENIE, etc...

Utilisés en conjonction avec des algorithmes neuronaux déterminant

le départ de transcription (qui n’est pas toujours un ATG) Netstart

les sites d’épissage Netgene2, SpliceNet, etc...

Annotation du génome : Identifier tous les gènes dans un génome

Efficacité de ces programmes automatiques :

excellente chez les procaryotes (rendement de 98-99%)

chez les eucaryotes complexes : Les règles régissant la structure et l’organisation des gènes

eucaryotes sont plus complexe!

• Mauvaise identification des gènes annotés :

gènes interprétés comme deux gènes voisins

deux gènes voisins interprétés comme un seul gène

• Une étude et exhaustive de réannotation manuelle du génome de la drosophile révèle aussi une mauvaise identification des gènes (Janvier

2003)

Annotation du génome

Janvier 2003 : réannotation manuelle du génome de la drosophile………..

Nombre de gènes: quasi inchangé : 13601 (en 2000)-> 13676 (en 2003)

727 gènes trouvés par l’ancien programme GENIE erronés ont disparus802 gènes trouvés par nouveau progamme GenScan ajoutés

Structure de 85% des gènes modifiée:

1531 gènes initialement indépendants sont fusionnés en 602 nouveaux gènes

322 gènes morcelès en 675 nouveaux gènes

93 gènes réinterprétés complètement avec des mélanges de fusion et morcellement

Annotation du génome

Estimation du Nombre de protéines codées par un gène ? Promoteurs Alternatifs:

Nématode : 4 gènes codent 4 myosines différentesDrosophile : 1 seul gène code les 7 myosines connues

Promoteur alternatif 13% des gènes (estimation Janvier 2003)

Epissage Alternatif détermine une très grande partie de la diversité du protéome

Drosophile : DSCAM (connection neuronale) / 1 orthologue chez l’homme95 exons alternatifs 38016 protéines potentielles

48 / 50 clones cDNA identifiés sont différents

Homme: 85% du protéome humain est déterminé par l’épissage alternatifChrom 19 : 544 genes 1859 mRNAs en moy. 3.2 variant/gene

Nématode: 9516 genes 12816 mRNAs en moy 1.34 variant /gene

Polyadénylation alternative 6% des gènes de Drosophile (Janvier 2003)

La diversité du protéome est le reflet la complexité d’un organisme.

Le nombre total de gènes identifiés ne reflète pas le niveau de complexité des organismes étudiés

….. on ne sait pas estimer l’état d’expression d’un gène :

Information essentielle chez les organismes complexes où l’évolution se fait par la modulation de l’expression plus que par l'augmentation du nombre de gènes

Les jeux de protéines synthétisées vont être très différents d'un tissu à l'autre d’un instant t à un autre.

Le nombre total de gènes identifiés ne reflète pas le niveau de complexité des organismes étudiés

Comparaison des génomes eucaryotes séquencés

Core proteome = nombre de familles de protéines distinctes codées par le génome d’un organisme donné. Les gènes paralogues (gènes équivalents dans une même espèce) sont

comptés comme 1 Unité.

Core proteome de la Drosophile est seulement 2 fois plus grand que celui de la Levure.

Core proteome de la Drosophile et du Nématode de taille similaire malgré de grandes différences en terme de développement et morphologie.

Le Core proteome est constitué de gènes jouant un rôle essentiel dans tous les aspects du fonctionnement cellulaire.

Il semble que la majorité sinon tous les gènes du Core Protéome humain existent chez la drosophile.

Human

35000

10000

The Biological Core or Core Proteome

Comparaison protéomes prédits :

Homme , Drosophile, Nématode et Levure

Homme 3129Fly 1445Worm 1503Yeast 1441

Fonctions cellulaires de base :Métabolisme, traduction, Réplication –réparation de l’ADN

Nombre de groupes de protéines :

-1308 groupes de protéines contenant au moins 1 orthologue prédit dans chaque organisme (plusieurs groupes contiennent des paralogues)

- 504/1308 groupes de protéines contenant 1 orthologue prédit dans chaque organisme et 0 paralogues:

Fonctions Clésn’ayant pas subit de

duplicationni d’élaboration dans les

différents lignages

Ex : enzyme chaine respiratoire

biosynthèse nucléotides

Levure (unicellulaire):

0 dans cell communication0 dans défense immunity

Classement par catégories fonctionnelles

Comparaison protéomes prédits : Drosophile, Nématode et Levure

Core protéome : Drosophile 8065 , Nématode: 9453 , Levure 4383

Comparaison par alignement de séquences:

BLAST P et alignement d’au moins 80% de la longueur de la protéine de drosophile avec une autre séquence >>>sous estimation !!!

-20% des protéines de drosophile ont un orthologue putatif chez le nématode et la levure

Protéines impliquées dans des processus communs aux eucaryotes:réplication, transcription, traduction, division cellulaire…

- 35% des gènes de drosophile ont un orthologue putatif chez le nématode

-Développement des organismes pluricellulaires-Interactions cellule- cellule / cellule substrat -Protéines à homéodomaines, -Molécules d ’adhérence cellulaire…...

- certaines familles de protéines sont présentes seulement chez la drosophile-Protéines impliquées dans la réponse immunitaire

système immunitaire inné primitif similaire à celui des vertébrés -Protéines transmembranaires de fonctions inconnues-Protéines spécifiques (ex : cuticule)

Génome humain : 3200 Mb, ~30 000 gènes prédits2 duplications successives d ’un génome élémentaire non redondant (drosophile)

Conservation au niveau moléculaire des produits de gènes entre Drosophile et Homme

67% homologie avec protéome de drosophile

des produits de gènes entre Drosophile et nematode et levure 43% homologie avec protéome du nématode et de la levure46% homologie avec protéome de la levure

Gènes absents chez la drosophile/ homme: reflète différences physiologiques entre homme et drosophile:

hémoglobines (thalassémies)

réarrangement des gènes d’immunoglobuline (système immunitaire acquis)

Comparaison protéomes prédits :Homme , Drosophile, Nématode et Levure

The Berkeley Drosophila Genome Project (BDGP):

> 60% (177/289) de gènes humains impliqués dans des pathologies humaines ont des homologues évidents chez la drosophile.

‘The fly is an extremely useful model system for studying genes associated with disease in humans.’

‘The fly is an extremely useful model system for studying genes associated with disease in humans.’

289 human proteins used as queries to search a database consisting of the sum total of gene products (38,860) found in the complete genomes

of fly, worm, and yeast.

BLASTP searchesTBLASTN searches : control for potential frameshift errors in the Drosophila genome

sequence. Only two cases were manually corrected.

Results are scaled according to various levels of statistical significance,

Refelect the level of confidence in either evolutionary homology or functional similarity.

« + » : likely functional equivalent of the human protein (biological evidence)

« - » unable to identify a likely functional equivalent of the human protein.

< < <

no or weak sequence similarityE values >1 X 10–6

highest degree of sequence conservation.E values < 1 x 10-100

BDGP

BDGP

E. Bier. University of California San Diego :

714 Human genes from OMIM (Online Mendelian Inheritance in Man)

versus Drosophila genome

BLASTP , E value of 10-10

~76%(548/714) of the human disease genes had homologues in the fly

E. Fortini .University of Pennsylvania School of Medicine :

287 other Human genes from OMIM (Online Mendelian Inheritance in Man)

62 % (178/287) of the human disease genes had homologues in the fly

« Homophila is an ongoing project whose ultimate goal is to

facilitate communication between fly and human researchers. »

‘The fly is an extremely useful model system for studying genes associated with disease in humans.’

Transgenèse : élément transposable P , sytème UAS –GAL4

Expression dirigée d’une protéine humaine in vivo chez la drosophile grâce au système UAS-GAL4:

- Interactions entre protéine humaine et protéine(s) endogène(s)

- Perturbation d’une (de) voie(s) biologiques «normales

- Apparition d’un phénotype

Analyse du phénotype :

Microscopie, Microscopie Electronique, Immunodétection, Transcriptome

Recherche de modificateurs (interaction) Crible génétique pour des mutations second-site (« random ») ou Utilisation résultats du transcriptome (« targeted »)

Analyse de la fonction de gènes humains dans le système modèle drosophile

Utilisation d ’un élément transposable (élément P), pour introduirede façon stable et héritable un transgène dans le génome.

Promoteur minimum transposaseGène X

Origine de réplicationGène de résistance (i.e. AmpR)

Pieds (5’et 3’) de l’élément P

Gène marqueur de la transgénèse: mini w

TRANSGENESE

cDNA X miniwhite Plasmid sequences

Clonage

Generation of transgenic fruit flies by P-element transformation.

The P element, a mobile genetic element, can move from one place in the genome to another. This movement (transposition)

is catalyzed by transposase, which is encoded by the P element; the 3′ and 5′ ends of the P element are recognized by

transposase and are required for transposition to occur. To produce transgenic fruit flies by this method, the functionally different regions of the P element are incorporated into two

different bacterial plasmids. The donor plasmid contains three necessary elements: the transgene (orange); a marker gene

(green) used to indicate flies in which the plasmid DNA is transposed to a recipient chromosome; and both ends of the P element (dark purple) — 3′ P and 5′ P — flanking the other two

genes. It does not contain transposase. In this example, the marker is the dominant w+ allele, which confers red eye color.

The red bracket indicates the segment of the donor plasmid that can transpose into the fly genome. The other plasmid

carries the P element (encoding transposase) with mutations in one end, which prevent it from transposing. The two plasmids are co-injected into blastoderm embryos homozygous for the

recessive w− allele, which confers white eye color. Transposase synthesized from the gene on the P-element plasmid catalyzes

transposition of the donor plasmid DNA into the fly genome. Because transposition occurs only in germ-line cells (not in

somatic cells), all the G0 adults that develop from injected

embryos have white eyes. Mating of these flies with white-eyed flies will yield some G1 red-eyed progeny carrying the transgene

and the marker allele (w+) in all cells.

TRANSGENESE

Responder line:

UAS- GeneX

Activating line

DRIVER-GAL4

UAS-GeneXDRIVER-GAL4

ARNm Gal4

Gal4

Protéine Gal4

Protéine X

Gène X

mRNA X

Système UAS GAL4 : expression conditionnelle et tissu-spécifique

DRIVER-GAL4 : Embryo , Larva, AdultEyeWingMusclesNervous SystemOvary, testis………..

UAS-GENE X (UAS-cDNA)Drosophila

heterologous : human OVEREXPRESSION

UAS-dsRNA RNA interferenceLOSS OF FUNCTION

Sur-expression de gènes homologues à des gènes humains dans les disques imaginaux précusseurs de l’aile

Exemple de gènes humains impliqués dans des maladies neurodégénératives :

préséniline (Maladie d’ALZHEIMER)

Ye & Forte, 1999. J.Cell. Biol. 146:1351

Analyse de la fonction de gènes humains dans le système modèle drosophile

-Expression d’une protéine normale (27 glutamines) et mutante (78 glutamines)

-Phénotype: Oeil rugueux , Défauts de pigmentation, Inclusions nucléaires

N.M Bonini, Parkinsonism and Related Disorders 7 (2000) 171-175)

Sur-expression de gènes homologues à des gènes humains dans les disques imaginaux précusseurs de l’œil

Exemple de gènes humains impliqués dans des maladies neurodégénératives :

ataxine 3 Maladie de Machado-Joseph ; Ataxie spinale-cérébelleuse type 3

- Recherche de modificateur :Phénotype corrigé par la sur-expression de hsp70 (chaperone)

Mais l’existence de l’homologue drosophile du gène humain n’est pas forcément requise….

Exemple: gène -synucléine Maladie de Parkinson(N.M Bonini / Parkinsonism and related disorders 7 (2001) 171-175)

-Expression d’ -synucléine sauvage et mutantes

- Phénotype : défaut de locomotion

Aggravation du phénotype avec l’âge Présence de Corps de Lewy (neurones DOPA)

Sur-expression d’un gène humain impliqué dans une maladie neurodégénérative et ne possédant pas d’homologue drosophile

dans le système nerveux de la mouche

IBDML- Michel Piovant

Study of genes involved in cardiomyopathies :

Mais l’existence de l’homologue drosophile du gène humain n’est pas forcément requise….

Study of genes involved in hypertrophic cardiomyopathies :

gène MYBPC3 cardiac Myosin Binding Protein C

Mais l’existence de l’homologue drosophile du gène humain n’est pas forcément requise….

Myosin/Titin bindingMyosin binding

Actin binding

C0 C1 C2 C3 C4 C5 C6 C7 C8 C9 C10

MyBPC motif and phosphorylation siteIg Fn

Projectin6x

cMyBP-C

No c MyBP-C drosophila homolog

Drosophila model to approach human gene function

AIM:Identify the primary events associated with human

mutated proteins.Remodelling gene expression programs

HOW:Create transgenic flies allowing gene

overexpression or inactivation in a specific tissue:

Indirect Flight Muscles, dorsal vessel

Analyze the global changes in gene expression profiles using DNA microarrays:

Manufacture cDNA Nylon microarrays,

Evaluate transcriptome variations, Provide a biological explanation,

In vivo validation.

Activating lineIFM : SG29.1-GAL4

Responder linesUAS-cMyBPC

1. Create transgenic flies expressing cMyBP-C in Indirect Flight Muscles

WTt

Myosin/TitinMyosin

M6t

M0t

C0 C1 C2 C3 C4 C5 C6 C7 C8 C9

C0 C1 C2 C3 C4 C5 C6 C7 C8 C9

C0 C1 C2 C3 C4

C10

Actin

Stretch activation response Asynchronous muscles

Development and structure highly conserved

Organization of the Sarcomere conserved

Fly vs vertebrate striated muscles

IFM and vertebrate cardiac muscle:

Human protein expression site : Indirect Flight Muscles (IFM)

UAS-cMyBPCSG29.1-GAL4

EFFECTS OF HUMAN PROTEIN EXPRESSION IN DROSOPHILA IFM:

MI IZ Z

Z Z

Z

Transgenic cMyBP-C protein incorporates the Z-I region of the IFM sarcomere.

Kettin

cMyBP-C

merge

cMyBP-C

Reduction of sarcomere length ( -10% )

Fragilization fibers at the level of the Z band

Structural abnormalities of Transgenic IFM vs WT IFM sarcomere

SG29.1 -GAL4 M0t cMyBPC

0

10

20

30

40

50

60

70

80

90

100

1 3 5 7 9 11 13 15 17 19 21 23 25 27 days

% fl

ight

less

4 copies M0t 2 copies M0t 1 copy M0t

6 8 13

Expression of cMyBP-C in IFM leads to an age and dose dependent flightless phenotype

2. Analyze the global changes in gene expression profiles using DNA microarrays

COMPLEX TARGET

0.5 -1µg total RNA

reverse transcription (oligo dT primed)

33P labelling

PROBES

PCR amplification products

6000 cDNA clones (0,15 - 8,0 kb; 42% genome; Drosophila genome : 13 666 predicted genes)

« 3574 Nylon microarray »

Spotting onto Nylon

GMS 427 arrayer 1. Oligo-vector - Reproducibility of microarrays - Oligovector correction:

Intra-membrane comparison

2. Complex Target - WT IFM total RNA - MO cMyBP-C IFM total RNA 3 hybridizations / complex target

Oligo-vector 20 merscDNA

Hybridization:

Manufactured Drosophila cDNA nylon microarrays 3600 genes

M0t cMyBP-C IFM versus non transgenic control IFM8 day old adult flies.

2. Analyze the global changes in gene expression profiles using DNA microarrays

97 genes are transcriptionally deregulated:

DOWN 64 genes (46 known).

UP 33 genes (21 known).

What are the biological processes affected by the

expression of human cMyBPC in the Drosophila flight

muscle?

Example of genes differentially expressed in 8-day-old M0t transgenic IFM versus non transgenic IFM.

Genome « 3574 Filter » DOWN UPMuscle fiber 13 5 5 0Actin Binding 105 29 3 0Tropomyosin binding 3 3 3 0 Chaperones 37 12 4 0

Example of genes differentially expressed in 8-day-old M0 transgenic IFM versus non transgenic IFM.

Lowering Calmodulin expression in transgenic flies expressing cMyBP-C induced an age dependant suppression of the flightless phenotype .

0

10

20

30

40

50

60

70

80

90

100

1 3 5 7 9 11 13 15 17 19 21 23 25days

% f

light

less

2 copies M6t 2 copies M6t; Camk04243/+2 copies M6t; Cam03909/+

3. Genetic evaluation of candidate modifiers : Calmodulinin vivo validation

Interprétation des variations d’expression

Création d’un outil bioinformatique

Fly Genome Explorer

Thien Phong Vu Manh, Michel Piovant and Laurence Röder

Collaboration with DESS traineesMagalie Celton (Evry)Benoît Chauvin (Strasbourg)

http://www.fruitfly.org/

Quick search :tsh teashirt tin tinmanwg winglessace Format with images

Basic search:Format with imagesEx : Body part

all genes