Date post: | 03-Apr-2015 |
Category: |
Documents |
Upload: | bernarde-turpin |
View: | 117 times |
Download: | 10 times |
Introduction à la bioinformatique
Biologie in situ Environnement naturel
Biologie in vivo Organisme entier
Biologie ex vivo Niveau cellulaire
Biologie in vitro Niveau moléculaire
Biologie in silico Bioinformatique
La Bioinformatique: définition
La bioinformatique : définition
Bioinformatique = biologie théorique
Ensemble des concepts et techniques nécessaires pour interpréter:
- l’information génétique (manipulation de séquences)
- l’information structurale (repliement 3D)
C est le décryptage de la bio- information
- Effectuer la synthèse des données disponibles
- Énoncer des hypothèses généralisatrices
- Formuler des prédictions
Le but de la bioinformatique
Bioinformatique = traitement numérique des informations + approche théorique
- Acquisition des données: instrumentation , robotique
- Archivage des données: bases de données
- Consultation des données: interfaces utilisateurs
Domaines de l’informatique traditionnelle utilisés par la génomiqueMais pas impliqués dans la découverte de nouveau concepts en biologie
Ce que n’est pas la bioinformatique
Ce qu’est la bioinformatique
Analyse de l’information biologique
L’information est:
• La séquence (ADN, ARN et Protéine)
• La structure (primaire, secondaire etc.)• La fonction (fonction moléculaire ex: enzyme; composant cellulaire ex:
protéine membranaire; processus biologique ex: transport d’oxygène)
•Les interactions (protéines, voies métaboliques, réseaux de gènes)
Les axes privilégiés de la bioinformatique
• La formalisation de l'information génétique• L'analyse des séquences (biomolécules) et de leur
structure (notamment , structure 3D)• L'interprétation biologique de l'information génétique• L'intégration des données (établissement de cartes et de
réseaux d'interactions géniques, d'interactions protéiques ...)
• La prédiction fonctionnelle
Les méthodes de la bioinformatique• Méthode comparative : comparaison des séquences ou
structures inconnues avec les bases de données (séquences et structures) de gènes et de protéines connues pour établir des rapprochements (similarités , homologies ou identités).
• Méthode statistique : Des logiciels appliquent des analyses statistiques aux données (sur la syntaxe des séquences) pour tenter de dégager et de repérer des règles et des contraintes présentant un caractère systématique, régulier ou général.
• Approche par modélisation Approche probabiliste. Elle consiste à étudier les objets (ex. : séquences, structures, motifs, etc., ...) à travers la construction d'un modèle qui tente d'en extraire les propriétés communes. La relation entre les objets d'étude (et/ou leur reconnaissance) est alors exprimée en référence à ce modèle optimal commun.
La mission du bioinformaticien
•Leur formation première peut être la biologie, les mathématiques ou l'informatique et ils ont suivi une formation complémentaire dans "l'autre domaine". Leur fonction est:
• mettre en œuvre les méthodes et en automatiser le traitement
• nourrir la recherche en biologie des résultats de ces analyses
• réduire les problèmes posés par les biologistes en termes accessibles aux mathématiciens et informaticiens
• participer à l'élaboration de nouvelles méthodes
Biologie: science molle
Biologie = science empirique pas théoriquedans le monde du vivant : • rien n'est totalement prévisible • rien n'est totalement reproductible
Ce qui s'est produit à l'instant t ne se produira pas nécessairement à l'instant t+1.
• rien n'est constantLe temps fait évoluer l'objet vivant dans sa forme et dans ses fonctions de manière irréversible.
• l'identité totale de deux objets biologiques n'existe pasDeux individus à l'intérieur d'une même espèce ne sont jamais identiques, pas même à l'intérieur d'un couple de jumeaux.
Biologie : étude du dynamique
• Même si elle intègre la notion d'objet (une cellule, un individu, une population), elle repose fondamentalement sur l'étude des liens, des interactions et des régulations dynamiques qui organisent les objets entre eux dans le temps et dans l'espace, à l'intérieur d'un système d'un niveau de complexité supérieur
Révolutions dans la biologie• Les lois de Mendel (1866): Mendel est un des pionniers de la
bioinformatique : un des premiers à construire une théorie biologique nouvelle à partir d'une analyse statistique.
• La mise en évidence des chromosomes comme support
cellulaire de l' hérédité et de l' information génétique par Morgan (1913).
• Les découvertes de la structure en double hélice de l' ADN par James Watson et Francis Crick (1953), puis du mécanisme de la régulation génétique impliqué dans le dogme central de la biologie moléculaire, énoncé initialement par Crick et révélé par Jacques Monod, François Jacob et André Wolf (1965).
La séquence : élément fondateur du puzzle du vivant
• La séquence , linéaire, chaîne de caractères basée sur un alphabet de quatre caractères (les nucléotides) dont la combinaison donne sa spécificité (espèce, gène..).
• La séquence est stable dans l'espace et présente des propriétés d' hybridation et de dénaturation à haute température qui en font un objet biologique expérimental de qualité : elle peut être extraite, manipulée et synthétisée in vitro.
• La séquence est relativement stable dans le temps. Les changements qui l'affectent (mutations , délétions , substitutions) peuvent être utilisés comme une mesure quantitative de l'évolution.
• Elément fondateur de la biodiversité et de la complexité du vivant : l' ADN est le
support biologique commun à presque tous les êtres vivants
• Le code génétique , avec lequel les protéines seront codées à partir de la séquence nucléique, est (à quelques codons près ...), universel.
Les biotechnologies
Domaine d’application privilégié de la bioinformatique• Pour la médecine & santé publique:
– Diagnostique– Pharmacogénomique (pharmacogenetique&toxicogenétique)– Thérapie génique– Vaccins– Empreintes génétiques
• Pour l’agroalimentaire– Résistance aux pesticides, aux pathogènes, aux insectes– Tolérance au stress environnementaux– Rendements et qualité
• Pour l’environnement– Lutte contre les pollutions chimiques ou biologiques (traitements de l'eau, des sols,
des déchets)– Nouvelles sources d'énergie– Préservation de la biodiversité
Notions essentielles de biologie
Schéma d’une cellule eucaryote
Origines évolutives
Les quatre familles de molécules
Composition d’une cellule bactérienne
Assemblages de molécules
Exemple du ribosome
Quel est le support de l’hérédité?
Structure de l’ADN
Liaisons hydrogènes de l ‘ADN
Liaison hydrogènes de l’ADN
Modèle moléculaire d’ADN
Gènes?! Génome ?!?!?!
Génome humain
Constitution du génome
Organisation du génome
Qu’est ce qu’un gène?
• Gène protéique: code pour une protéine
• Gène régulateur: participe aux mécanismes de maintien du génome
• Géne non traduits: produit un ARN fonctionnel
Structure d’un gène protéique eucaryote
Zone Régulatrice = Promoteur
Zone transcrite
Site d’initiation de la transcription
TATA
AMPLIFICATEUR
PROMOTEURBASAL
100-200 pdb 100-200 pdb 40 pdb
0-20 kb
Structure d’un promoteur
PROMOTEUR DISTAL
Région régulatrice Région Codante
Structure de la partie codante
AMPLIFICATEUR
100-200 pdb
Région régulatriceRégion codante
Exon Exon Exon
Intron Intron
Dogme central de la biologie moléculaire
ADN ARN ARNm protéine
Transcription Maturation Traduction
Matrice ADN ARN ARN
Effecteur ARN pol Très variées Ribosome
Produit ARN ARNm Protéine
L’expression d’un gène
Eucaryotes
Procaryotes
Expression d’un gène eucaryote
exon1 exon2 exon3intron2intron1
exon1 exon2 exon3intron2intron15’UTR 3’UTR
3’UTRexon1 exon2 exon3
5’UTR
Init
iati
on d
e la
tran
scri
ptio
n
Elongation de la transcription
Maturation du transcrit primaire
Polyadénylation
Structure de l’ARN intermédiaire
Epissage du messager
Traduction
Code génétique
Code génétique bis
L’ARN de transfert
Initiation de la traduction
Incorporation d’un acide aminé
Translocation du ribosome
Elongation de la traduction
Terminaison de la traduction
Polyribosome
Structure de l’ARNm
Stabilité du messager
Code dégénéré
Contrôle de l’expression d’un gène
ADNARN primaire
ARNm ARNm ProtéineProtéineinactive
Noyau Cytoplasme
Contrôle de la transcription
Contrôle de lamaturation
Contrôle de latraduction
Contrôle de l’activité
Pore nucléaire
Enveloppe nucléaire
Comment fonctionne le génome
Quelle est l’organisation du génome?
Comment est lue l’information contenue dans
le génome?
Mise en place du programme génétique
Organisation des gènes dans les organismes
Paradoxe !!!!
Complexité du génome Humain
• Taille 3 200 Mb pour 30 000 gènes
• Nature répétitive– Séquences répétées localement
• ADN satellite
– Séquences répétées dispersées• SINES (Short Interspersed Repeated Sequences)
– Ex: ALU, 300 pb tous les 6000 nucleotides• LINES (Long Interspersed Repeated Sequenes)
– Ex: L1, 5 kb, 100 000 copies dans génome
• Rôle de l’ADN non génique ???– Régulation globale de l’expression des gènes– Nucléosquelette
Epissages alternatifs
Initiation de la transcription
Répresseur
Activateurs
FT
FT
FT
Promoteur basal
Facteurs d’initiation
RNA Pol II Région codante
Coactivateurs
Régulation du niveau d’expression des gènes
Interaction protéine -ADN
Interaction protéine - ADN
Localisation des éléments régulateurs