Date post: | 01-May-2015 |
Category: |
Documents |
Upload: | drina-valeri |
View: | 215 times |
Download: | 0 times |
Adriana Maggi
DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHECORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO
AA 2011/2012Lezione 6
Bioinformatica nel processo di drug discovery
Bioinformatics in the drug discovery process
Alessandro VillaCenter of Excellence on Neurodegenerative Diseases
Department of Pharmacological SciencesUniversity of Milan
Recently invented methods allow researchers to analyze the expression of thousands of genes simultaneously using DNA microarrays. Coupling these methods with the results from genome sequencing projects allows researchers to analyze the complete transcriptional program of an organism during specific physiological responses or developmental processes.
Genome-wide studies
• I chip a DNA sono costituiti da un array di microscopiche aree, ciascuna contenente 107 sonde identiche di 20-50 pb, covalentemente fissate al supporto (vetro, plastica, silicio o beads di polistirene)
• Sfruttano una tecnica di ibridazione inversa: le probe sono fissate al supporto (in una posizione nota), mentre i frammenti di DNA da analizzare (target) sono marcati con biotina o con marker fluorescenti e ibridizzati alle sonde
• Il DNA target, legato alla sonda, può essere identificato utilizzando uno scanner, capace di rivelare il segnale emesso
Cosa sono i chip a DNA
• I chip a DNA sono costituiti da un array di microscopiche aree, ciascuna contenente 107 sonde identiche di 20-50 pb, covalentemente fissate al supporto (vetro, plastica, silicio o beads di polistirene)
• Sfruttano una tecnica di ibridazione inversa: le probe sono fissate al supporto (in una posizione nota), mentre i frammenti di DNA da analizzare (target) sono marcati con biotina o con marker fluorescenti e ibridizzati alle sonde
• Il DNA target, legato alla sonda, può essere identificato utilizzando uno scanner, capace di rivelare il segnale emesso
Cosa sono i chip a DNA
• I chip a DNA sono costituiti da un array di microscopiche aree, ciascuna contenente 107 sonde identiche di 20-50 pb, covalentemente fissate al supporto (vetro, plastica, silicio o beads di polistirene)
• Sfruttano una tecnica di ibridazione inversa: le probe sono fissate al supporto (in una posizione nota), mentre i frammenti di DNA da analizzare (target) sono marcati con biotina o con marker fluorescenti e ibridizzati alle sonde
• Il DNA target, legato alla sonda, può essere identificato utilizzando uno scanner, capace di rivelare il segnale emesso
Cosa sono i chip a DNA
• FOTOLITOGRAFIA (in situ):Fasci di luce e maschere fotolitografiche sono utilizzati per produrre le sonde direttamente sul supporto;
• SPOTTED MICROARRAYS:Le sonde sono sintetizzate prima della loro deposizione sull’array, e solo successivamente “spottati” sul supporto.
Come si producono
Microarray e Tiling array
• MICROARRAY DI ESPRESSIONE: le sonde utilizzate rappresentano porzioni di trascritti noti
Gene 1 Gene 2
• TILING ARRAYS: coprono l’intero genoma o porzioni definite di genoma (tutti i promotori, solo alcuni cromosomi…)
Gene 1 Gene 2
Quali utilizzi hanno
• MICROARRAY DI ESPRESSIONE: utilizzati quasi esclusivamente per l’analisi dei livelli di espressione di trascritti noti, confrontata in diverse condizioni (es. controllo-trattamento, cellula sana-cellula tumorale etc.)
Gene 1 Gene 2
• TILING ARRAYS: Utilizzati per• analisi unbiased dell’espressione genica (geni non noti e miRNA);• ChIP-on-chip (chromatin immunoprecipitation on a chip)• Array CGH (comparative genomic hybridization): tecnica usata in
diagnostica per l’individuazione di copy number variations e anomalie del DNA
Gene 1 Gene 2
Applicazioni
Tiling Arrays
Analisi delle regioni di binding sulla cromatina di ERalfa nelle due diverse condizioni
Dove si localizza ERalfa?La sua localizzazione è influenzata dal trattamento / condizione fisiologica/
patologia?
Microarray di espressione
Analisi delle differenze di espressione genica nelle due diverse condizioni
Il trattamento/ diversa condizione fisiologica / patologia influenzano
l’espressione genica? Quali sono i geni differenzialmente espressi?
Workflow
Output
Analisi dei Dati
Risultati
Microarray
Workflow
Congelamento
Estrazione RNA
RetrotrascrizioneMic
roarr
ays
Marcatura Ibridazione
GeneChip Mouse Genome 430 2.0 Array – Affymetrix39.000 transcripts1 expression array
Output
Quasi 40.000 trascritti conosciuti
Intensità CEL fileNormalizzazione RMA file
• MeV: MultiExperiment Viewer (MeV)da TM4 microarray software suite http://www.tm4.org/ free
• Rosetta Resolver System: http://www.rosettabio.com/
• Genomatix: http://www.genomatix.de
•dChip: http://biosun1.harvard.edu/complab/dchip/
Output – software di analisi dati
Lista di geni differenzialmente espressi nelle due condizioni (veh-trattato; etc.) in un file
Analisi dei dati
Come otteniamo informazioni da questa lista di geni?
Analizzandoli uno ad uno…. … o utilizzando specifici software che consentono di ottenere in
modo semplice informazioni sulla funzione dei geni identificati
ONTOLOGIES
• GENE ONTOLOGY: può essere considerato una specie di enciclopedia che raccoglie tutte le informazioni disponibili sui geni noti, attraverso delle definizioni e delle parole chiave condivise.
• E’ suddiviso in 3 categorie:• Processi biologici • Funzioni molecolari • Componenti cellulari
Un prodotto genico ha una o più funzioni cellulari, può essere coinvolto in diversi processi biologici e infine potrebbe essere associato a diversi compartimenti cellulari.
http://www.geneontology.org/
http://david.abcc.ncifcrf.gov/home.jsp
Analisi dei dati
Phosphomevalonate kinase
Workflow e messa a punto
Output
Analisi dei dati
Risultati
ChiPOnchip
Workflow e messa a punto
Sonicazione
Ch
IP-c
hip
Crosslinking
500
100
Immunopre-cipitazione DNA
mRNA
Binding RegionsDNA
mRNA
Binding Regions
Y
Crosslinking inversoPurificazione DNA
LM-AmplificationFrammentazione
Marcatura Ibridazione
Output
Cutoff
1. Rilevazione del segnale relativo alle sequenze Chipped, e posizionamento sul DNA
2. Definizione dei picchi relativi alle regioni di binding tramite specifico algoritmo
3. Normalizzazione e analisi dei picchi che superano il limite di cutoff
Output
Chr 10
23476246 23477332
BED file
• UCSC Genome Browser
• INTEGRATED GENOME BROWSER (IGB)
Bed Files visualization
Add custom track
• CISTROME ANALYSIS PIPELINE MODULE
Bed Files analysis
Ingenuity Pathway Analysis Software
http://www.ingenuity.com/index.html