bioinfo-1 Nei

Post on 27-Jun-2015

151 views 6 download

Tags:

transcript

Pengantar Bioinformatika

Sejarah singkat

Tahun 1960-an molecular evolution

J Theoretical Biology 1965Molecules as documents of evolutionary biologyZukerkandl E, Pauling L

Atlas of Protein Sequences (1965)Margareth Dayhoff

Tahun 1970-an computational biology

Needleman-Wunsch global alignment

Tahun 1990-an bioinformatics

NCBI (NLM/NIH) (1988)

Human Genome Project (1990)

dst

Bioinformatika / Biologi (Molekuler) Komputasi

Biologi molekuler

• Data• Problema• Hypothesis• Teori

• Interpretasi• Verifikasi• Biological “insight”

Computational Sciencematematika,statistik,ilkom, dll

Teknologi Informasi

• Metode• Algoritma

• Tools / software• Database• Konektivitas/Internet

• Analisis• Modeling• Simulasi• Visualisasi

+ +

Bioinformatics ≠ Medical Informatics

• Bioinformatika penerapan ilmu komputasi & informatika untukmemahami mekanisme/cara kerja mahluk hidup pada tingkatmolekulerContoh:– mencari gen yang berperan dalam suatu penyakit– mencari protein penyebab patogenesis– mencari dan mendesain obat

• Medical Informatics penerapan teknologi informatika dalambidang kedokteranContoh:– penggunaan IT dalam manajemen data pasien / klinis– diagnosis penyakit (database penyakit, sistem pakar)– Medical imaging (NMR/MRI, dsb)

Organisasi DNA

Central Dogma of Molecular Biology

DNA (blueprint)

RNA (coding sequences)

Protein (fungsional machinery)

Phenotype / Morphology (1)

Phenotype / Morphology

Gen / Protein Ekspresi Protein

building block regulasi / aransemen

• Variasi sekuen DNA• Imprinting/Epigenetic

Phenotype / Morphology (2)

• Variasi sekuen DNA dan Epigenetics antara lain dapatmengakibatkan:– Perbedaan phenotype / morphology

• Manusia: tinggi / rendah, etc• Mouse: warna• Tanaman: berbuah banyak / manis

– Penyakit bawaan / genetik– Perbedaan respon imun terhadap patogen (host-pathogen interaction)– Perbedaan respon terhadap obat– Perbedaan susceptibility terhadap penyakit kompleks / degeneratif:

• Alzheimer• Kanker• Jantung• dsb

Contoh Aktifitas Bioinformatika

• Pengumpulan informasi– Literatur– Anotasi gen:

sekuen, variasi DNA, lokasi, ekspresi, modifikasi, struktur, dll– Data lain: data klinis, dll

• Akusisi data– Sekuensing DNA– Ekspresi gen (realtime RT-PCR)

• Analisa– Mendapatkan informasi/pengetahuan (hipotesis) baru– Mendapatkan prediksi/trend dari data

• Interpretasi secara biologi

Aktifitas Bioinformatika (2)

Aplikasi Central Dogma dalam Akusisi Data

Sekuen DNA (sequencing)

Regulasi gen(microarray,realtime/quantitative RT-PCR)

+Sekuen RNA (EST, cDNA sequencing)

Sekuen protein (AA sequencing, MS)

+ Interaksi antar/inter molekulStruktur protein (kristalografi, NMR)

Fungsi protein (assay, transgenik)

Knowledge Discovery

Public databases “wet” experiment

Data acquisition

Data management | data manipulation

Visualization | modeling |analysis

Result interpretation

New knowledge | prediction

publication “wet” experimentproduct

Major goal: To understand how life works

Analisa Bioinformatika

• Analisa sekuen:– Mapping situs restriksi– Prediksi daerah exon-intron– Prediksi daerah antigen– Desain primer PCR & probe– Prediksi fungsi– Identifikasi gen

• Analisa struktur– Struktur sekunder (alpha-helix, beta-sheet)– Struktur tertier (3-Dimensi)

• Analisa interaksi– Interaksi antar gen– Interaksi antar protein/makromolekul

Domain Permasalahan

Studi Bioinformatika

Genom & Proteom

Struktur MolekulRegulasi dan NetworkGen

Lainnya

• sequence alignment• pencarian sekuen• DNA sequencing• identifikasi gen/protein• pencarian domain/motif• gene finding• anotasi• analisa linkage• analisa forensik• analisa evolusi/phylogenetics• studi populasi

• prediksi:• struktur sekunder• struktur tertier (3D)• topologi protein• antigenic determinant• protein docking

• molecular dynamics

• Ontologi Gen• Mining literatur• Simulasi metabolicpathway

• Manajemen data • user interface

• korelasi pola ekspresi• mapping data ekspresike data sekuen, strukturdan biokimia

• Pencarian gene ygberkaitan dgn penyakit

Pentingnya Bioinformatika dalam Biologi Molekuler

• Kuantitas data biologi molekuler• Kompleksitas data biologi molekuler• Kompleksitas analisa data• Ruang lingkup penelitian• Biologi sebagai ilmu kuantitatif• Infrastruktur terjangkau & labor-intensive• Efisiensi eksperimen• Value-added pada penelitian

Kuantitas Data Molekuler Biologi (1)

• Pertambahan data secara eksponensial akibat perkembanganteknologi akusisi data / teknologi eksperimental pada biologimolekuler.

• Contoh:– perkembangan teknologi sekuensing DNA secara otomatis, sehingga

data pada Genbank rata-rata bertambah 2X setiap 18 bulan.– eksperimen micro-array dapat menghasilkan 500,000 data ekspresi

per sampel (untuk 100 sampel, akan ada 50,000,000 data yang harusdianalisa)

• Pertambahan jumlah pemakai pada tiap-tiap database per tahunnya.

Kuantitas Data Biologi Molekuler (2)

Jumlah data (Februari 2008):• GenBank: 85,759,586,764 basa (82,853,685 sekuen record)• Whole Genome Sequence: 108,635,736,141 basa (27,439,206 sekuen record)

Kompleksitas Data Biologi Molekuler

Kompleksitas data biologi molekuler munculkarena kompleksitas pada struktur molekul yang ada pada sistem biologi.

kompleksitas struktur gene pada eukaryotes

Kompleksitas Data Biologi Molekuler (2)

DNA

hnRNA(heterogenous nuclear RNA)

Protein (precursor)

mRNA (coding sequence) non-coding RNA(regulatory, fungsional machinery)

transkripsi

splicing

translasi

Post-translational modification

Protein (mature)

Kompleksitas pada proses ekspresi gen eukaryotes:Central Dogma of Molecular Biology (extended)

Kompleksitas Data Biologi Molekuler (3)

Kompleksitas pada struktur protein dan interaksinya denganprotein/molekul lain

Kompleksitas Analisa Data

Kompleksitas pada pencarian data di database:– Database tidak akan berguna apabila tidak dilengkapi

dengan tools untuk mencari dan menganalisa data!– BLAST: Basic Local Alignment Searching Tools adalah

algoritma (dan tools) standar untuk mencari sekuenDNA maupun protein pada database yang memilikikemiripan dengan sekuen kueri, serta menganalisaapakah kemiripan tersebut signifikan secara biologimaupun secara statistik.

Kompleksitas Analisa Data (2)

Analogi BLAST: mencari record pasien yang memiliki nama Rahman:

– Rahman– Rahmawati– Rachman– Rakhman

Kompleksitas Analisa Data (3)

Data yang didapat dari akusisi data tidaksemuanya dapat dipergunakan secara langsung:– Data harus “dibersihkan” untuk menghilangkan noise– Data harus dinormalisasi agar dapat dianalisa secara

bersamaan– Data harus digabungkan agar dapat dipergunakan

untuk analisa, contoh adalah sekuensing de-novo genome suatu organisme dengan metode shot-gun.

Kompleksitas Analisa Data (4)

• Metode whole-genome shotgun sequencing memecah secara acak suatugenome menjadi fragmen DNA yang dapat disekuen satu-persatu untukkemudian digabungkan kembali menjadi satu untaian DNA yang utuh

• Proses penggabungan kembali (contig assembly) dapat dianalogikan sepertipermainan puzzle yang kompleks

• ~ 1 juta fragmen DNA• Reverse-complement

• Low complexity (A, T, C, G)

• Fragmen tidak komplit

• Kualitas fragmen tidak merata

• Duplikasi fragmen• Kontaminasi

• < 10,000 potongan• Puzzle memiliki gambar yang mirip pada

tiap sisinya• Gambar hanya menggunakan warna yang

terbatas• Tidak semua potongan tersedia (ada yg

hilang)• Banyak potongan puzzle yang gambarnya

memudar, terkena noda atau rusak(terpotong, dsb)

• Banyak potongan yang hampir sama• Ada potongan dari puzzle lain yang

tercampur

Shotgun Sequencing1500000 bp

random fragmentation

cloningsequencingassembling

Kompleksitas Analisa Data (5)

Kompleksitas pada analisa data yang membutuhkan algoritma yang lebih advanced karena sistem biologi merupakan suatu sistemyang sangat kompleks dan memiliki interaksiyang sangat kompleks pula.

Contoh analisa kompleks:– Penggunaan artificial intelligence & machine learning

untuk memprediksi daerah binding pada sekuen DNA

Kompleksitas Analisa Data (6)

Ruang Lingkup Penelitian

Aktifitas rekayasa genetika umumnyamelibatkan personil dari group/lab atau institusiyang berbeda, karena ruang lingkup kegiatannyasangat luas.– Fasilitas komunikasi (email, group-list)– Shared folders (workgroup/collaboration tools)

untuk berbagi data dan dokumen secara cepat– Ekpserimen dan analisa bersama, tergantung dari

kompetensi masing-masing personel/lab/institusi– Semakin berkembang karena perkembangan internet

Biologi Sebagai Ilmu Kuantitatif

Biologi, terutama biologi molekuler, mulai berkembangmenjadi ilmu kuantitatif dengan memadukan statistikdan matematika terapan untuk keperluan analisa.

Contoh:mekanisme molekuler akibat kelainan dari suatu gene dapatdijelaskan secara kualitatif, namun seberapa besar efek darikelainan tersebut sehingga dapat menyebabkan penyakitgenetik harus dijelaskan secara kuantitatif.

Infrastruktur Terjangkau & Labor-Intensive

• Infrastruktur paling minimal: komputer dan koneksi ke internet

• Processing power dari komputer saat ini cukup memadai untukanalisa lokal (analisa dengan menggunakan software yang berjalandi komputer user)

• Software untuk keperluan analisa bisa didapatkan secara gratis (opensource atau academic license)

• Analisa dapat dilakukan secara remote, misalnya melalui web service apabila tidak dapat dilakukan secara lokal (public maupunregistered user, gratis atau komersil)

• Labor-intensive karena membutuhkan keahlian dan ketekunan user saja

Efisiensi Eksperimen

• Bioinformatika dapat mem-”by-pass” beberapaeksperimen lab tertentu.– Pada Human Genome Project, metode shotgun sequencing

memungkinkan peneliti untuk melakukan kloning dengan jumlahyang lebih sedikit.

• Bioinformatika memungkinkan aktifitas eksperimen in-silico

• Eksperimen in-silico dapat dipergunakan untuk:– Memprediksi outcome dari hasil suatu eksperimen– Menyeleksi target– Memperkecil kesalahan yang terjadi

Memberikan Nilai Tambah Pada Penelitian

• Penelitian dapat dikembangkan lebih lanjut denganmelakukan analisa lanjutan dengan data yang sudahtersedia, atau dengan menggabungkan data lain darieksperimen lainnya atau dari data yang sudahdipublikasikan.

Contoh penggunaan data yang diakusisi sendiri dan data yang sudah dipublikasikan:– analisa phylogenetics– analisa komparatif suatu gene/protein

Waktu Penggunaan Bioinformatika

Sebelum eksperimen• Hipotesis• Fisibilitas• Metodologi penelitian

• Troubleshooting• Verifikasi/identifikasi hasil

Saat eksperimen

• Analisa data• Interpretasi hasil

Sesudah eksperimen

Forward Genetics

phenotype genotype( sample-based)

Mencari gen atau faktor penyebab/pemicu munculnya suatu phenotype, misalnya mencari gen atau mutasi penyebab suatu penyakit

“phenotype of interest”koleksi sampel

Mapping / sequencing DNASemi-quantitative (real-time) RT PCR / Microarray

Protein assay

Analisa datasequence: multiple alignment

ekspresi: statistikassay: modeling/ODE

Gen / faktor bersangkutan

Reverse Genetics

genotype phenotype(sequence-based)

Melihat atau mengkonfirmasi hasil/efek/implikasi pada phenotype dari suatu gen/faktor,misalnya mencari efek/implikasi dari suatu mutasi pada sebuah gen

“sequence of interest”

Analisa sekuen(prediksi fungsi / simulasi molekuler)

Knock-off/on gene | Protein expression & assay

Analisa phenotype | Analisa hasil

Kombinasi Forward/Reverse Genetics

Reverse Genetics(outcome: phenotype)

hipotesis validasi

Forward Genetics(outcome: genotype)

Database Bionformatika & Situs NCBI

Database

• Database primer/utama (primary)• Database sekunder (secondary)• Database tertier/special (tertiary)• Database literatur

Database primer/utama

Data repository

Raw data

Redundant

Direct submision ( “sampah”, inkonsistensi, dll)

Selalu di-update (daily/weekly)

Contoh:NCBI Genbank (sekuen DNA dan translasinya)SwissProt (sekuen protein)PDB (struktur kristal protein dan makromolekul)dbEST (potongan-potongan sekuen mRNA)dbGSS (survei sekuen genom)Trace Archive (data hasil sekuensing DNA)SAGEMap, GEO (data eksperimen microarray)

Database sekunder

Knowledge repository

Bersumber dari database primer/utama

Data dianotasi oleh kurator (umumnya manual)

Non-redundant

Ada jeda waktu untuk sinkronisasi dengan sumber database primer

Contoh:NCBI RefSeq (sekuen DNA dan translasinya)SwissProt (sekuen protein)Ensembl (sekuen genom eukaryotes)MMDB (struktur kristal protein dan makromolekul)

Database tertier/spesial

Bersumber dari database primer & sekunder

Mencakup data non-biomolekuler

Kenyamanan end-user

Banyak kurator

Jeda waktu sinkronisasi dengan database primer/sekunder yang lama

Contoh:EuPathDB (database patogen eukaryotes, seperti Plasmodium, dsb)MitoMAP (database mapping genome mitochodria)Mammalian ncRNA (sekuen ncRNA dari mamalia)REBASE (database enzim restriksi)SGD (database jamur/fungi)Globin Server (protein globin dan penyakit thalassemia)KEGG (database pathway, dsb)

Database literatur

PubMed (http://www.ncbi.nih.gov/pubmed)

Jurnal internasional bidang ilmu alam & kedokteran

Abstrak, Penulis, Jurnal

PubMed Central (http://www.pubmedcentral.nih.gov)

Subset dari PubMed

Full-text

NCBI Bookshelf (http://www.ncbi.nih.gov/books)

NCBI OMIM - Online Mendelian Inheritance in Man

Katalog dari penyakit genetik dan gen manusia (& tikus)

NCBI OMIA (Online Mendelian Inheritance in Animal

Katalog dari penyakit genetik dan gen hewan (selain manusia & tikus)

Daftar (sebagian kecil) Database Bioinformatika

MitoMAP

GenBankEMBLDDJ

SwissProt PDB

Pubmed

Prosite

PFAM

EnsEMBL GenomeBrowser

SGD

TrEMBL

PRINTS

InterPro

dbEST

dbSNP

primary databases

ProDom

Blocks

PFAM

PlasmoDB

HSSP

SCOP

CATH

DSSPSMD

secondary databases

TIGR

REBASE

KEGG

OMIM

NCBI ( www.ncbi.nih.gov )

• Pencarian literatur• Pencarian gen berdasarkan:

– Informasi tekstual (nama, lokasi, literatur)– Sekuen lain– Struktur

• Pencarian data lain:– OMIM – Online Mendelian Inheritance in Man– TaxBrowser– dbSNP – SNP database– dbGAP – Genotype-Phenotype database– UniSTS – Sequence Tag Site

• Repositori untuk GenBank & RefSeq• Repositori untuk full genomic sequences• Repositori untuk dokumen edukasi• Bioinformatics tools: Electronic PCR, dll

NCBI Genbank Database

Nomenclature NCBI Refseq

NM_* RefSeq untuk coding sequence (mRNA)

NR_* RefSeq untuk non-coding RNA yang ditranskripkan

NT_* RefSeq untuk genomic contig dari kromosom

NW_* RefSeq untuk alternatif genomic contig dari kromosom

NG_* RefSeq untuk famili/cluster atau pseudo-gene

NC_* RefSeq untuk full/circular genome

NP_* RefSeq untuk sekuen protein

XM_* RefSeq untuk sekuen hypothetical mRNA

XP_* RefSeq untuk sekuen hypothetical protein

ENTREZ

• ENTREZ: interface search/query dari (hampir) seluruh database di NCBI

• Interkoneksi antar (hampir) seluruh database• Pencarian dengan Entrez dapat dilengkapi

dengan sistem history• History dapat digabung untuk mendapatkan

kueri baru• Entrez dilengkapi dengan tools untuk mengubah

format data

Database pada NCBI (1)

• PubMed• Protein translasi dari Nucleotide• CoreNucleotide Genbank + Refseq• Nucleotide CoreNucleotide + EST + GSS + STS

– EST (Expressed Sequence Tags) – mRNA– GSS (Genome Survey Sequence) – preliminary genome– STS (Sequence Tag Site) – sekuen DNA pendek yang hanya muncul di

satu lokasi saja pada genome

• Structure :– MMDB – Molecular Modeling Database subset dari PDB – CDD – Conserved Domain Database– VAST – Vector Alignment Search Tool pencarian struktur berdasarkan

kemiripan pada struktur kueri

Database pada NCBI (2)

• Genome full atau partial annotated genome dari tiap spesies

• Books database literatur / text-book / etc• CancerChromosomes data mengenai kanker:

– Cytogenetics– Klinis– referensi

• ConservedDomains• 3D Domains

Database pada NCBI (3)

• Gene• Genome Project• dbGAP database Genotype and Phenotype• GENSAT (Gene Expression Nervous System Atlas) database

ekspresi gen dari sistem saraf pusat (central nervous system) padamouse dengan metode in-situ hybridization dan transgenik

• GEO (Gene Expression Omnibus) database ekspresi gen darieksperimen microarray

• HomoloGene data gen-gen homolog yang dianalisa secaraotomatis

• PMC – PubMed Central• MeSH

Database pada NCBI (4)

• OMIA & OMIM – Online Mendelian Inheritance database• PopSet data populasi dari berbagai studi• PubChem database struktur kimia biomolekul selain

protein• SNP (Single Nucleotide Polymorphism) database

variasi pada sekuen dari tiap gen• Taxonomy• UniGene data gen yang telah dianotasi dan

diorganisir• UniSTS data STS yang telah dianotasi

Anotasi Gen

• Kumpulan informasi yang relevan• Didapat dan diverifikasi dari eksperimen (diambil dari jurnal-jurnal

penelitian) secara manual• Informasinya antara lain:

– Organisme/sampel– Organelle– Lokasi kromosom beserta orientasinya– Daerah enhancer, promoter, exon-intron– Transkrip (beserta alternatifnya) dan proteinnya– Variasi dari gen (SNP)– Fungsi– Motif / pattern dari proteinnya– Korelasi phenotype / penyakit– Informasi lainnya

Anotasi Gen

Format Genbank

LOCUS DQ372051 370 bp DNA linear PRI 13-FEB-2006DEFINITION Homo sapiens isolate Nabila 1 control region, partial sequence;

mitochondrial.ACCESSION DQ372051VERSION DQ372051.1 GI:87047615KEYWORDS .SOURCE mitochondrion Homo sapiens (human)ORGANISM Homo sapiens

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini;Hominidae; Homo.

REFERENCE 1 (bases 1 to 370)AUTHORS Faghfoor,N.F.TITLE PCR Amplification and Sequencing of Hypervariable Region 1 of the

Mitochondrial DNA Control RegionJOURNAL Unpublished

REFERENCE 2 (bases 1 to 370)AUTHORS Faghfoor,N.F.TITLE Direct SubmissionJOURNAL Submitted (21-JAN-2006) Biochemistry/Biotechnology, University of

Southern California, Los Angeles, CA, USAFEATURES Location/Qualifiers

source 1..370/organism="Homo sapiens"/organelle="mitochondrion"/mol_type="genomic DNA"/isolate="Nabila 1"/db_xref="taxon:9606"/collection_date="2005"

misc_feature <1..>370/note="control region; hypervariable region 1"

ORIGIN1 ctgttctttc atggggaagc agatttgggt accacccaag tattgactcc cccatcaaca61 accgctatgt atttcgtaca ttactgccag ccaccatgaa tattgtacgg taccataaat

121 acttgaccac ctgtagtaca taaaaaccca atccacatca aaaccccctc cccatgctta181 caagcaagta cagcaatcaa ccctcaacta tcacacatca actgcaactc caaagccacc241 cctcacccac taggatacca acaaacctac ccacccttaa cagtacatag tacataatgc301 catttaccgt acatagcaca ttacagtcaa atcccttctc gtccccatgg atgacccccc361 tcagataggg

//

Format FASTA>referenceMASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQEVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTIDGLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAIFRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNPKQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL>normal_1MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQEVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTIDGLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAIFRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNPKQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL>normal_2MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQEVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTIDGLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAIFRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNPKQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL>pasien_1MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQEVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTIDGLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAIFRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNPKQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL>pasien_2MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQEVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTIDGLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAIFRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNPKQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL

Analisa sekuen dan struktur

• Desain primer• Studi homologi• Prediksi struktur sekunder protein• Prediksi topologi protein

Sekuen DNA:GATCGCTAGGATCGAGCTAGGATCGCGGATCCGAGAGCTCGAGGGCGCTAGCGCTAGCTCGATCGACTG

Sekuen protein (hasil translasi sekuen di atas):DR*DRARIADPRARGR*R*LDRL Frame +1IARIELGSRIRELEGASASSID Frame +2SLGSS*DRGSESSRALALARST Frame +3

Desain Primer & Probe

Desain primer secara otomatis

Primer3, PerlPrimer

Verifikasi oligonucleotides

NetPrimer, PerlPrimer

Desain degenerate-primer

CODEHOP

Primer harus dicek kembali (BLAST, ...)