Bioinformatika ??? Apa itu Bioinformatika ???
Bioinformatika berasal dari kata “bio” dan “informatika”,
adalah gabungan antara ilmu biologi dan ilmu teknik informasi (TI). Pada
umumnya, Bioinformatika didefenisikan sebagai aplikasi dari alat komputasi dan
analisa untuk menangkap dan menginterpretasikan data-data biologi. Ilmu ini
merupakan ilmu baru yang yang merangkup berbagai disiplin ilmu termasuk ilmu
komputer, matematika dan fisika, biologi, dan ilmu kedokteran, dimana
kesemuanya saling menunjang dan saling bermanfaat satu sama lainnya.
Istilah bioinformatics mulai dikemukakan pada
pertengahan era 1980-an untuk mengacu pada penerapan komputer dalam biologi.
Namun demikian, penerapan bidang-bidang dalam bioinformatika (seperti pembuatan
basis data dan pengembangan algoritma untuk analisis sekuens biologis) sudah
dilakukan sejak tahun 1960-an.
Ilmu bioinformatika lahir atas insiatif para ahli ilmu
komputer berdasarkan artificial intelligence. Mereka berpikir bahwa semua
gejala yang ada di alam ini bisa diuat secara artificial melalui simulasi dari
gejala-gejala tersebut. Untuk mewujudkan hal ini diperlukan data-data yang yang
menjadi kunci penentu tindak-tanduk gejala alam tersebut, yaitu gen yang
meliputi DNA atau RNA. Bioinformatika ini penting untuk manajemen data-data
dari dunia biologi dan kedokteran modern. Perangkat utama Bioinformatika adalah
program software dan didukung oleh kesediaan internet
Penemuan teknik sekuensing DNA yang
lebih cepat pada pertengahan 1970an menjadi landasan terjadinya ledakan jumlah
sekuens DNA yang dapat diungkapkan pada 1980an dan 1990an. Hal ini menjadi salah
satu pembuka jalan bagi proyek-proyek pengungkapan genom, yang meningkatkan
kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan
lahirnya bioinformatika.
Perkembangan jaringan internet juga mendukung
berkembangnya bioinformatika. Pangkalan data bioinformatika yang terhubungkan
melalui internet memudahkan ilmuwan dalam mengumpulkan hasil sekuensing ke
dalam pangkalan data tersebut serta memperoleh sekuens biologi sebagai bahan
analisis. Selain itu, penyebaran program-program
aplikasi bioinformatika melalui internet memudahkan ilmuwan dalam mengakses
program-program tersebut dan kemudian memudahkan pengembangannya.
Pangkalan
Data sekuens biologi dapat berupa pangkalan data primer untuk
menyimpan sekuens primer asam nukleat dan protein, pangkalan data
sekunder untuk menyimpan motif sekuens protein, dan pangkalan data struktur
untuk menyimpan data struktur protein dan asam nukleat.
Pangkalan data utama untuk sekuens asam nukleat saat ini
adalah GenBank (Amerika
Serikat), EMBL (the European
Molecular Biology Laboratory, Eropa), dan DDBJ (DNA Data Bank of Japan, Jepang). Ketiga pangkalan
data tersebut bekerja sama dan bertukar data secara harian untuk menjaga
keluasan cakupan masing-masing pangkalan data. Sumber utama data sekuens asam
nukleat adalah submisi (pengumpulan) langsung dari peneliti individual, proyek
sekuensing genom, dan
pendaftaran paten. Selain
berisi sekuens asam nukleat, entri dalam pangkalan data sekuens asam nukleat
pada umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA), namaorganisme sumber asam
nukleat tersebut, dan segala sesuatu yang berkaitan dengan sekuens asam nukleat
tersebut.
Selain asam nukleat, beberapa contoh pangkalan data penting
yang menyimpan sekuens primer protein adalah PIR (Protein Information
Resource, Amerika Serikat), Swiss-Prot (Eropa),
danTrEMBL (Eropa). Ketiga
pangkalan data tersebut telah digabungkan dalam UniProt, yang didanai
terutama oleh Amerika Serikat. Entri dalam UniProt mengandung informasi
tentang sekuens protein, nama organisme sumber protein, pustaka yang berkaitan,
dan komentar yang pada umumnya berisi penjelasan mengenai fungsi protein
tersebut.
Perangkat bioinformatika yang berkaitan erat dengan
penggunaan pangkalan data sekuens Biologi ialah BLAST (Basic Local Alignment
Search Tool). Penelusuran BLAST (BLAST search) pada pangkalan data sekuens
memungkinkan ilmuwan untuk mencari sekuens baik asam nukleat maupun protein
yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini berguna misalnya
untuk menemukan gen sejenis
pada beberapa organisme atau
untuk memeriksa keabsahan hasil sekuensingatau untuk
memeriksa fungsi gen hasil sekuensing. Algoritma yang mendasari
kerja BLAST adalah penyejajaran sekuens.
PDB (Protein
Data Bank, Bank Data Protein) ialah pangkalan data tunggal yang menyimpan model
struktur tiga dimensi protein dan asam nukleat hasil
penentuan eksperimental (dengankristalografi
sinar-X, spektroskopi
NMR, dan mikroskopi
elektron). PDB menyimpan data struktur sebagai koordinat
tiga dimensi yang menggambarkan posisi atom-atom dalam protein atau pun
asam nukleat.
Penerapan
Utama Bioinformatika
Basis data
sekuens biologis
Sesuai dengan jenis informasi biologis yang disimpannya, basis data sekuens
biologis dapat berupa basis data primer untuk menyimpan sekuens primer asam
nukleat maupun protein, basis data sekunder untuk menyimpan motif sekuens
protein, dan basis data struktur untuk menyimpan data struktur protein maupun
asam nukleat.
Basis data utama untuk sekuens asam nukleat saat ini adalah GenBank (Amerika
Serikat), EMBL (Eropa), dan DDBJ(Inggris) (DNA Data Bank of
Japan, Jepang).
Ketiga basis data tersebut bekerja sama dan bertukar data secara harian untuk
menjaga keluasan cakupan masing-masing basis data. Sumber utama data sekuens
asam nukleat adalah submisi langsung dari periset individual, proyek sekuensing genom, dan
pendaftaran paten.
Selain berisi sekuens asam nukleat, entri dalam basis data sekuens asam nukleat
umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber
asam nukleat tersebut, dan pustaka yang berkaitan dengan sekuens asam nukleat
tersebut.
Penyejajaran
sekuens
Penyejajaran sekuens (sequence alignment) adalah proses
penyusunan/pengaturan dua atau lebih sekuens sehingga persamaan
sekuens-sekuens tersebut tampak nyata. Hasil dari proses tersebut juga disebut
sebagai sequence alignment atau alignment saja. Baris
sekuens dalam suatu alignment diberi sisipan (umumnya dengan tanda
"–") sedemikian rupa sehingga kolom-kolomnya memuat karakter yang
identik atau sama di antara sekuens-sekuens tersebut
Prediksi
struktur protein
Secara kimia/fisika, bentuk struktur protein diungkap
dengan kristalografi sinar-X ataupun spektroskopi NMR, namun
kedua metode tersebut sangat memakan waktu dan relatif mahal. Sementara itu,
metode sekuensing protein
relatif lebih mudah mengungkapkan sekuens asam amino protein.
Prediksi struktur protein berusaha meramalkan struktur tiga dimensi protein
berdasarkan sekuens asam aminonya (dengan kata lain, meramalkan struktur
tersier dan struktur sekunder berdasarkan struktur primer protein). Secara
umum, metode prediksi struktur protein yang ada saat ini dapat dikategorikan ke
dalam dua kelompok, yaitu metode pemodelan protein komparatif dan metode
pemodelan de novo.
Pemodelan protein komparatif (comparative protein
modelling) meramalkan struktur suatu protein berdasarkan struktur protein lain
yang sudah diketahui. Salah satu penerapan metode ini adalah pemodelan
homologi (homology modelling), yaitu prediksi struktur tersier protein
berdasarkan kesamaan struktur primer protein.
Analisis
ekspresi gen
Ekspresi gen dapat ditentukan dengan mengukur
kadar mRNA dengan
berbagai macam teknik (misalnya dengan microarray ataupun Serial
Analysis of Gene Expression ["Analisis Serial Ekspresi Gen",
SAGE]). Teknik-teknik tersebut umumnya diterapkan pada analisis ekspresi gen
skala besar yang mengukur ekspresi banyak gen (bahkan genom) dan
menghasilkan data skala besar. Metode-metode penggalian data (data mining)
diterapkan pada data tersebut untuk memperoleh pola-pola informatif. Sebagai
contoh, metode-metode komparasi digunakan untuk membandingkan ekspresi di
antara gen-gen, sementara metode-metode klastering (clustering) digunakan untuk
mempartisi data tersebut berdasarkan kesamaan ekspresi gen.
Sumber :
Tidak ada komentar:
Posting Komentar