Bioinformatika
merupakan ilmu terapan yang lahir dari perkembangan teknologi informasi
dibidang molekular. Pembahasan dibidang bioinformatik ini tidak
terlepas dari perkembangan biologi molekular modern, salah satunya
peningkatan pemahaman manusia dalam bidang genomic yang terdapat dalam
molekul DNA.
Kemampuan untuk memahami dan memanipulasi
kode genetik DNA ini sangat didukung oleh teknologi informasi melalui
perkembangan hardware dan soffware. Baik pihak pabrikan sofware dan
harware maupun pihak ketiga dalam produksi perangkat lunak. Salah satu
contohnya dapat dilihat pada upaya Celera Genomics, perusahaan
bioteknologi Amerika Serikat yang melakukan pembacaan sekuen genom
manusia yang secara maksimal memanfaatkan teknologi informasi sehingga
bisa melakukan pekerjaannya dalam waktu yang singkat (hanya beberapa
tahun).
Perkembangan
teknologi DNA rekombinan memainkan peranan penting dalam lahirnya
bioinformatika. Teknologi DNA rekombinan memunculkan suatu pengetahuan
baru dalam rekayasa genetika organisme yang dikenala bioteknologi. Perkembangan
bioteknologi dari bioteknologi tradisional ke bioteknologi modren salah
satunya ditandainya dengan kemampuan manusia dalam melakukan analisis
DNA organisme, sekuensing DNA dan manipulasi DNA.
Sekuensing
DNA satu organisme, misalnya suatu virus memiliki kurang lebih 5.000
nukleotida atau molekul DNA atau sekitar 11 gen, yang telah berhasil
dibaca secara menyeluruh pada tahun 1977. Kemudia Sekuen seluruh DNA
manusia terdiri dari 3 milyar nukleotida yang menyusun 100.000 gen dapat
dipetakan dalam waktu 3 tahun, walaupun semua ini belum terlalu
lengkap. Saat ini terdapat milyaran data nukleotida yang tersimpan dalam
database DNA, GenBank di AS yang didirikan tahun 1982.
Bioinformatika ialah ilmu yang mempelajari penerapan teknik komputasi untuk mengelola dan menganalisis informasi hayati. Bidang ini mencakup penerapan metode-metode matematika, statistika, dan informatika untuk memecahkan masalah-masalah biologi, terutama yang terkait dengan penggunaan sekuens DNA dan asam amino. Contoh topik utama bidang ini meliputi pangkalan data untuk mengelola informasi hayati, penyejajaran sekuens (sequence alignment), prediksi struktur untuk meramalkan struktur protein atau pun struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.
Bioinformatika pertamakali dikemukakan pada pertengahan 1980an untuk mengacu kepada penerapan ilmu komputer
dalam bidang biologi. Meskipun demikian, penerapan bidang-bidang dalam
bioinformatika seperti pembuatan pangkalan data dan pengembangan algoritma untuk analisis sekuens biologi telah dilakukan sejak tahun 1960an.
Kemajuan teknik biologi molekuler dalam mengungkap sekuens biologi protein (sejak awal 1950an) dan asam nukleat (sejak 1960an) mengawali perkembangan pangkalan data dan teknik analisis sekuens biologi. Pangkalan data sekuens protein mulai dikembangkan pada tahun 1960an di Amerika Serikat, sementara pangkalan data sekuens DNA dikembangkan pada akhir 1970an di Amerika Serikat dan Jerman pada Laboratorium Biologi Molekuler Eropa (European Molecular Biology Laboratory).
Penemuan teknik sekuensing
DNA yang lebih cepat pada pertengahan 1970an menjadi landasan
terjadinya ledakan jumlah sekuens DNA yang dapat diungkapkan pada 1980an
dan 1990an. Hal ini menjadi salah satu pembuka jalan bagi proyek-proyek pengungkapan genom, yang meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya bioinformatika.
Perkembangan jaringan internet
juga mendukung berkembangnya bioinformatika. Pangkalan data
bioinformatika yang terhubungkan melalui internet memudahkan ilmuwan
dalam mengumpulkan hasil sekuensing ke dalam pangkalan data tersebut
serta memperoleh sekuens biologi sebagai bahan analisis. Selain itu,
penyebaran program-program
aplikasi bioinformatika melalui internet memudahkan ilmuwan dalam
mengakses program-program tersebut dan kemudian memudahkan
pengembangannya.
Pangkalan Data sekuens biologi dapat berupa pangkalan data primer untuk menyimpan sekuens primer asam nukleat dan protein,
pangkalan data sekunder untuk menyimpan motif sekuens protein, dan
pangkalan data struktur untuk menyimpan data struktur protein dan asam
nukleat.
Pangkalan data utama untuk sekuens asam nukleat saat ini adalah GenBank (Amerika Serikat), EMBL (the European Molecular Biology Laboratory, Eropa), dan DDBJ (DNA Data Bank of Japan, Jepang). Ketiga
pangkalan data tersebut bekerja sama dan bertukar data secara harian
untuk menjaga keluasan cakupan masing-masing pangkalan data. Sumber
utama data sekuens asam nukleat adalah submisi (pengumpulan) langsung
dari peneliti individual, proyek sekuensing genom, dan pendaftaran paten.
Selain berisi sekuens asam nukleat, entri dalam pangkalan data sekuens
asam nukleat pada umumnya mengandung informasi tentang jenis asam
nukleat (DNA atau RNA), nama organisme sumber asam nukleat tersebut, dan segala sesuatu yang berkaitan dengan sekuens asam nukleat tersebut.
Selain asam nukleat, beberapa contoh pangkalan data penting yang menyimpan sekuens primer protein adalah PIR (Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga pangkalan data tersebut telah digabungkan dalam UniProt, yang didanai terutama oleh Amerika Serikat. Entri
dalam UniProt mengandung informasi tentang sekuens protein, nama
organisme sumber protein, pustaka yang berkaitan, dan komentar yang pada
umumnya berisi penjelasan mengenai fungsi protein tersebut.
Perangkat bioinformatika yang berkaitan erat dengan penggunaan pangkalan data sekuens Biologi ialah BLAST (Basic Local Alignment Search Tool). Penelusuran BLAST (BLAST search)
pada pangkalan data sekuens memungkinkan ilmuwan untuk mencari sekuens
baik asam nukleat maupun protein yang mirip dengan sekuens tertentu yang
dimilikinya. Hal ini berguna misalnya untuk menemukan gen sejenis pada beberapa organisme atau untuk memeriksa keabsahan hasil sekuensing atau untuk memeriksa fungsi gen hasil sekuensing. Algoritma yang mendasari kerja BLAST adalah penyejajaran sekuens.
PDB (Protein Data Bank, Bank Data Protein) ialah pangkalan data tunggal yang menyimpan model struktur tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR, dan mikroskopi elektron). PDB menyimpan data struktur sebagai koordinat tiga dimensi yang menggambarkan posisi atom-atom dalam protein atau pun asam nukleat