淺談蛋白質資料庫(Protein Data Bank)
台北市忠孝國民中學張馨文實習老師/國立台灣師範大學生命科學系李冠群助理教授責任編輯
從皮膚的角質、肌肉細胞中的肌動蛋白和肌凝蛋白、脊椎動物血中的血紅素、消化液中的酵素、胰島素到細胞膜上的膜蛋白,在在都顯示蛋白質是生物體內相當重要的基本材料。
當基因經過轉錄轉譯的過程後,胺基酸之間利用肽鍵在立體空間中,摺疊產生結構複雜的的蛋白質,根據蛋白質的結構分成四個層次:
- 由多肽鍵形成的線性氨基酸序列之ㄧ級結構、
- 依靠氫鍵形成的α螺旋和β折疊之二級結構、
- 以及由二級構造相互間的離子鍵、氫鍵、疏水鍵等形成的三級結構,許多蛋白質在三級結構就已經具有活性。
- 而蛋白質複合分子例如血紅蛋白(hemoglobin) 是由二條α鏈及二條β鏈(α2β2)的緊密結合而成,則是四級構造的例子。
蛋白質三度空間結構決定是否能表現正常的生化功能,目前結構性蛋白質體學主要利用X光結晶繞射與核磁共振(NMR)光譜技術研究立體結構,同時電腦模擬預測程式在電腦大量運算下,也可以幫助預測蛋白質立體結構。
蛋白質在核糖體被製造後,經過一系列轉譯後修飾作用,例如:磷酸化、醣質化、脂質化、酵素水解及其他修飾等,而使單一蛋白鏈衍生出許多差異性質的蛋白質同型體(isoforms),這些蛋白質同型體常扮演重要生理反應的調控角色。
生物體中蛋白質之間以及蛋白質與其他分子之間會發生複雜的交互作用,
例如核糖體(ribosome)的行成,需要許多的蛋白質與核醣核酸(RNA)形成複合體才能執行其功能;
又如大腸桿菌的乳糖或是色胺酸操縱組(operon)中,調節性蛋白質必須與啟動子(promoter)核酸序列結合才能發揮調控基因表現的作用,針對蛋白質在整體生理反應中所扮演的生化角色之探討,此即為功能性蛋白體學。
當我們解讀三至四萬個基因與其蛋白質產物的互動關係時,衍生出龐大的資料包括基因序列、蛋白質序列、蛋白質與蛋白質交互作用、蛋白質結構等,勢必需要蛋白質資料庫整合處理,因而形成多功能且高整合性的系統生物學(systems biology )研究方式。
目前,在網際網路上,可以從GenBank、SWISS-PROT、PIR、OWL、TrEMBL到PDB,獲得各種蛋白資訊。
美國的PDB(Protein Data Bank )或是GenBank裡面所收集的資料有3D蛋白結構之資訊;SWISS-PROT提供具備轉譯後修飾等資訊的蛋白質序列;EMBL將DNA及蛋白質序列、蛋白質結構、交互作用與其他資料庫連結通用;或是人類蛋白質資料庫(Human Protein Reference Database, HPRD)提供酵素/受質關係、疾病關連性、組織表現等資訊。當我們建構好完善的蛋白質資料庫,可利用電腦模擬系統去預測可能參與的生理或是藥理反應,再進行藥物開發,勢必可為個人化藥物設計和臨床測試前進一大步。
資料來源: