蛋白質結構預測_第1頁
已閱讀1頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第7章蛋白質結構預測蛋白質結構預測一種生物體的基因組規(guī)定了所有構成該生物體的蛋白質,基因規(guī)定了蛋白質的氨基酸序列。雖然蛋白質由氨基酸的線性序列組成,但是它們只有折疊成特定的空間構象才能具有相應的活性和生物學功能。了解蛋白質的空間結構不僅有利于認識蛋白質的功能,也有利于認識蛋白質是如何執(zhí)行其功能的。確定蛋白質的結構對于生物學研究是非常重要的。目前,蛋白質序列數據庫的數據積累的速度非???,但是已知結構的蛋白質相對比較少。盡管蛋白質結構測定技

2、術有了較為顯著的進展,但是通過實驗方法確定蛋白質結構的過程仍然非常復雜,代價較高,因此實驗測定的蛋白質結構比已知的蛋白質序列要少得多。另一方面,隨著DNA測序技術的發(fā)展,人類基因組及更多的模式生物基因組已被或將被完全測序,DNA序列數量將會急增,而由于DNA序列分析技術和基因識別方法的進步,我們可以從DNA推倒導出大量的蛋白質序列。這意味著已知序列的蛋白質數量和已測定結構的蛋白質數量(如蛋白質結構數據庫PDB中的數據)的差距將會越來越大

3、。人們希望產生蛋白質結構的速度能夠跟上產生蛋白質序列的速度,或者減小兩者的差距。那么如何縮小這種差距呢?不能完全依賴現有的結構測定技術,需要發(fā)展理論分析方法,這對蛋白質結構預測提出了極大的挑戰(zhàn)。20世紀60年代后期,Anfinsen首先發(fā)現去折疊蛋白或者說變性(denatured)蛋白質在允許重新折疊的實驗條件下可以重新折疊到原來的結構,這種天然結構(nativestructure)對于行使生物功能具有重要作用,大多數蛋白質只有在折疊成

4、它們天然結構的時候才能具有完全的生物活性。自從Anfinsen提出蛋白質折疊的信息隱含在蛋白質的一級結構中,科學家們對蛋白質結構的預測進行了大量的研究,分子生物學家將有可能直接運用適當的算法從氨基酸序列出發(fā),預測蛋白質的結構。本章主要著重介紹蛋白質二級結構及空間結構預測的方法。7.17.1引言引言基因是生命的藍圖,蛋白質是生命的機器。來自于四種字符字母表(A,T(U),C,G)的核酸序列中蘊藏著生命的信息,而蛋白質則執(zhí)行著生物體內各種重

5、要的工作,如生物化學反應的催化、營養(yǎng)物質的輸運、生長和分化控制、生物信號的識別和傳遞等工作。蛋白質序列由相應的核酸序列所決定,通過對基因的轉錄和翻譯,將原來四字符的DNA序列,根據三聯密碼翻譯成20字符的蛋白質氨基酸序列。蛋白質具有不同的長度、不同的氨基酸排列和不同的空間結構,實驗分析表明蛋白質能夠形成特定的結構。蛋白質中相鄰的氨基酸通過肽鍵形成一條伸展的鏈,肽鏈上的氨基酸殘基形成局部的二級結構,各種二級結構組合形成完整的折疊結構。蛋白

6、質分子很大,其折疊的空間結構會將一些區(qū)域包裹在內部,而將其它的區(qū)域暴露在外。在蛋白質的空間結構中,序列上相距比較遠的氨基酸可能彼此接近。在水溶液中,肽鏈折疊成為特定的三維結構。主要的驅動力來自于氨基酸殘基的疏水性,氨基酸殘基的疏水性要求將氨基酸疏水片段放置于分子的內部。圖7.1(a)是酪氨酸磷酸酶的蛋白質序列,圖7.1(b)是對應的二級結構,其中H代表螺旋,E代表折疊,B表示β橋,G表示310螺旋,I表示π螺旋,T表示氫鍵轉角,S代表轉

7、向,圖7.1(c)顯示的是該蛋白質的折疊結構。研究蛋白質的結構意義重大,分析蛋白質結構、功能及其關系是蛋白質組計劃中的一個重要組成部分。研究蛋白質結構,有助于了解蛋白質的作用,了解蛋白質如何行使其生物功能,認識蛋白質與蛋白質(或其它分子)之間的相互作用,這無論是對于生物學還是對于醫(yī)學和藥學,都是非常重要的。對于未知功能或者新發(fā)現的蛋白質分子,通過結構分析,可以進行功能注釋,指導設計進行功能確認的生物學實驗。通過分析蛋白質的結構,確認功能

8、單位或者結構域,可以為遺傳操作提供目標,為設計新的蛋白質或改造已有蛋白質提供可靠的依據,同時為新的藥物分子設計提供合理的靶分子及結構。生物信息學的一個基本觀點是:分子的結構決定分子的性質和分子的功能。因此,生物大分子蛋白質的空間結構決定蛋白質的生物學功能。但是,蛋白質的空間結構又是由什么決定的呢?當一個蛋白質的空間結構被破壞以后,或者蛋白質解折疊,可以恢復其自然的折疊結構。大量的實驗結果證明:蛋白質的結構由蛋白質序列所決定。雖然影響蛋白

9、質空間結構的另一個因素是蛋白質分子所處的溶液環(huán)境,但是決定蛋白質結構的信息則是被編碼于氨基酸序列之中。然而,這種編碼是否能被破譯呢?或者說是否能夠直接從氨基酸序列預測出蛋白質的空間結構呢?蛋白質結構預測的問題從數學上講,是尋找一種從蛋白質的氨基酸線性序列到蛋白質所有原子三維坐標的一種映射。典型的蛋白質含有幾百個氨基酸、上千個原子,而大蛋白質(如載脂蛋白)的氨基酸個數超過4500。所有可能的序列到結構的映射數隨蛋白質氨基酸殘基個數而呈指數

10、增長,是天文數字。然而幸運的是,自然界實際存在的蛋白質是有限的,并且存在著大量的同源序列,可能的結構類型也不多,序列到結構的關系有一定的規(guī)律可循,因此蛋白質結構預測是可能的。蛋白質結構預測主要有兩大類方法。一類是理論分析方法或從頭算方法(Abinitio),通過理論計算(如分子力學、分子動力學計算)進行結構預測。該類方法假設折疊后的蛋白質取能量最低的構象。從原則上來說,我們可以根據物理、化學原理,通過計算來進行結構預測。但是在實際中,這

11、種方法往往不適合。主要有幾個原因,一是自然的蛋白質結構和未折疊的蛋白質結構,兩者之間的能量差非常小(1kcalmol數量級),二是蛋白質可能的構象空間龐大,針對蛋白質折疊的計算量非常大。另外,計算模型中力場參數的不準確性也是一個問題。另一類蛋白質結構預測方法是統計的方法,該類方法對已知結構的蛋白質進行統計分析,建立序列到結構的映射模型,進而對未知結構的蛋白質根據映射模型直接從氨基酸序列預測結構。映射模型可以是定性的,也可以是定量的。這是

12、進行蛋白質結構預測較為成功的一類方法。這一類方法包括經驗性方法、結構規(guī)律提取方法、同源模型化方法等。所謂經驗性方法就是根據一定序列形成一定結構的傾向進行結構預測,例如,根據不同氨基酸形成特定二級結構的傾向進行結構預測。通過對已知結構的蛋白質(如蛋白質結構數據庫PDB、蛋白質二級結構數據庫DSSP中的蛋白質)進行統計分析,發(fā)現各種氨基酸形成不同二級結構的傾向,形成一系列關于二級結構預測的規(guī)則。與經驗性方法相似的另一種辦法是結構規(guī)律提取方法

13、,這是更一般的方法。該方法從蛋白質結構數據庫中提取關于蛋白質結構形成的一般性規(guī)則,指導建立未知結構的蛋白質的模型。有許多提取結構規(guī)律的方法,如通過視覺觀察的方法,基于統計分析和序列多重比對的方法,利用人工神經網絡提取規(guī)律的方法。同源模型化方法通過同源序列分析或者模式匹配預測蛋白質的空間結構或者結構單元(如鋅指結構、螺旋轉角螺旋結構、DNA結合區(qū)域等)。其原理是基于下述事實:每一個自然蛋白質具有一個特定的結構,但許多不同的序列會采用同一個

14、基本的折疊,也就是說,具有相似序列的蛋白質傾向于折疊成相似的空間結構。一對自然進化的蛋白質,如果它們的序列具有25?30%的等同部分或者更多,則可以假設這兩個蛋白質折疊成相似的空間結構。這樣,如果一個未知結構的蛋白質與一個已知結構的蛋白質具有足夠的序列相似性,那么可以根據相似性原理給未知結構的蛋白質構造一個近似的三維模型。如果目標蛋白質序列的某一部分與已知結構的蛋白質的某一結構域區(qū)域相似,則可以認為目標蛋白質具有相同的結構域或者功能區(qū)域

15、。在蛋白質結構預測方面,預測結果最可靠的方法是同源模型化方法。蛋白質的同源性比較往往是借助于序列比對而進行的,通過序列比對可以發(fā)現蛋白質之間進化的關系。在蛋白質結構分析方面,通過序列比對可以發(fā)現序列保守模式或突變模式,這些序列模式中包含著非常有用的三維結構信息。利用同源模型化方法可以預測所有10?30%蛋白質的結構。然而,有許多具有相似結構的蛋白質是遠程同源的,它們的等同序列不到25%。也就是說,具有相似空間結構的蛋白質序列等同程度可能

16、小于25%。這些蛋白質的同源性不能被通過傳統的序列比對方法所識別。如果按照一個未知序列搜索一個蛋白質序列數據庫,并且搜索條件為序列等同程度小于25%的話,那么將會得到大量不相關的蛋白質。因此,搜索遠程同源蛋白質就像在干草堆里尋找一根針。尋找遠程同源蛋白質是一項困難的任務,處理這個困難任務的技術稱為“線索(THREADING)技術”。對于一個未知結構的蛋白質,僅當我們找不到等同序列大于25%的已知結構的同源蛋白質時,才通過線索技術尋找已知

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論