版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、當(dāng)前蛋白質(zhì)鑒定的研究中,通過串聯(lián)質(zhì)譜鑒定多肽序列從而鑒定蛋白質(zhì)是最廣泛使用的技術(shù)。實(shí)驗(yàn)中,從色譜中分離出來的多肽經(jīng)過CID過程被裂解成碎片離子,這些離子的質(zhì)量/電荷比值(m/z)被質(zhì)譜儀器檢測到,形成串聯(lián)質(zhì)譜。采用數(shù)據(jù)庫搜索方法或者De novo從頭解序方法,可從這些碎片離子的m/z值中鑒定出多肽的序列來。 然而,不管采用什么計(jì)算方法進(jìn)行多肽序列的鑒定,高分辨率串聯(lián)質(zhì)譜數(shù)據(jù)的特點(diǎn)決定了其在計(jì)算上的困難。質(zhì)譜中大量的物理噪聲和
2、離子的同位素峰,增加了多肽序列鑒定過程的計(jì)算量,而且使得隨機(jī)匹配的可能性增高,從而導(dǎo)致鑒定的結(jié)果可靠性降低。此外,質(zhì)譜中數(shù)據(jù)中的質(zhì)量測量誤差直接影響多肽鑒定結(jié)果。因此,在進(jìn)行多肽序列鑒定之前,對質(zhì)譜數(shù)據(jù)進(jìn)行預(yù)處理非常關(guān)鍵。 本文從理論、算法和應(yīng)用三個(gè)層次來討論對串聯(lián)質(zhì)譜數(shù)據(jù)的預(yù)處理技術(shù),實(shí)現(xiàn)對質(zhì)譜數(shù)據(jù)的多種預(yù)處理,包括過濾質(zhì)譜中的物理噪聲、過濾同位素峰、預(yù)測離子對應(yīng)的分子式、識(shí)別質(zhì)譜的測量誤差等。通過這些預(yù)處理,最終降低序列
3、鑒定過程的計(jì)算量、提高單個(gè)質(zhì)譜的鑒定可靠性、以及提高能能鑒定出多肽的質(zhì)譜個(gè)數(shù),從而提高蛋白質(zhì)鑒定的可靠性。 本文首先提出一個(gè)關(guān)鍵的同位素模式概念,可以定量地刻畫離子的一系列同位素在質(zhì)量、豐度上的特征;并給出了計(jì)算離子的理論和實(shí)驗(yàn)同位素模式的公式,在此基礎(chǔ)上可進(jìn)行多種討論,比如區(qū)分質(zhì)譜中離子和噪聲對應(yīng)的譜峰、預(yù)測離子的分子式、估計(jì)質(zhì)譜質(zhì)量測量誤差等。 基于同位素模式概念,本文提出了從質(zhì)譜中挑選潛在的離子單同位素峰的
4、算法PeakSelect。本文從理論上討論了噪聲和離子譜峰的本質(zhì)區(qū)別以及質(zhì)譜中離子同位素峰重疊的分布情況,并討論了噪聲譜峰在強(qiáng)度上的分布。在此基礎(chǔ)上,本文提出多個(gè)有效的特征來區(qū)別噪聲、孤立的離子譜峰、重疊的離子譜峰,并建立譜峰分類的決策樹,從質(zhì)譜中挑選潛在的離子的單同位素峰。實(shí)驗(yàn)結(jié)果表明PeakSelect能準(zhǔn)確地挑選質(zhì)譜中的離子單同位素譜峰,不僅能夠大大縮短鑒定軟件在多肽序列鑒定上所需的計(jì)算時(shí)間,并且能大大增加可靠鑒定出的多肽的個(gè)數(shù),
5、提高了質(zhì)譜的利用率,也提高了所鑒定的蛋白質(zhì)序列的覆蓋率,從而提高了鑒定結(jié)果的可靠性。此外,本算法性能較之現(xiàn)有的商用軟件,比如ProteinLynx<'TM>Global Server對質(zhì)譜有效峰選取的預(yù)處理效果更好。 在估計(jì)質(zhì)譜質(zhì)量誤差之前,本文先提出了預(yù)測離子分子式的算法FFP。FFP通過比較分子式對應(yīng)的理論同位素模式與質(zhì)譜中實(shí)際出現(xiàn)的實(shí)驗(yàn)同位素模式間的差異來預(yù)測離子的分子式,并將分子式預(yù)測問題轉(zhuǎn)化為優(yōu)化問題。結(jié)合優(yōu)化建模
6、和統(tǒng)計(jì)分析,F(xiàn)FP對小質(zhì)量段內(nèi)的離子分子式預(yù)測的五選正確率達(dá)95%以上。在此基礎(chǔ)上,本文提出了估計(jì)質(zhì)譜質(zhì)量測量誤差的算法QPMass,并將QMass應(yīng)用到Q-TOF數(shù)據(jù)上。 質(zhì)譜的質(zhì)量測量誤差包含兩個(gè)部分,一是隨機(jī)誤差,二是系統(tǒng)誤差。隨機(jī)誤差服從正態(tài)分布,而根據(jù)儀器的測量原理,可以得到系統(tǒng)誤差的理論分布函數(shù),比如,TOF儀器的測量誤差與離子理論質(zhì)量近似成線性關(guān)系。對一個(gè)具體的質(zhì)譜分析其測量誤差就是要得到這個(gè)系統(tǒng)誤差的分布函數(shù)
7、的具體參數(shù)。QMass借助FFP的預(yù)測結(jié)果可得到一些準(zhǔn)確的測量誤差樣本點(diǎn)。并且,QMass還通過計(jì)算質(zhì)譜中各種潛在的連續(xù)或同源離子譜峰間的質(zhì)量差的理論值與實(shí)驗(yàn)值之間的差異而得到相應(yīng)的測量誤差樣本點(diǎn)。在這些樣本點(diǎn)數(shù)據(jù)上QMass通過估計(jì)誤差分布函數(shù)的參數(shù)從而得到整個(gè)質(zhì)譜的質(zhì)量測量誤差估計(jì)。實(shí)驗(yàn)結(jié)果表明,95%以上的質(zhì)譜誤差估計(jì)值與實(shí)際的誤差值相差不超過40ppm。據(jù)我們所知,Qmass是第一個(gè)不依賴于內(nèi)標(biāo)或外標(biāo)參考,也不依賴數(shù)據(jù)庫搜索結(jié)果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于串聯(lián)質(zhì)譜的蛋白質(zhì)鑒定算法研究.pdf
- 蛋白質(zhì)組學(xué)質(zhì)譜數(shù)據(jù)預(yù)處理新策略研究及應(yīng)用.pdf
- 串聯(lián)質(zhì)譜數(shù)據(jù)的預(yù)處理方法研究.pdf
- 基于串聯(lián)質(zhì)譜數(shù)據(jù)進(jìn)行蛋白質(zhì)序列庫搜索算法初探.pdf
- 質(zhì)譜蛋白質(zhì)組中肽段及其修飾鑒定算法研究.pdf
- 一種基于串聯(lián)質(zhì)譜鑒定蛋白質(zhì)突變和翻譯后修飾的算法.pdf
- 30186.蛋白質(zhì)質(zhì)譜數(shù)據(jù)處理方法的研究
- 基于優(yōu)化算法的蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析.pdf
- 基于串聯(lián)質(zhì)譜數(shù)據(jù)的蛋白質(zhì)-基因組學(xué)方法研究.pdf
- 基于質(zhì)譜數(shù)據(jù)的蛋白質(zhì)直接鑒定系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 色譜質(zhì)譜聯(lián)用技術(shù)在蛋白質(zhì)分析鑒定中的應(yīng)用.pdf
- 基于質(zhì)譜數(shù)據(jù)的蛋白質(zhì)識(shí)別系統(tǒng).pdf
- 蛋白質(zhì)組質(zhì)譜平臺(tái)實(shí)驗(yàn)數(shù)據(jù)仿真生成研究.pdf
- 基于稀疏表示的蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析.pdf
- 43220.信息度量的蛋白質(zhì)序列、結(jié)構(gòu)、質(zhì)譜數(shù)據(jù)研究
- 基于聚類分析的蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析研究.pdf
- 蛋白質(zhì)組學(xué)質(zhì)譜數(shù)據(jù)深度解析關(guān)鍵問題研究.pdf
- 原位蛋白質(zhì)質(zhì)譜的開發(fā)和應(yīng)用.pdf
- 宮頸癌蛋白質(zhì)質(zhì)譜變化研究.pdf
- 368.基于正反庫特征信息匹配的蛋白質(zhì)二級質(zhì)譜鑒定算法
評論
0/150
提交評論