基于AP聚類的蒸餾算法篩選乳腺癌致病基因.pdf_第1頁
已閱讀1頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三代高通量測序技術(shù)可以更精準(zhǔn)、更全面地獲得人類基因信息,為研究乳腺癌與基因表達(dá)之間的關(guān)系提供了新途徑,同時也帶來了新的挑戰(zhàn)-如何從三萬多個已知人類基因中高效準(zhǔn)確地篩選乳腺癌致病基因。傳統(tǒng)單因素方法只考慮單個基因的異常表達(dá)對乳腺癌的影響,沒有能力處理基因間的交互作用;測序過程產(chǎn)生的噪聲數(shù)據(jù)的統(tǒng)計顯著性往往高于單個正?;虻慕y(tǒng)計顯著性,以致噪聲特征被誤認(rèn)為致病基因而被篩選出來,這些噪聲特征往往缺乏生物意義上的合理解釋。鑒于傳統(tǒng)方法的不足,

2、本文提出了一種基于AP聚類分析的蒸餾算法篩選乳腺癌致病基因,取得的創(chuàng)新性成果如下:
  1.針對基因特征選擇,提出了一種基于AP聚類分析的蒸餾算法。蒸餾算法首先應(yīng)用AP聚類將全基因特征聚成多個基因簇;然后在各個基因簇中蒸餾篩選關(guān)鍵基因;最后將篩選出的關(guān)鍵基因聚合在一起。整個過程迭代進行,通過調(diào)節(jié)參數(shù)控制篩選強度和聚類生成的基因簇的個數(shù),直到篩選出的關(guān)鍵基因個數(shù)等于預(yù)先設(shè)定的值,算法才停止。蒸餾算法模擬物理蒸餾過程,通過AP聚類過程

3、、蒸餾篩選過程、冷凝過程三個子過程完成。其中AP聚類過程旨在將功能類似或者存在交互作用的基因聚到同一個基因簇中;蒸餾篩選過程通過調(diào)節(jié)參數(shù),可以篩選出乳腺癌關(guān)鍵基因,這些基因可能個體表達(dá)水平并不顯著,但與簇內(nèi)其他基因存在功能上的關(guān)聯(lián)性或者其他交互性;冷凝過程是將各個基因簇中篩選出的基因重新聚合在一起,為下一次迭代做準(zhǔn)備。
  2.應(yīng)用蒸餾算法從20141個人類基因中篩選出473個與乳腺癌緊密相關(guān)的基因,聚類分析將這些基因聚成9個基因

4、簇。鑒于目前已知的乳腺癌致病基因集中分布在第8個基因簇,本研究對該基因簇的77個基因之間的交互作用、以及與乳腺癌之間的關(guān)聯(lián)性給予生物意義上的解釋,并建議其中66個新發(fā)現(xiàn)的乳腺癌關(guān)聯(lián)基因作為后續(xù)研究的重點。進一步,還分析了77個基因的甲基化程度,篩選出與對應(yīng)基因表達(dá)水平之間的相關(guān)性比較大的4個堿基位點。
  3.采用基因簇富集分析方法對蒸餾算法生成的9個基因集合進行了統(tǒng)計分析,驗證了算法篩選出的基因集合的有效性。
  本研究還

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論