復(fù)雜性狀相關(guān)microRNA及遺傳位點的分析與預(yù)測.pdf_第1頁
已閱讀1頁,還剩132頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、絕大多數(shù)人類疾病以及農(nóng)藝性狀都屬于復(fù)雜性狀,通常受到大量的遺傳因素的控制以及環(huán)境因素的控制。闡明復(fù)雜性狀的遺傳機制,對人類復(fù)雜疾病的致病機理研究、診斷預(yù)防以及新藥的研發(fā)都有重要的意義,也為動植物品系的改良、產(chǎn)量及品質(zhì)的提高奠定基礎(chǔ),因此具有重要的科學(xué)意義以及實際應(yīng)用價值。
  目前復(fù)雜性狀基因組定位技術(shù)已經(jīng)取得了一些成果,然而這些方法在不同環(huán)境中再現(xiàn)率低以及遺漏了大量微效位點,難以有效闡明復(fù)雜性狀的分子機制以及準(zhǔn)確預(yù)測表型。此外,

2、包括miRNA在內(nèi)非編碼調(diào)控元件與復(fù)雜性狀緊密關(guān)聯(lián),挖掘這些關(guān)聯(lián)是當(dāng)前研究的熱點和難點。針對于此,本研究圍繞著復(fù)雜疾病相關(guān)miRNA的預(yù)測及甘藍(lán)型油菜農(nóng)藝性狀相關(guān)位點的全基因組分析進行了研究,主要內(nèi)容如下:
 ?。?)采用文本挖掘的方法建立癌癥與miRNA之間的關(guān)聯(lián)網(wǎng)絡(luò),并挖掘潛在的癌癥相關(guān)miRNA。首先,對MEDLINE摘要中的miRNA與癌癥的關(guān)聯(lián)進行挖掘,并將結(jié)果整理為miCancerna數(shù)據(jù)庫。而后,在miCancern

3、a數(shù)據(jù)庫構(gòu)建的miRNA與癌癥關(guān)聯(lián)二分網(wǎng)絡(luò)上,利用重啟型隨機游走算法預(yù)測20種常見癌癥類型的相關(guān)miRNA。交叉結(jié)果顯示,這種預(yù)測方法取得的感應(yīng)性曲線下面積為0.798,其預(yù)測性能高于其他同類方法。進一步對每種癌癥的潛在相關(guān)miRNA進行挖掘,結(jié)果發(fā)現(xiàn)在所有癌癥的排名前5的候選miRNA中,71%的預(yù)測結(jié)果都可以得到實驗證據(jù)的支持。
 ?。?)提出了一個新的度量miRNA功能相似程度的策略。該策略利用miRNA引文的文本相似性來推

4、測miRNA在功能上的相似程度,并在此基礎(chǔ)上挖掘潛在的疾病與miRNA的關(guān)聯(lián)。首先通過對MEDLINE摘要進行挖掘,構(gòu)建了一個涵蓋了大量miRNA(共1,007個)的功能相似性數(shù)據(jù)集。分析發(fā)現(xiàn),該分值符合生物學(xué)假設(shè),能有效反映miRNA表達(dá)相似性的變化趨勢以及區(qū)分疾病與非疾病的miRNA對。之后根據(jù)該相似性分值構(gòu)建miRNA功能相似性網(wǎng)絡(luò),最終應(yīng)用重啟型隨機游走算法對潛在的miRNA與疾病的關(guān)聯(lián)進行挖掘。交叉驗證結(jié)果顯示,這種預(yù)測方法具

5、有較高的預(yù)測性能。另外,本方法對潛在與結(jié)腸癌、子宮內(nèi)膜癌、肺癌以及心肌病相關(guān)的miRNA預(yù)測的大部分結(jié)果存在實驗數(shù)據(jù)支持。與現(xiàn)有的miRNA功能相似性度量標(biāo)準(zhǔn)相比,本研究提出的基于文本的miRNA功能相似性的度量方法具有更廣泛的應(yīng)用范圍、更高的可靠性和更優(yōu)越的挖掘潛在疾病miRNA的能力等優(yōu)點。
  (3)除了人類疾病相關(guān)miRNA預(yù)測之外,本文還重點研究了植物的復(fù)雜農(nóng)藝性狀。本文對全基因組育種模型在油菜開花期性狀中的應(yīng)用進行了評

6、測,并對相關(guān)位點進行了定位及功能分析。首先構(gòu)建了高通量、高密度的甘藍(lán)型油菜全基因組SNP數(shù)據(jù)集,對三個種植地的十個自然環(huán)境下的油菜開花期性狀進行了分析。利用該數(shù)據(jù)集對現(xiàn)有的全基因組預(yù)測模型(包括線性模型、半?yún)?shù)模型以及機器學(xué)習(xí)模型等)在多個自然環(huán)境下的油菜開花期的預(yù)測效果進行評測。結(jié)果表明,所有模型都取得了較高的精度,驗證了全基因育種模型在油菜中的可行性。隨后,基于綜合了同一種植地多個自然環(huán)境的育種值,利用隨機森林模型對多地區(qū)的油菜開花

7、期性狀進行了全基因組定位,并應(yīng)用多元自適應(yīng)回歸樣條法對上位效應(yīng)進行分析。在全基因組范圍內(nèi)發(fā)現(xiàn)435個顯著的開花期性狀相關(guān)的SNP,其中部分SNP定位在已知開花期基因中,而在部分已知的開花期相關(guān)基因間存在上位效應(yīng)。功能分析結(jié)果表明被這些SNP標(biāo)記的基因大多參與了花形成的生物學(xué)過程。
 ?。?)結(jié)合蛋白質(zhì)互作網(wǎng)絡(luò)、基因調(diào)控網(wǎng)絡(luò)以及高密度的全基因組SNP數(shù)據(jù),采用基于網(wǎng)絡(luò)方法對甘藍(lán)型油菜的含油量性狀進行了全基因組定位。結(jié)果表明,與傳統(tǒng)的

8、單變量檢測方法相比,這種基于網(wǎng)絡(luò)的方法具有更高的再現(xiàn)率及可靠性,可以發(fā)現(xiàn)多環(huán)境共有的遺傳因子。此外,在基于該方法得到的與含油量相關(guān)的候選基因中,與油分積累機制相關(guān)的生物學(xué)過程顯著富集,還發(fā)現(xiàn)了一些與溫度刺激反應(yīng)有關(guān)的顯著功能注釋,印證了油菜的含油量性狀與環(huán)境因素有關(guān)。
  綜上所述,本研究利用多種手段,分析了人類疾病及植物的農(nóng)藝性狀等復(fù)雜性狀,并基于此開發(fā)了多種方法用于癌癥基因的預(yù)測以及對油菜的開花期及含油量性狀的定位。本研究有望

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論