![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/11/11/204a4e8a-f127-4de1-9ae5-79a54ea36df5/204a4e8a-f127-4de1-9ae5-79a54ea36df5pic.jpg)
![一種全基因組關聯(lián)分析模型的建立及在基因組選擇中的應用.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/11/11/204a4e8a-f127-4de1-9ae5-79a54ea36df5/204a4e8a-f127-4de1-9ae5-79a54ea36df51.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、全基因組關聯(lián)分析的應用到目前已經(jīng)有近10年時間,在解析人類復雜疾病及動植物復雜性狀的調(diào)控機制等方面發(fā)揮了巨大作用。在農(nóng)業(yè)發(fā)展中,從首個基因組選擇模型的提出到現(xiàn)在,已經(jīng)有17年時間。基因組選擇已經(jīng)在動物育種,尤其是奶牛育種中發(fā)揮出巨大的作用。隨著基因分型技術價格的降低,全基因組選擇技術也將在植物育種中占據(jù)重要位置。遺傳轉化技術,基因組編輯技術以及全基因組選擇技術將是未來育種領域三大主要技術。
基因組選擇將是精準農(nóng)業(yè)必要的技術基礎
2、。全基因組關聯(lián)分析和基因組選擇技術在應用過程中,也遇到一些問題。隨著對復雜性狀的深入理解,目前的關聯(lián)分析模型具有一定的局限性。包括:復雜性狀由多基因控制,但現(xiàn)在常用的模型是單位點模型;對稀有等位基因的檢測能力不強,通常直接忽略稀有等位基因;遺傳效應通常包括加性效應,顯性效應和上位互作效應等,但目前常見的是加性效應模型,包含非加性效應的模型較少;上位效應檢測能力較低,時間復雜度較高,用時較長;群體結構和其他潛在未知的關聯(lián)會導致假陽性;微效
3、多基因效應和連鎖不平衡導致統(tǒng)計上P值膨脹;遺傳力丟失問題等;在基因組選擇技術發(fā)展中,線性模型,貝葉斯類模型和機器學習模型是最主要的三類模型。線性模型中目前最常用基因組最佳無偏估計(gBLUP)模型,其他方法大多是基于此模型的優(yōu)化,但與該模型相比,很少在各種條件下都顯著的提高;針對不同的數(shù)據(jù),貝葉斯類模型的準確率與線性模型可能會有一些差異,但很少觀察到準確率明顯降低。但貝葉斯類模型的時間復雜度較高,對于百萬級別的標記,將會因其所需的時間過
4、長而導致失去應用的價值;機器學習類方法也具有同樣的問題;在軟件方面,目前有基于R語言的各種軟件包,和基于Linux系統(tǒng)的命令行軟件,但是缺少能夠方便育種工作者使用的圖形化界面軟件。
本研究的目標在于:開發(fā)一種多位點關聯(lián)分析模型,提高加性模型的檢測能力并且降低模型的假陽性率;并通過優(yōu)化算法,實現(xiàn)對加性效應和上位互作效應的聯(lián)合分析。使用R語言對該模型進行編程,并將該R軟件包發(fā)布在公共平臺;對基因組選擇準確率偏差的研究。在研究中發(fā)現(xiàn)
5、,對于基因組選擇準確率,不同的研究人員存在兩種不同的理解,而這種差異可能會產(chǎn)生一定的偏差,將對準確率計算重新定義并比較它們之間的區(qū)別和可能產(chǎn)生的偏差;提供一種基因組選擇圖形化界面軟件。將根據(jù)現(xiàn)有的研究基礎,使用JAVA語言開發(fā)一種進行基因組選擇分析的圖形化軟件的同時,再使用R語言重新編寫,提供對應的R軟件包,以方便育種家及相關科研工作者使用。本研究以一個酵母F2群體為對象,對關聯(lián)分析模型進行測試,進而系統(tǒng)分析模型的表現(xiàn);并對一個由中美3
6、6個重組自交系(RILs)組成的玉米NAM群體的開花期相關表型進行了分析等;利用擬南芥,玉米,小鼠和松樹四個物種的數(shù)據(jù)對基因組選擇準確率的偏差進行了研究。本研究的主要結果如下:
1.一種新的多位點混合效應關聯(lián)分析模型(HDGENE)。該模型首先利用逐步回歸對基因組進行單位點檢測,然后利用多位點混合效應模型EM-Bayesian LASSO對顯著的位點進行檢測,從而可以控制假陽性;EM-Bayesian LASSO模型依然顯著的
7、位點,將作為協(xié)變量加入到逐步回歸模型中進行迭代,該步驟可以提高分析的檢測能力。因此,HDGENE模型既可以提高檢測能力,也可以降低假陽性。為了提高模型對大數(shù)據(jù)的處理能力,首先通過利用基因組的連鎖不平衡,對基因型數(shù)據(jù)進行降維;其次,對逐步回歸模型進行了算法優(yōu)化,降低算法運行時間。優(yōu)化后的模型,可以實現(xiàn)全基因組兩位點上位互作分析。
2.EM-Baysian LASSO模型的檢測能力。通過對復雜表型的模擬,在模擬的情形下,EM-Ba
8、ysian LASSO模型具有80.6%的檢測能力(Power);而且EM-Baysian LASSO模型對大于5%的位點具有較強的檢測能力,接近100%,標記解釋的表型方差越低,檢測能力越差;同時,發(fā)現(xiàn)EM-BLASSO模型對效應值的估計是有偏的。
3.HDGENE加性模型具有較高的Power。利用酵母F2群體模擬的表型分析發(fā)現(xiàn),HDGENE平均檢測Power達到71.9%;同時具有與EM-Bayesian LASSO模型相
9、同的特點,對效應較高的位點具有良好的檢測能力。但是位點解釋的表型方差越低,檢測的Power就越低。同時,HDGENE加性模型的假陽性率(FDR)較低,僅7.0%;且假陽性位點解釋的表型方差低于1%。
4.HDGENE加性模型與現(xiàn)有模型的QTCAT模型相比,QTCAT模型的Power為52.2%,明顯低于HDGENE模型,同時假陽性率為8.8%,略高于HDGENE模型。
5.HDGENE上位效應模型具有較高的Power
10、。同樣利用酵母F2群體的進行模擬,模擬數(shù)據(jù)分析表明,HDGENE上位效應模型檢測的Power達到87.8%,高于R/QTL軟件包中互作模型的75.7%;但同時假陽性率達到13.9%,高于R/QTL的3.2%。
6.上位效應對玉米的開花期有一定的貢獻。玉米NAM群體的開花期數(shù)據(jù)分析表明,雖然利用混合模型估計的遺傳力較低,但是利用HDGENE模型發(fā)現(xiàn)較多的互作,并且檢測到11對互作位點,它們解釋的表型方差均在10%以上。
11、 7.基因組選擇準確率的重新定義。根據(jù)交叉驗證的特性,對重新定義了兩種準確率,分別為Hold和Instant準確率。并發(fā)現(xiàn)Hold及Instant準確率都存在理論上的偏差,實際使用過程中,在一定條件下可以使用Instant準確率;在特定條件下,為了避免較大的偏差,需要對Instant準確率進行校正。
8.iGS軟件的開發(fā):基于JAVA語言開發(fā)了基因組選擇圖形化界面軟件;同時編寫了R軟件包。該軟件包括gBLUP,EM-Bayes
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 一種新的HBV全基因組克隆技術的建立及應用.pdf
- 全基因組關聯(lián)研究中的多水平模型.pdf
- 貝類全基因組選擇技術建立及其在扇貝育種中的應用.pdf
- 復雜網(wǎng)絡分析方法在全基因組關聯(lián)研究中的應用.pdf
- 加權SNP集分析方法在全基因組關聯(lián)研究中的應用.pdf
- 一種新細菌Phenylobacterium zucineum的全基因組測序及初步分析.pdf
- 單細胞全基因組擴增聯(lián)合比較基因組雜交方法的建立及初步研究.pdf
- 一種交替運用固定效應和隨機效應模型優(yōu)化全基因組關聯(lián)分析的算法開發(fā).pdf
- 雞攻擊行為的全基因組關聯(lián)分析.pdf
- 基因、基因組和基因組學
- 10821.復雜網(wǎng)絡方法在全基因組關聯(lián)研究中的應用
- 玉米芽再生能力調(diào)控基因的全基因組關聯(lián)分析.pdf
- 整合功能注釋的全基因組選擇和關聯(lián)分析方法研究.pdf
- 基于線性混合模型的全基因組關聯(lián)分析的算法研究.pdf
- HBV相關肝病的全基因組關聯(lián)研究.pdf
- 油菜株型相關性狀的全基因組關聯(lián)分析.pdf
- 全基因組選擇在櫛孔扇貝(Chlamys farreri)育種中的應用.pdf
- 煙草煙堿含量的全基因組關聯(lián)分析及其候選基因預測.pdf
- 玉米全基因組ARF基因的分析及進化研究.pdf
- 楊樹全基因組WRKY基因的鑒定及表達分析.pdf
評論
0/150
提交評論