癌癥基因組遺傳和表觀遺傳數(shù)據(jù)整合分析.pdf_第1頁
已閱讀1頁,還剩125頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、腦膠質(zhì)瘤是由一系列遺傳變異和環(huán)境干擾的復(fù)雜交互作用引起的。過去的研究很少關(guān)注遺傳變異、基因表達和microRNA的變化是怎樣整合形成網(wǎng)絡(luò)一起作用并最終導(dǎo)致一系列復(fù)雜表型例如腦瘤的發(fā)生。我們以美國癌癥基因組圖譜項目旗艦計劃產(chǎn)生的腦膠質(zhì)瘤數(shù)據(jù)為基礎(chǔ)展開研究,使用了包括601個基因在179對樣本中突變數(shù)據(jù)信息;12042個基因在243個腦膠質(zhì)瘤腫瘤組織、10個癌旁正常組織和1個細胞系中的表達數(shù)據(jù);470個microRNA(miRNA)在240

2、個腫瘤組織和10個癌旁正常組織的表達數(shù)據(jù)來進行分析。結(jié)果發(fā)現(xiàn)了與腦瘤相關(guān)的14個體細胞突變,其中8個是新發(fā)現(xiàn)的。同時發(fā)現(xiàn)了11個與腦瘤相關(guān)的LOH突變基因。其中9個突變基因與GBM的關(guān)系是首次報道。通過基因共表達網(wǎng)絡(luò)分析,我們發(fā)現(xiàn)了15個對網(wǎng)絡(luò)功能非常重要的基因,其中大部分是癌癥相關(guān)的基因。我們也構(gòu)建了microRNA共表達網(wǎng)絡(luò),發(fā)現(xiàn)了19個重要的microRNA,其中3個microRNA與腦瘤病人的生存期有關(guān)。我們將基于序列的預(yù)測方法

3、與表達負相關(guān)的方法相結(jié)合,發(fā)現(xiàn)了3953個預(yù)測的miRNA-靶標(biāo)基因?qū)?14個已被文獻發(fā)表的實驗驗證。使用通路富集分析我們發(fā)現(xiàn)19個重要miRNA靶向調(diào)控的那些基因主要參與癌癥相關(guān)的信號通路、視感知器傳遞和神經(jīng)系統(tǒng)相關(guān)的過程。我們進行了表達數(shù)量性狀(eQTL)分析,連接突變、表達和腦瘤表型相關(guān)的通路。對于體細胞突變,我們發(fā)現(xiàn)了4個基因順式數(shù)量性狀區(qū)間(cis-eQTL):TP53EGFR,NF1和PIK3C2G;262個基因反式數(shù)量性狀

4、區(qū)間(Irans-eQTL)以及26miRNA反式數(shù)量性狀區(qū)間。對于LOH突變,我們發(fā)現(xiàn)2個基因順式數(shù)量性狀區(qū)間:NRAP和EGFR;409個基因反式數(shù)量性狀區(qū)間以及27個miRNA反式數(shù)量性狀區(qū)間。我們的結(jié)果表明多維數(shù)據(jù)的整合分析能夠幫助我們揭開腫瘤發(fā)生和進展的機制。
  拷貝數(shù)變化是基因組上一段區(qū)域長度約為1KB~3MB的重復(fù)或者缺失,被認為是癌癥發(fā)生的重要風(fēng)險因子。我們采用了癌癥基因組圖譜項目Affymetrix Genom

5、e-Wide Human SNP Array 6.0芯片產(chǎn)生的221個腫瘤樣本,28個癌旁正常組織樣本數(shù)據(jù)來進行分析。我們使用改進的隱馬爾科夫模型從芯片的906600個CNV標(biāo)記檢測出163024 CNV區(qū)間。關(guān)聯(lián)檢驗發(fā)現(xiàn)有104個CNV區(qū)間在腦膠質(zhì)瘤病例對照組中差異明顯(Bonferroni矯正P值<3.70E-7)。我們以基因和通路為單位對CNV區(qū)間進行了分組關(guān)聯(lián)檢驗。檢測出169個和腦膠質(zhì)瘤顯著相關(guān)的基因(P值<4.77E-6),

6、其中包括原癌基因BCAS1,抑癌基因CAMTAl,APC和CSMD1,轉(zhuǎn)錄因子ELF2,和轉(zhuǎn)錄激活基因ETVl,CREB5和ZHX3。我們進而找出了15個腦瘤顯著相關(guān)的通路(FDR<0.05)。這些通路包括:細胞色素P450介導(dǎo)的異源物質(zhì)代謝通路,鈣離子信號通路,軸突導(dǎo)向通路,大腸癌通路,緊密連接(Tight junction)通路,elF2調(diào)控通路,雙鏈RNA誘導(dǎo)的基因表達通路,腦膠質(zhì)瘤通路,聚糖結(jié)構(gòu)合成,Jak-STAT信號通路,細

7、胞色素P450藥物代謝通路,角質(zhì)形成細胞分化通路,端粒酶RNA元件基因(hTerc)轉(zhuǎn)錄調(diào)控,經(jīng)Akt/mTOR調(diào)節(jié)的骨骼肌肥大通路,BCR信號通路。同時我們進行了CNV與基因表達和miRNA表達之間的數(shù)量性狀區(qū)間分析,結(jié)果發(fā)現(xiàn)這169個基因里的拷貝數(shù)變化顯著影響到19microRNAs和410個基因的表達。其中3個差異表達的microRNA和90個差異表達的基因被18個包含拷貝數(shù)的基因調(diào)控。這些結(jié)果為發(fā)現(xiàn)腦膠質(zhì)瘤的發(fā)病機制及其藥物靶標(biāo)

8、提供了重要線索。
  基因表達受到突變、SNPs、CNVs等遺傳學(xué)因素和miRNA、甲基化、組蛋白修飾等表觀遺傳學(xué)變化的調(diào)節(jié)。理解遺傳和表觀遺傳學(xué)變異對基因表達調(diào)控的一個重要問題是估計SNPs、CNVs、甲基化和miRNA變化對基因表達貢獻的比例。之前比較流行的估計各種因素對表達貢獻的方法主要是通過單變量回歸來實現(xiàn)的,但存在單個變量遺傳效應(yīng)很小,但聯(lián)合起來對表性差異貢獻很大的情況,而且單變量分析也忽視了不同變量之間的相互作用。本文

9、將擴展使用所有SNPs來解釋對數(shù)量性狀貢獻的方法,估計所有基因組學(xué)和表觀組學(xué)變異對于基因表達的貢獻??捎玫倪z傳和表觀遺傳學(xué)信息包括上百萬的SNPs的基因型、上百萬的CNVs標(biāo)記的拷貝數(shù)、幾萬個甲基化位點變化值和幾百個miRNA的表達量。超高維的變量對數(shù)據(jù)分析產(chǎn)生了巨大的挑戰(zhàn),本文采用稀疏流形學(xué)習(xí)的局部線性嵌入算法對高維變量進行降維,然后用降維后的數(shù)據(jù)作為輸入變量進行LASSO回歸分析來估計因素對基因表達的貢獻。我們將本方法用于TCGA項

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論