版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、隨著功能基因組學的飛速發(fā)展,對非編碼轉(zhuǎn)錄產(chǎn)物功能的研究引起越來越多人的關注。人類基因組中超過98%的序列為非蛋白質(zhì)編碼DNA,這些非編碼DNA序列大部分會轉(zhuǎn)錄成RNA,并且直接以RNA的形式發(fā)揮功能,參與基因的轉(zhuǎn)錄調(diào)控、蛋白質(zhì)的翻譯等重要的生物學功能。而且近年來人們發(fā)現(xiàn)非編碼RNA往往與疾病、DNA損傷修復、植物的應激反應有關。
隨著RNA數(shù)據(jù)的積累,細胞核基因組編碼的短鏈或長鏈非編碼RNA(Non-coding RNA,nc
2、RNA)被確認對線粒體的功能以及線粒體動力學有一定的調(diào)節(jié)作用。許多ncRNAs一方面調(diào)控與細胞器功能相關的核基因,同時也與線粒體的形態(tài)、新陳代謝,線粒體自噬以及與線粒體有關的凋亡有關。然而,人們對遺傳信息在不同細胞器間以ncRNAs形式傳遞的了解長期以來仍然有限。因此,理解細胞器之間的ncRNAs信息傳遞顯得非常重要。隨著ncRNA研究在細胞器基因組水平的日益深入,發(fā)現(xiàn)對不同細胞器基因組轉(zhuǎn)錄的ncRNA的識別有助于進一步了解不同細胞器基
3、因組ncRNA的功能。本研究在細胞器基因組水平對不同細胞器基因組轉(zhuǎn)錄的ncRNAs的注釋問題進行了系統(tǒng)的研究,包括構建細胞器基因組水平不同定位信息的非編碼RNAs數(shù)據(jù)集、結合ncRNA序列和結構特征提取有效的特征參數(shù)并對參數(shù)進行優(yōu)化、預測算法的建立以及算法的推廣等。
積累的組學數(shù)據(jù)所呈現(xiàn)的基因水平的復雜性很難從蛋白質(zhì)編碼基因數(shù)量的角度加以解釋,為此,有人認為長期以來被認為是垃圾的、缺乏蛋白質(zhì)編碼能力的ncRNA的調(diào)節(jié)作用可以解
4、釋這種現(xiàn)象。其中,微小RNAs(microRNAs,miRNAs)和小干涉RNAs(siRNAs)一致被認為在生物的調(diào)控功能中扮演重要角色。本論文最后,以microRNA為例,研究非編碼RNA與靶基因?qū)θ橄侔┑陌l(fā)生、發(fā)展的調(diào)控作用。考慮到多個microRNA對靶基因存在協(xié)同調(diào)控作用,我們選取在乳腺癌中起抑癌作用的miR-17-92基因簇及其2個旁系同源基因簇轉(zhuǎn)錄的15種microRNA序列及其共調(diào)控靶基因作為研究對象,對基因簇轉(zhuǎn)錄的mi
5、croRNA序列特征及其共調(diào)控靶基因在乳腺正常組織和乳腺癌組織中的調(diào)控作用進行研究。論文主要的研究內(nèi)容如下:
一、我們首次從NONCOGING v3.0數(shù)據(jù)庫中收集并整理出有細胞器基因組注釋的ncRNA序列,并對序列長度分布進行分析。考慮到序列相似性對預測的影響,進一步采用Cd-hit軟件構建了序列相似性在80%以下的數(shù)據(jù)集ncRNA_361 dataset。從最簡單的堿基物理化學特性出發(fā),討論不同細胞器基因組轉(zhuǎn)錄的ncRNA
6、序列的理化特性。在此基礎上進一步考慮閱讀框下的n-mer組分偏好,結構-序列模式下三聯(lián)體組分,以及簡并密碼子偏好。通過深入探討無閱讀框與閱讀框?qū)ψR別不同細胞器基因組轉(zhuǎn)錄的ncRNA序列的影響,發(fā)現(xiàn)最優(yōu)閱讀框為第一閱讀框。
二、考慮到ncRNA的結構信息更能反映ncRNA執(zhí)行功能時的空間構象,而保守模體反映了序列在長期進化過程中的壓力。我們首次提取ncRNA序列的拓撲二級結構特征和保守模體作為在細胞器基因組水平識別ncRNA的特
7、征參量。特征的融合不可避免會帶來維數(shù)的增加,我們結合前人的經(jīng)驗,提出兩種不同的降維方法:一是特征的降維映射,二是基于mRMR的增加特征選擇(IFS)的方法,即選取最優(yōu)特征子集。結合目前較為流行的離散增量算法(increment of diversity classifier, ID)、K緊鄰算法(K-nearest neighbor classifier,KNN)以及支持向量機算法(support vector machine,SVM)
8、提出多算法的融合:改進的離散量結合K緊鄰算法(the improved K-minimum increment of diversityclassifier, iK-MID)、高效的平均K緊鄰算法(the improved K-nearest neighborclassifier, iKNN)以及離散增量結合支持向量機算法(the increment of diversitycombining support vector machin
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于二級結構的非編碼RNA挖掘方法研究.pdf
- 32120.禾本科植物抗病基因組及細胞器基因組進化模式研究
- 葉綠體基因工程與植物細胞器基因組進化研究.pdf
- 基于高通量測序的玉米基因組組裝和水稻長非編碼RNA識別與分析.pdf
- 基于宏基因組編碼的個體特征識別研究.pdf
- 卵巢癌順鉑耐藥相關基因間長非編碼RNA.pdf
- 高通量測序篩選肝癌細胞中受Dicer調(diào)節(jié)的非編碼RNA.pdf
- 利用基因組編輯技術研究非編碼RNA的關鍵轉(zhuǎn)錄調(diào)控元件.pdf
- 登革病毒非編碼3’亞基因組RNA的鑒定與功能分析.pdf
- 基于RNA-Seq數(shù)據(jù)識別神經(jīng)母細胞瘤中的環(huán)形RNA.pdf
- 全基因組功能性非編碼RNA篩選系統(tǒng)的構建與驗證.pdf
- 基于機器學習算法的非編碼RNA識別.pdf
- 主要細胞器的結構和功能
- 基因和基因組結構分析.pdf
- RNA二級結構的計數(shù).pdf
- 各種細胞器的結構和功能
- 含假結RNA二級結構圖的語法及拓撲分類.pdf
- 家蠶基因組中50-500nt非編碼RNA的發(fā)現(xiàn)鑒定及表達譜研究.pdf
- 基于二級結構的MicroRNA識別.pdf
- 登革病毒C基因RNA二級結構及編碼蛋白在病毒復制中的作用.pdf
評論
0/150
提交評論