![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/91a74bd9-567e-4e58-ad49-d718560af020/91a74bd9-567e-4e58-ad49-d718560af020pic.jpg)
![異構信息網(wǎng)絡上的主題建模研究.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/91a74bd9-567e-4e58-ad49-d718560af020/91a74bd9-567e-4e58-ad49-d718560af0201.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著Web應用的蓬勃發(fā)展,現(xiàn)實世界中存在大量的對象,它們相互之間存在各種各樣的交互關系,形成一個龐大的、相互聯(lián)系的復雜網(wǎng)絡,我們稱這個網(wǎng)絡為信息網(wǎng)絡?,F(xiàn)實中,信息網(wǎng)絡無處不在,并且成為現(xiàn)代信息基礎設施的一個重要部分。為了更好地理解信息網(wǎng)絡及其特性,信息網(wǎng)絡分析技術已經(jīng)引起了人們的關注,而且廣泛地應用于數(shù)據(jù)挖掘、數(shù)據(jù)分析等領域。
當信息網(wǎng)絡中的對象和鏈接都是單類型時,稱為同構信息網(wǎng)絡。比如DBLP作者合作網(wǎng)絡中對象僅代表作者,鏈
2、接僅代表作者之間的合作關系。當信息網(wǎng)絡中的對象或鏈接是多種類型時,稱為異構信息網(wǎng)絡。比如在DBLP文獻網(wǎng)絡中有三種類型的對象,即論文、作者和會議,兩種類型的鏈接,即論文和作者之間“寫”與“被寫”的關系,論文和會議之間“發(fā)表”與“被發(fā)表”的關系。到目前為止,在同構信息網(wǎng)絡分析的研究中已經(jīng)有了很多有影響的算法和應用,如PageRank算法,HITS算法,社區(qū)發(fā)現(xiàn)等。但是,現(xiàn)實世界中的網(wǎng)絡大都是異構信息網(wǎng)絡,其中不同類型對象間的復雜聯(lián)系揭示了
3、更重要的結構語義信息,所以異構信息網(wǎng)絡研究成為數(shù)據(jù)挖掘中一個新的研究熱點。
主題建模是文檔分析的一種重要的方法,它能夠發(fā)現(xiàn)隱藏在文檔集中的潛在主題,并且廣泛地應用于機器學習和自然語言處理等領域。近些年來,文本文檔,如網(wǎng)頁、論文、博客等,越來越豐富,而且相互之間或與其他對象之間(如用戶)通過各種各樣的方式進行聯(lián)系,形成各種各樣的異構信息網(wǎng)絡。在異構信息網(wǎng)絡中,對象間的鏈接關系隱含著大量的網(wǎng)絡結構語義,對象本身也含有豐富的文本內容
4、。所以研究異構信息網(wǎng)絡上的主題建模技術是很有必要的。目前大多數(shù)的研究只關注同構信息網(wǎng)絡上的主題建模,對異構信息網(wǎng)絡上的主題建模研究尚不多見。
本文針對異構信息網(wǎng)絡上的主題建模問題展開研究,首先提出了一種使用潛在語義分析基于主題傳播的主題模型LSA-PTM,將文本內容和網(wǎng)絡結構結合在一起進行主題建模,在LSA-PTM基礎上,進一步考慮異構信息網(wǎng)絡和文本文檔兩者之間的主題內在一致性,本文又提出了一種更加優(yōu)化的統(tǒng)一主題模型cluTM
5、。本文的主要工作和貢獻總結如下:
1.提出一種使用潛在語義分析基于主題傳播的主題模型LSA-PTM,該模型提出一種主題傳播的方法將異構信息網(wǎng)絡融合到主題建模中,從而改進了主題建模的效果。對于建模出的主題,LSA-PTM為每個主題計算出一個主題描述以提高主題的可讀性。DBLP數(shù)據(jù)集上的實驗結果表明,較于其他幾種主流的主題模型,LSA-PTM取得了更好的效果.
2.提出一種融合內容和鏈接的統(tǒng)一的主題模型cluTM,該模型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 異構信息網(wǎng)絡上的相似性搜索研究.pdf
- 異構信息網(wǎng)絡檢索技術研究.pdf
- 基于元路徑的異構信息網(wǎng)絡挖掘方法研究.pdf
- 基于異構信息網(wǎng)絡的臨床用藥決策算法研究.pdf
- 極性異構信息網(wǎng)絡的聯(lián)系預測技術研究.pdf
- 基于異構信息網(wǎng)絡聚類的APP推薦算法研究.pdf
- 異構信息網(wǎng)絡分析模型及其應用研究.pdf
- 極性異構信息網(wǎng)絡相關性搜索技術研究.pdf
- 學術異構信息網(wǎng)絡中的作者合作關系預測.pdf
- 信息網(wǎng)絡異構數(shù)據(jù)交換技術研究與實現(xiàn).pdf
- 基于異構信息網(wǎng)絡的協(xié)同過濾推薦技術研究.pdf
- 信息網(wǎng)絡傳播法的研究
- 異構信息網(wǎng)絡Top-k相關性查詢方法研究.pdf
- 現(xiàn)代化公共物流信息網(wǎng)絡構建模型
- 信息網(wǎng)絡傳播視聽節(jié)目
- “信息網(wǎng)絡傳播權”初步研究.pdf
- 空間信息網(wǎng)絡的干擾問題研究.pdf
- 信息網(wǎng)絡安全試題
- 信息網(wǎng)絡傳播權保護研究.pdf
- 信息網(wǎng)絡傳播行為的侵權研究.pdf
評論
0/150
提交評論