![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/6/23/c3c6438b-80af-4f66-a1d8-ff9141f2f17b/c3c6438b-80af-4f66-a1d8-ff9141f2f17bpic.jpg)
![推特數(shù)據信息的查詢擴展方法研究.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/6/23/c3c6438b-80af-4f66-a1d8-ff9141f2f17b/c3c6438b-80af-4f66-a1d8-ff9141f2f17b1.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著互聯(lián)網的迅猛發(fā)展,在全球各地每時每刻都在產生大量的推特數(shù)據信息。如何在這大量數(shù)據中去篩選滿足用戶需求的信息變得尤為重要,查詢擴展方法在推文檢索中廣泛應用,可以有效的解決這一問題。
查詢擴展主要包含兩個部分:一是篩選與原始查詢詞相關的推文作為語料庫;二是篩選語料庫中與原始查詢最相關的詞語作為待擴展詞。傳統(tǒng)查詢擴展方法主要使用BM25算法,VSM算法以及TF-IDF算法等對原始查詢和推文進行相關性比較,篩選出滿足用戶需求的推文
2、作為語料庫。這種方法存在兩個不足:一是含有較少查詢詞的推文被漏選,二是含有較多查詢詞的不相關推文被錯誤的篩選。針對此問題本文在以下幾個方面進行研究和創(chuàng)新:
(1)提出基于推文聚類的查詢擴展方法,并對其進行設計和完成。該方法對篩選推文作為語料庫這一過程進行改進,并將傳統(tǒng)的逐條推文與原始查詢詞進行相關性比較的推文篩選方法進行優(yōu)化。該方法先對推文進行聚類,根據與原始查詢詞的相關性對聚好類的推文進行篩選,得到的推文集合包含了相同語義的
3、所有推文。再比較推文類與原始查詢的相關性,篩選出最滿足用戶需求的推文類。這一方法很好的解決了含有較少查詢詞的相關推文被漏選的問題。
該方法對比BM25算法對兩種不同的查詢擴展方法在平均準確率(mAP)上分別提升了11.4%和12.0%,比VSM算法分別提升了14.9%和15.3%,比TF-IDF算法分別提升了15.8%和13.7%。
(2)提出基于主題劃分的查詢擴展方法。通過對不相關推文中含有較多查詢詞而被篩選這一主
4、題偏移問題進行改進,使得含有查詢詞的不相關推文被有效的過濾。該方法將推文進行主題劃分,篩選出滿足用戶查詢的主題下的推文集合作為語料庫,有效的去除了含有查詢詞但并不屬于該主題的推文。
該方法對比BM25算法對兩種不同的查詢擴展方法在平均準確率(mAP)上分別提升了13.2%和13.9%,比VSM算法分別提升了16.7%和17.3%,比TF-IDF算法分別提升了17.7%和15.6%。
(3)經過分別對主題劃分方法和推文
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于用戶標注信息的查詢擴展方法研究.pdf
- 推特中的文本污染信息過濾方法研究.pdf
- 基于語義查詢擴展的信息檢索研究.pdf
- 信息檢索中的查詢擴展算法研究.pdf
- 金融信息精確檢索中本體構建與查詢擴展方法研究.pdf
- 信息檢索中的查詢擴展技術研究.pdf
- 基于緩存策略的查詢擴展方法研究.pdf
- 基于查詢日志的動態(tài)查詢擴展研究.pdf
- 跨語言信息檢索的查詢消歧及查詢擴展技術研究.pdf
- 信息檢索中的查詢擴展與檢索模型研究.pdf
- 搜索引擎中的查詢擴展方法研究.pdf
- 概率數(shù)據庫可擴展查詢技術.pdf
- 數(shù)據庫中關鍵詞的查詢擴展研究.pdf
- 推特中的特定事件檢測方法研究.pdf
- 信息檢索中的查詢擴展及相關技術研究.pdf
- 基于互信息的語義查詢擴展技術研究.pdf
- 基于自動查詢擴展的專利文檔檢索方法.pdf
- 支持OLAP的推特用戶興趣挖掘方法研究.pdf
- Skyline擴展查詢研究.pdf
- 基于領域本體的用戶查詢詞擴展方法的研究.pdf
評論
0/150
提交評論