人工神經網絡技術和微粒群算法在文檔特征表示中的應用.pdf_第1頁
已閱讀1頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Internet技術的普及與發(fā)展使得國際互聯網日益成為當今信息資源最為豐富的計算機網絡,如何在互聯網上快速有效地搜索出所需要資源已成為人們普遍關心的問題之一。要實現信息的檢索首先需要將互聯網上的文檔信息與用戶檢索要求相比較,然后將滿足用戶要求的文檔呈現給用戶。在信息檢索中文檔信息在計算機中是用文檔特征來描述的,如何準確地表達文檔特征是信息檢索過程中的基礎。文檔特征表示是文本檢索領域研究的最重要的問題之一,它決定著文檔的分類與聚合,也最終

2、決定著文本檢索系統(tǒng)對用戶查詢的反應能力(查全率、查準率)。 信息檢索技術正朝著個性化、智能化的方向發(fā)展,個性與智能的信息檢索根據用戶的檢索要求將信息查詢結果反饋給用戶。本文分析了信息檢索中傳統(tǒng)文檔特征表示的布爾邏輯模型和向量空間模型的優(yōu)缺點:布爾邏輯模型雖機制簡單、容易實現,但是它的分類能力有限且邏輯表達式過于嚴格;向量空間模型將文檔映射到連續(xù)域向量空間,為進一步的權重計算等多元處理提供了基礎,但容易忽略文檔集合中各個文檔的一

3、些共有特征。本文在向量空間模型知識的基礎上分析了使用人工神經網絡計算文檔特征項權重的可行性;利用人工神經網絡對樣本集進行學習的功能、函數逼近功能、人工神經網絡的泛化能力以及文檔中各詞語的Zipf詞頻-詞序關系,在人工神經網絡的輸入端輸入各詞語的頻率,通過對人工神經網絡進行訓練、調整神經網絡權值和閾值來優(yōu)化網絡,最后由神經網絡輸出端獲得文檔特征項的權重。 群體智能是一種在自然界生物群體所表現出的智能現象啟發(fā)下提出的人工智能模式,

4、是對簡單生物群體的智能涌現現象的具體模式研究,模擬鳥群運動的微粒群算法是群體智能的典型實現模式之一。本文分析了用微粒群算法進行人工神經網絡訓練的原理:人工神經網絡的均方誤差作為微粒群算法的適應函數,并將人工神經網絡的連接權值和閾值與微粒群中的微粒進行向量空間映射。本文采用BP學習算法和微粒群優(yōu)化算法對相同結構人工神經網絡進行訓練,由仿真結果可知微粒群優(yōu)化算法訓練的神經網絡在對文檔特征項權重的仿真輸出較BP學習算法仿真輸出精確,該方法切實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論