面向概念檢索的農史信息門戶的設計與構建.pdf_第1頁
已閱讀1頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近幾年,農史領域又出現(xiàn)了一種新型的研究資料,即農史網(wǎng)絡信息資源,諸如數(shù)字化的農業(yè)古籍、農史論文題錄庫和全文庫、農史研究網(wǎng)頁/網(wǎng)站、數(shù)字博物館中的圖像視頻文件等。網(wǎng)絡中,多種類型的農史電子信息資源迅速激增,逐漸受到農史科研人員、教師、學生及愛好者的重視。為了解決農史網(wǎng)絡信息資源散亂、無序的問題,本文擬采用圖書館學、情報學信息組織的理論和方法,對農史學科信息門戶的設計和構建進行研究。 農史學科信息門戶的工作流程,包括資源采集、資源加

2、工和提供服務三個部分。因此,本文沿著這一流程,對農史學科信息門戶的設計和構建進行了研究和論述。首先,對國內外學科信息門戶的研究及建設現(xiàn)狀進行了介紹,對比分析了國內外著名學科信息門戶的差距,并對我國學科信息門戶的改進提出了建議,為農史學科信息門戶的完善和構建提供了借鑒;其后,對農史學科信息門戶的資源采集、資源加工過程中的資源描述和組織機制分別進行了研究;同時,為了克服普通搜索引擎基于關鍵詞字面檢索準確率低的問題,實現(xiàn)農史網(wǎng)頁的概念檢索,對

3、農史門戶網(wǎng)頁智能搜索引擎的設計和構建進行了研究和論述;最后,對農史學科信息門戶的用戶服務進行了研究,并介紹了農史學科信息門戶實驗網(wǎng)站的實現(xiàn)情況。 本文對農史學科信息門戶設計和構建的研究,綜合運用了文獻調研法、個案分析法、比較分析法及系統(tǒng)構建法等多種研究方法。本項研究的主要工作,包括以下幾個方面: (1)國內外學科信息門戶的對比分析。為了使將要構建的農史學科信息門戶更加完善,本文對SOSIG、BUBL LINK、LII、C

4、SDL學科信息門戶體系、CALIS重點學科網(wǎng)絡資源導航庫等10個國內外著名學科信息門戶的元數(shù)據(jù)框架、分類法和敘詞表的使用、瀏覽和檢索功能、增值服務等進行了對比分析,發(fā)現(xiàn)我國學科信息門戶仍存在著一些不足:所建成的學科信息門戶數(shù)量少,社會科學、人文科學領域還是空白;沒有利用規(guī)范的主題詞表對資源進行組織,無法實現(xiàn)概念檢索;用戶服務方式單一等。本文建議我國學科信息門戶:通過多種途徑開展學科信息門戶建設,擴大學科信息門戶的規(guī)模和數(shù)量;采用規(guī)范的主

5、題詞表對資源進行標引,并在門戶中提供詞表導航或主題詞轉換接口,以實現(xiàn)概念檢索;提供更加全面、完善的用戶服務,增加具有特色的個性化服務。 (2)農史網(wǎng)絡資源的選擇和收集研究。根據(jù)農史學科研究范圍和農史網(wǎng)絡資源的特點,研究和制訂了農史門戶網(wǎng)絡資源的選擇政策、評價標準,總結和探討了在因特網(wǎng)中收集和發(fā)現(xiàn)農史資源的方法和策略。 (3)農史敘詞表的構建及其在農史門戶中的使用方法研究。本文嘗試采用整合現(xiàn)有詞表、計算機自動構建、人工輔助

6、等多途徑相結合的方法構建可用于農史門戶資源描述和組織的農史敘詞表。其中計算機自動構建方法,綜合利用了模式匹配、字面相似度和語詞同現(xiàn)計算相關度等方法。通過多種方法構建得到一個覆蓋農史領域的、可揭示概念之間等同、等級和相關關系的農史敘詞表,包括農史詞條6581個,其中,敘詞3507個,非敘詞3074個。同時,在農史門戶網(wǎng)站中設計和構建了農史詞表引擎,為農史門戶資源標引人員和用戶提供概念檢索工具。 (4)農史學科信息門戶元數(shù)據(jù)框架設計

7、。按照標準、開放和可擴展的原則,根據(jù)農史學科信息門戶的用戶需求和門戶管理需要,以DC元數(shù)據(jù)集為基礎,制訂出了一套適用于農史學科信息門戶的、能有效幫助描述、識別、評估及管理農史網(wǎng)絡資源的元數(shù)據(jù)體系。包括描述型元數(shù)據(jù)和管理型元數(shù)據(jù)。其中描述型元數(shù)據(jù),結合用戶需求,對DC元數(shù)據(jù)進行了一定的擴展,增加了“推薦級別”、“資源評論”及“資源被點擊次數(shù)”三個元素;管理型元數(shù)據(jù)是按照農史門戶管理的需要自行設計的,包括記錄編目者、記錄編目日期和記錄更新日

8、期。 (5)農史門戶網(wǎng)頁智能搜索引擎的構建。農史門戶網(wǎng)頁智能搜索引擎包括農史網(wǎng)頁采集、網(wǎng)頁智能加工、檢索及用戶接口四個模塊。其中,農史網(wǎng)頁的采集,采取了利用WebZIP網(wǎng)頁離線瀏覽軟件,對農史門戶中經(jīng)過嚴格篩選的高質量農史網(wǎng)站中的網(wǎng)頁進行下載,作為農史門戶網(wǎng)頁智能搜索引擎的資源范圍;農史網(wǎng)頁智能加工包括網(wǎng)頁自動標引與自動分類,對于農史網(wǎng)頁自動分類,采用的是基于農吏類別詞知識庫的自動分類方法。同時,在對農史門戶網(wǎng)頁智能搜索引擎設計

9、和研究的基礎上,初步構建了農史門戶網(wǎng)頁智能搜索引擎和農史網(wǎng)頁自動標引與自動分類實驗系統(tǒng),實現(xiàn)了農史網(wǎng)頁的概念檢索。 (6)農史門戶用戶服務的設計和構建。根據(jù)農史科研人員、教師、學生及愛好者的信息需求,利用WEB2.0的思想和相關技術,對農史學科信息門戶的服務功能進行了設計。并利用ASP動態(tài)網(wǎng)站開發(fā)技術,初步構建了農史學科信息門戶實驗網(wǎng)站,為農史用戶提供農史資源分類目錄瀏覽、資源類型瀏覽、檢索、個性化定制、學科論壇、用戶推薦、用戶

10、反饋、資源評論、資源更新、學科最新動態(tài)、農史詞表引擎等細致、完善的服務。 本文的創(chuàng)新點主要體現(xiàn)在以下三個方面: (1)本項研究將農史領域的文獻整理研究從傳統(tǒng)文獻拓展和延伸到網(wǎng)絡環(huán)境下農史信息資源的整理和組織中。針對目前農史網(wǎng)絡資源分布散亂的現(xiàn)狀,本文對農史網(wǎng)絡信息資源的組織進行了研究。通過對網(wǎng)絡中有學術價值的、高質量農史資源進行收集、整理、加工和組織,為農史用戶提供一個獲取和交流學術資源的新平臺,提高農史網(wǎng)絡資源的有序性

11、和用戶對農史網(wǎng)絡資源的利用效率,推動農史研究的發(fā)展。 (2)在國內首次設計和構建了農史門戶。本文從農史學科教師、學生、研究人員及愛好者的信息需求出發(fā),結合農史學科的研究內容、研究熱點、發(fā)展趨勢,制訂和設計了規(guī)范、合理的農史門戶資源選擇和評價標準、資源發(fā)現(xiàn)策略、元數(shù)據(jù)框架以及知識組織系統(tǒng),將傳統(tǒng)情報檢索語言應用于農史門戶資源組織,利用WEB2.0的思想和相關技術,設計和構建了農史門戶實驗網(wǎng)站,為用戶提供多種形式的農史網(wǎng)絡資源服務和

12、資源發(fā)現(xiàn)工具。 (3)為了克服普通搜索引擎基于關鍵詞字面檢索準確率低的問題,實現(xiàn)農史網(wǎng)頁的概念檢索,本文將學科信息門戶與搜索引擎結合,充分利用農史門戶收集到的高質量網(wǎng)站和網(wǎng)頁自動標引與自動分類技術,設計和初步開發(fā)了基于農史門戶的網(wǎng)頁智能搜索引擎。 農史學科信息門戶的構建是一項復雜的系統(tǒng)工程。本文僅是對農史學科信息門戶構建的基本問題進行了探討和研究,尚有一些不足,同時,對于農史學科信息門戶的個性化服務和可持續(xù)發(fā)展等問題,仍

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論