已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著互聯(lián)網的快速發(fā)展,網上的信息也成幾何級數爆炸增長,同時用戶對信息的需求也越來越高,他們希望搜索引擎提供最新的數據,最符合要求的信息。傳統(tǒng)網絡爬蟲作為提供搜索引擎原始信息的最基本途徑,其性能已經幾乎達到瓶頸,逐漸無法適應新型的網絡應用需要。
本文研究了現(xiàn)有的網絡爬蟲模型及其目前的研究方向,介紹了各種對傳統(tǒng)網絡爬蟲的改進方法,并對各種方法的優(yōu)缺點進行了詳盡的分析,總結了爬蟲面臨的主要挑戰(zhàn),如網頁更新收錄慢,網站訪問壓力大,無法
2、處理多媒體文件等。為解決這些問題,本文提出一種基于P2P的被動式爬蟲系統(tǒng),從根本上摒棄了傳統(tǒng)爬蟲的工作模式,它通過客戶端-服務器模式由網站推送數據,搜索引擎只負責接收,并且借助于智能體技術和P2P傳輸,提高了搜索引擎原始網頁獲取能力。
該被動式爬蟲分為爬蟲客戶端和爬蟲服務器兩部分,其主要功能有:客戶端和服務器相互發(fā)現(xiàn)及注冊,客戶端監(jiān)視網站目錄更新,客戶端預處理數據并安排傳輸時間,客戶端與服務器數據傳輸。本文在全能體技術平臺的層
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于p2p網絡爬蟲設計——爬行模塊設計---畢業(yè)論文
- 基于P2P網絡的匿名通信系統(tǒng).pdf
- 新型P2P僵尸網絡的研究——半分布式P2P僵尸網絡.pdf
- 基于P2P的網絡備份系統(tǒng)的設計.pdf
- 基于P2P網絡的分離聲譽系統(tǒng)模型.pdf
- 基于P2P系統(tǒng)的網絡蠕蟲傳播研究.pdf
- 基于P2P網絡的IPTV系統(tǒng)研究.pdf
- 基于P2P的SIP網絡研究.pdf
- 基于P2P的網絡存儲系統(tǒng)的研究.pdf
- P2P分布式網絡文件傳輸系統(tǒng).pdf
- 基于P2P的分布式網絡數據管理.pdf
- 一種基于P2P技術的分布式微博爬蟲系統(tǒng).pdf
- 基于P2P的分布式網絡故障監(jiān)測系統(tǒng)的研究.pdf
- 基于P2P網絡流媒體點播系統(tǒng)的研究.pdf
- 基于網絡編碼的P2P點播系統(tǒng)研究.pdf
- 基于Chord的層次式P2P網絡模型的研究.pdf
- 基于網絡編碼的P2P覆蓋網絡研究.pdf
- 基于P2P網絡信任機制研究.pdf
- P2P系統(tǒng)網絡路由協(xié)議的研究.pdf
- 基于P2P網絡的RP私密保護.pdf
評論
0/150
提交評論