版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著計算機科學的逐步成熟和信息社會需求的提高,人們需要在日益龐大的信息中發(fā)現(xiàn)對決策有用的知識,數(shù)據(jù)挖掘作為一門新興的交叉學科應(yīng)運而生;隨著信息技術(shù)的高速發(fā)展和互聯(lián)網(wǎng)逐漸深入和廣泛的應(yīng)用,人們所面對的信息越來越多地包含以流的形式產(chǎn)生的數(shù)據(jù),數(shù)據(jù)挖掘不僅僅需要處理存放在數(shù)據(jù)庫中的那些“過時”的靜態(tài)數(shù)據(jù),而且面對著一種新的數(shù)據(jù)形式——在線實時數(shù)據(jù)流。數(shù)據(jù)流是由一系列連續(xù)且有序的數(shù)據(jù)組成的序列,具有數(shù)據(jù)量無限、到達速度快、不可再現(xiàn)等特點。因此,
2、如何有效地處理數(shù)據(jù)流,成為數(shù)據(jù)挖掘面臨的新挑戰(zhàn),也得到這一研究領(lǐng)域的廣泛關(guān)注。 由于存儲空間的有限性與數(shù)據(jù)流的無限性,使得存儲數(shù)據(jù)流中的全部數(shù)據(jù)以提供精確的挖掘結(jié)果是不實際的。因此,在數(shù)據(jù)流處理模型中,數(shù)據(jù)流挖掘算法只存儲數(shù)據(jù)流的概要信息,并隨著流中數(shù)據(jù)不斷到來,不斷更新流概要,同時根據(jù)用戶的查詢要求,利用所維護的數(shù)據(jù)流概要信息,為用戶提供近似的查詢結(jié)果。 數(shù)據(jù)挖掘中聚類分析是一個重要的課題,并在數(shù)據(jù)挖掘的發(fā)展趨勢中發(fā)揮
3、著重要的作用。數(shù)據(jù)挖掘技術(shù)是面向應(yīng)用的,它最終需要應(yīng)用到現(xiàn)實世界中的數(shù)據(jù)上,而真實數(shù)據(jù)往往具備許多屬性,這就造成數(shù)據(jù)挖掘所處理的往往是多維數(shù)的數(shù)據(jù)。針對數(shù)據(jù)的多維性,不同的聚類算法采取了不同的處理技術(shù)。 針對多維數(shù)據(jù)流的聚類算法必須滿足更高的要求,在處理多維數(shù)數(shù)據(jù)的同時,還要保證算法的時間、空間效率以適應(yīng)數(shù)據(jù)流。對此,本文主要進行具有多維數(shù)的數(shù)據(jù)流環(huán)境下的聚類分析方法的研究,研究內(nèi)容可概括為以下三個方面: (1)針對多維
4、數(shù)據(jù)流的特點,探討了數(shù)據(jù)流挖掘中的窗口機制,分析了典型的多維數(shù)據(jù)流聚類算法CellTree算法的優(yōu)缺點,提出了一種新的內(nèi)存模型結(jié)構(gòu)LISTTREE。 (2)基于數(shù)據(jù)結(jié)構(gòu)LISTTREE提出一種新的多維數(shù)據(jù)流聚類算法LTC,并利用多線程編程方法極大程度地模擬在線處理數(shù)據(jù)流,以檢驗新算法。 (3)對CellTree算法和LTC算法進行了對比實驗,通過對實驗結(jié)果詳細全面的比較,分析了這兩個算法的效率和聚類效果。 實驗表
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 多維數(shù)據(jù)流聚類算法的分析與實現(xiàn).pdf
- 基于數(shù)據(jù)流的聚類算法研究與實現(xiàn).pdf
- 數(shù)據(jù)流挖掘中聚類算法的研究與實現(xiàn).pdf
- 面向數(shù)據(jù)流的數(shù)據(jù)聚類算法研究.pdf
- 基于數(shù)據(jù)流的聚類算法研究.pdf
- 數(shù)據(jù)流聚類算法及其應(yīng)用.pdf
- 數(shù)據(jù)流混合屬性聚類算法研究.pdf
- 面向主題的數(shù)據(jù)流聚類算法研究.pdf
- 面向數(shù)據(jù)流的優(yōu)化聚類算法研究.pdf
- 基于網(wǎng)格的數(shù)據(jù)流聚類算法研究.pdf
- 基于蟻群算法的數(shù)據(jù)流聚類算法.pdf
- 基于網(wǎng)格與密度的數(shù)據(jù)流聚類算法研究.pdf
- 面向不確定數(shù)據(jù)流的聚類算法分析.pdf
- 基于網(wǎng)格的并行聚類算法及數(shù)據(jù)流聚類算法研究.pdf
- 數(shù)據(jù)流聚類算法及其應(yīng)用的研究.pdf
- 基于密度的數(shù)據(jù)流聚類挖掘算法.pdf
- 面向混合屬性的數(shù)據(jù)與數(shù)據(jù)流聚類算法研究.pdf
- 基于蜂群算法的數(shù)據(jù)流聚類研究.pdf
- 基于滑動窗口的XML數(shù)據(jù)流的聚類算法研究與實現(xiàn).pdf
- 基于分形的數(shù)據(jù)流聚類算法研究
評論
0/150
提交評論