![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/17/82db2bda-d428-46b3-bfc6-3da081aee0d9/82db2bda-d428-46b3-bfc6-3da081aee0d9pic.jpg)
![基于序列模式的頻繁自由樹挖掘算法研究.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/17/82db2bda-d428-46b3-bfc6-3da081aee0d9/82db2bda-d428-46b3-bfc6-3da081aee0d91.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數據挖掘(Data Mining,DM)是從大型數據庫或數據倉庫中提取隱含的、未知的、非平凡的及有潛在價值的信息或者模式。在數據挖掘概念提出以來十幾年間,數據挖掘技術得到日益的重視和廣泛的應用、研究。因此,作為數據挖掘重要分支的頻繁項目集和關聯規(guī)則的挖掘,更是引起了廣泛的關注且得到的較大的研究、發(fā)展。
隨著數據挖掘應用領域的不斷擴大和涉及到的數據種類的增多,特別是網絡技術的發(fā)展,面向傳統領域的結構化關系數據庫和事務數據庫的挖掘
2、技術,不能滿足非傳統領域的數據挖掘技術的要求,比如:半結構化數據類型和非結構化數據類型。而這些數據類型在生物信息學、Web挖掘、化合物結構分析等領域有著廣泛的應用。本文對面向非結構化數據——樹和無環(huán)圖的挖掘技術進行了深入的研究和分析。主要工作包括:
首先,對數據挖掘技術的相關背景知識進行深入的介紹和分析。其中,重點闡述數據挖掘技術的一個重要分支——關聯規(guī)則挖掘。綜述關聯規(guī)則挖掘的不同種類,并對其中的頻繁項集挖掘做了全面深入的介
3、紹。
其次,對面向樹結構的挖掘技術主要算法作了歸類,并比較兩大類算法的效率,得出結論深度優(yōu)先的算法效率較高。這樣為本文的研究方向找準了的切入點,在后面作者的算法采用的是面向深度優(yōu)先,垂直搜索的方式。然后,分析當前采用深度優(yōu)先算法中效率較高的兩個經典算法,TreeMiner和FreeTreeMiner,總結和分析它們的優(yōu)缺點,并為作者后續(xù)算法所用。
然后,對面向無環(huán)圖(自由樹)類型的算法作了規(guī)劃,共分4個步驟:(1)尋
4、找自由樹的中心點,對此,作者提出高效的LWA(Longest Way Algorithm)算法,并證明該算法的正確性和高效性。(2)對有根無序樹作規(guī)范化,作者在這里提出規(guī)范化算法 Canonicalization,并分析此算法的時間復雜度,證明其時間復雜度與當前效率最高的同類算法相當。(3)挖掘頻繁序列模式,作者把“同分異構”的思想引入頻繁序列挖掘,較大幅度的提高算法的速度效率。(4)引入索引的方法挖掘具有相同序列的不同結構的頻繁子樹。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于約簡頻繁模式樹的頻繁模式挖掘及查詢算法研究.pdf
- 基于頻繁模式樹的最大頻繁項目集挖掘算法研究.pdf
- 基于頻繁模式樹的最大頻繁項集挖掘算法研究.pdf
- 基于時間間隔的事件序列頻繁模式挖掘算法研究
- Web日志頻繁序列模式挖掘算法研究.pdf
- 基于時間間隔的事件序列頻繁模式挖掘算法研究.pdf
- 基于FP-樹的最大頻繁模式挖掘算法研究.pdf
- 基于命題邏輯的頻繁序列模式挖掘算法的研究.pdf
- 基于CUDA的字符序列模式匹配與頻繁模式挖掘算法的研究.pdf
- 基于頻繁模式樹的XML數據挖掘.pdf
- 基于Hadoop的頻繁模式挖掘算法研究.pdf
- 基于陣列的頻繁模式挖掘算法研究.pdf
- 不確定數據中頻繁序列模式挖掘算法的研究.pdf
- 基于頻繁訪問模式樹的Web使用挖掘研究.pdf
- 生物序列近似頻繁模式挖掘研究.pdf
- 基于WEB日志挖掘的頻繁模式挖掘算法研究.pdf
- 基于序列編碼頻繁子樹挖掘算法研究.pdf
- 基于FP-樹的頻繁模式和長模式挖掘.pdf
- 頻繁模式挖掘算法研究.pdf
- 基于時間序列的頻繁模式挖掘研究與應用.pdf
評論
0/150
提交評論