![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/16/dee42191-ea19-4b39-a7f0-3ce20c55ba86/dee42191-ea19-4b39-a7f0-3ce20c55ba86pic.jpg)
![不確定數(shù)據(jù)集上的Skyline查詢(xún)處理算法研究.pdf_第1頁(yè)](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/16/dee42191-ea19-4b39-a7f0-3ce20c55ba86/dee42191-ea19-4b39-a7f0-3ce20c55ba861.gif)
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)本身存在不確定性、采集的隨機(jī)性及不精確性,如在地質(zhì)測(cè)量、天文觀測(cè)、氣象、傳感網(wǎng)絡(luò)、移動(dòng)對(duì)象搜索和數(shù)據(jù)集成等實(shí)際應(yīng)用中,由于復(fù)雜的外界因素的影響使得采集到的數(shù)據(jù)不確定、不完整和不精確。對(duì)這些不確定的海量數(shù)據(jù)集進(jìn)行挖掘時(shí),常規(guī)的方法是通過(guò)數(shù)據(jù)清洗、集成等預(yù)處理后再進(jìn)行挖掘。然而,經(jīng)過(guò)加工后的數(shù)據(jù)通常丟失了大量的原始信息,從而導(dǎo)致挖掘效果難于滿(mǎn)足需求。近年來(lái),出現(xiàn)了一種新型數(shù)據(jù)集-不確定數(shù)據(jù)集,即將源數(shù)據(jù)中的不確定性用概率(或置信度)表達(dá)
2、。不確定數(shù)據(jù)集上的數(shù)據(jù)挖掘也隨之成為近年來(lái)的研究熱點(diǎn)。其中不確定數(shù)據(jù)集上的Skyline挖掘是一個(gè)重要的研究領(lǐng)域。盡管Skyline挖掘獲得了廣泛的研究,但由于現(xiàn)有的方法沒(méi)有將數(shù)據(jù)集的不確定性考慮到計(jì)算模型中,因而無(wú)法實(shí)現(xiàn)現(xiàn)在該類(lèi)數(shù)據(jù)集上進(jìn)行Skylin挖掘。經(jīng)過(guò)廣泛細(xì)致的研究工作后,本文提出了有效的方法來(lái)解決該類(lèi)問(wèn)題。
通過(guò)對(duì)現(xiàn)有的不確定數(shù)據(jù)集上Skyline及Top-k查詢(xún)算法的研究,結(jié)合了數(shù)據(jù)流的特性,本文提出了全新
3、的用于不確定數(shù)據(jù)集上的一系列Skyline查詢(xún)維護(hù)算法,并基于真實(shí)數(shù)據(jù)及合成數(shù)據(jù)進(jìn)行了大量的實(shí)驗(yàn)驗(yàn)證,試驗(yàn)結(jié)果表明本文設(shè)計(jì)的算法能高效且有效地在不確定數(shù)據(jù)集上進(jìn)行Skyline挖掘。本文的主要研究成果如下:
1)針對(duì)稀疏實(shí)例分布數(shù)據(jù)集,提出了基于多維網(wǎng)格索引的GIKS(Gridindexedk-Skyline)算法。該算法的核心思想是利用網(wǎng)格索引進(jìn)行自底向上的最優(yōu)化訪問(wèn),即把數(shù)據(jù)空間分割為多個(gè)易于處理的小區(qū)域,利用網(wǎng)格的優(yōu)
4、勢(shì)分而治之,從而快速地響應(yīng)用戶(hù)發(fā)出的查詢(xún)請(qǐng)求。GIKS算法還使用了IDM(InstancesDistributionMap)檢索結(jié)構(gòu)在空間遍歷過(guò)程中實(shí)現(xiàn)信息共享,大幅降低時(shí)間復(fù)雜度。
2)針對(duì)密集實(shí)例分布數(shù)據(jù)集,提出了基于分層樹(shù)索引的BRKS方法。當(dāng)在實(shí)例密度很大的數(shù)據(jù)集上進(jìn)行k-Skyline查詢(xún)時(shí),本文又提出了一種自頂向下的BRKS(BoundingandRefiningk-Skyline)方法,它以均值評(píng)估為基礎(chǔ),利
5、用分層越進(jìn)行限界求精,從而漸進(jìn)地計(jì)算對(duì)象的Skyline概率。
3)將不確定數(shù)據(jù)集擴(kuò)展到數(shù)據(jù)流上,提出了概率數(shù)據(jù)流的Skyline查詢(xún)維護(hù)方法。對(duì)概率數(shù)據(jù)流上的Skyline查詢(xún)問(wèn)題進(jìn)行了深入研究,并基于“可能世界”語(yǔ)義對(duì)概率數(shù)據(jù)流上的Skyline查詢(xún)計(jì)算問(wèn)題首次進(jìn)行了建模。
4)針對(duì)概率數(shù)據(jù)流上的Skyline查詢(xún)處理,本文設(shè)計(jì)了一種高效的查詢(xún)處理算法SKY-PDS(SkylineoverProbabil
6、isticDataStream)。與確定型數(shù)據(jù)流上的Skyline查詢(xún)處理不同,SKY-PDS算法主要涉及到兩個(gè)基本問(wèn)題:①如何盡早地淘汰那些不再有機(jī)會(huì)加入Skyline結(jié)果集的對(duì)象,以減少內(nèi)存開(kāi)銷(xiāo)?②如何高效地判定對(duì)象的狀態(tài)(是否作為Skyline對(duì)象輸出),即如何減少對(duì)“支配關(guān)系”的檢測(cè)次數(shù)以便降低CPU負(fù)荷?針對(duì)以上兩個(gè)基本問(wèn)題,本文先后提出了概率定界、逐步求精等優(yōu)化措施對(duì)算法從空間與時(shí)間上進(jìn)行了系統(tǒng)地優(yōu)化??b密的理論分析和詳盡的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 不確定數(shù)據(jù)集上的Skyline查詢(xún)處理研究.pdf
- 不確定數(shù)據(jù)集Skyline查詢(xún)研究.pdf
- 不確定數(shù)據(jù)skyline查詢(xún)研究.pdf
- 不確定數(shù)據(jù)流上SKYLINE查詢(xún)算法研究.pdf
- 不確定數(shù)據(jù)流查詢(xún)處理算法的研究.pdf
- 不確定數(shù)據(jù)聚集查詢(xún)的分布式處理算法.pdf
- 不確定數(shù)據(jù)集上ToP-k查詢(xún)及優(yōu)化算法的研究.pdf
- 不確定數(shù)據(jù)流的分布并行Skyline查詢(xún)處理技術(shù)研究.pdf
- 18915.不確定數(shù)據(jù)流上的反skyline查詢(xún)研究
- 不確定數(shù)據(jù)的分布并行Skyline查詢(xún)技術(shù)研究.pdf
- 數(shù)據(jù)流上Skyline查詢(xún)處理算法研究.pdf
- 不確定性數(shù)據(jù)查詢(xún)處理算法的研究.pdf
- 不確定數(shù)據(jù)的概率近鄰查詢(xún)處理技術(shù)研究.pdf
- 基于不確定數(shù)據(jù)的范圍查詢(xún)算法的研究與實(shí)現(xiàn).pdf
- 不確定數(shù)據(jù)索引及其范圍查詢(xún)處理技術(shù)研究.pdf
- 不確定數(shù)據(jù)的挖掘算法研究.pdf
- 面向不確定數(shù)據(jù)的聚合查詢(xún)處理與優(yōu)化技術(shù).pdf
- 基于多核體系結(jié)構(gòu)不確定數(shù)據(jù)的Skyline查詢(xún)并行計(jì)算.pdf
- 基于不確定數(shù)據(jù)的頻繁項(xiàng)集挖掘算法的研究.pdf
- 基于DRA的不確定數(shù)據(jù)的查詢(xún)研究.pdf
評(píng)論
0/150
提交評(píng)論