海洋環(huán)境下聚類算法的研究.pdf_第1頁
已閱讀1頁,還剩128頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、聚類分析是數(shù)據(jù)挖掘(Data Mining,DM)重要方法之一,在圖像處理,環(huán)境預(yù)測,天氣預(yù)報等許多領(lǐng)域有著廣泛應(yīng)用,也是進(jìn)行海洋颶風(fēng)和赤潮研究的一種新方法。
  針對目前海洋環(huán)境中的颶風(fēng)和赤潮的分析方法單一性和不完善性,本文采用聚類分析方法對這兩種現(xiàn)象進(jìn)行分析。傳統(tǒng)的颶風(fēng)研究方法依據(jù)氣象學(xué)或空氣動力學(xué)的原理進(jìn)行分析,本文采用聚類方法,根據(jù)颶風(fēng)生成的移動特征,把颶風(fēng)抽象為軌跡,并以此聚類。赤潮過程包含多個階段,各階段具有不確定性,

2、這是由赤潮理化因子的不同作用而引起的。傳統(tǒng)研究赤潮對所有影響因子數(shù)據(jù)統(tǒng)一處理,這種方法難以發(fā)現(xiàn)個體因子對赤潮的影響作用。針對這一不足之處以及赤潮過程多階段模糊的特點,提出模糊聚類與權(quán)重值相結(jié)合的方法,并以此分析赤潮產(chǎn)生過程以及各階段的特征。影響赤潮發(fā)生的理化因子具有高維性,高維數(shù)據(jù)綜合分析,更適合采用模糊聚類分析方法。為了表明算法的有效性,本文構(gòu)造了一種新有效性評價指標(biāo),克服傳統(tǒng)依靠距離作為衡量標(biāo)準(zhǔn)的有效性指標(biāo)的不足。本文以提出的聚類創(chuàng)

3、新理論為研究重點,以海洋環(huán)境領(lǐng)域中的應(yīng)用為背景,內(nèi)容涉及計算智能技術(shù)、海洋颶風(fēng)以及赤潮,屬于交叉學(xué)科的研究課題,具有十分重要的理論意義和實際應(yīng)用價值。論文的主要工作如下:
  1.研究了颶風(fēng)軌跡聚類算法。提出了一種基于相似子軌跡的聚類算法。該算法基于子軌跡的劃分,提出相似子軌跡的概念,利用相似子軌跡近似代表一個子軌跡聚類區(qū)域的空間特征,因此可以減少空間搜尋,算法能夠有效的降低時間復(fù)雜度和空間復(fù)雜度,提高了算法的執(zhí)行效率。
 

4、 2.研究了軌跡聚類算法輸入?yún)?shù)問題。針對軌跡聚類過程中對輸入?yún)?shù)ε和MinLns具有敏感性,提出了一種對輸入?yún)?shù)非敏感的軌跡聚類算法,算法根據(jù)軌跡劃分的子軌跡指定距離和可達(dá)距離概念,計算得到上一個參數(shù)化的簇排序,通過此排序序列表示軌跡數(shù)據(jù)內(nèi)在聚類結(jié)構(gòu),并且使用此排序序列聚類的結(jié)果等效于利用一個參數(shù)范圍實現(xiàn)軌跡聚類的結(jié)果。因此算法能夠避免由唯一參數(shù)值帶來聚類結(jié)果的不確定性,有效降低了聚類結(jié)果對輸入?yún)?shù)的敏感性。
  3.研究了赤潮

5、發(fā)生過程中各階段的模糊聚類。赤潮發(fā)生過程可以分為四個階段,這四個階段受多種理化因子制約,各階段之間難以區(qū)別,具有模糊性。某一理化因子在四個階段都有可能有相同的值,或者值變化非常大。因此不同理化因子在赤潮過程各個階段的作用大小并不相同。針對赤潮過程的模糊性和各因子對赤潮各階段影響的重要程度不同的特點,提出一種基于權(quán)重的模糊聚類算法,為隸屬度函數(shù)和典型值函數(shù)分配不同的權(quán)值。算法克服了模糊可能性均值聚類算法(Fuzzy possibiliti

6、c C-Means,FPCM)中限制典型值的不足之處,也克服了可能性模糊聚類算法(Possibilitic Fuzzy C-Means,PFCM)中隨機(jī)確定參數(shù)的不合理性。算法運用基于原型驅(qū)動的學(xué)習(xí)方法確定權(quán)重參數(shù),使得權(quán)重參數(shù)計算更合理。實驗結(jié)果表明該方法聚類效果明顯。
  4.研究了區(qū)間數(shù)據(jù)集的模糊聚類問題。隨著應(yīng)用的需要,使用區(qū)間值變量描述對象大量存在于實際生活中?;跉W氏距離的聚類方法雖然對點數(shù)據(jù)聚類效果明顯,但對區(qū)間數(shù)據(jù)

7、的處理歐氏距離度量方法則顯得不足,聚類效果不明顯。針對這一特點,提出了區(qū)間數(shù)據(jù)集的三種二次型距離度量方法,在此基礎(chǔ)上修改目標(biāo)方程產(chǎn)生三種算法。在UCI數(shù)據(jù)集和海洋魚類數(shù)據(jù)集上的實驗結(jié)果表明,新算法能夠得到較好的聚類效果,并且有較低誤分率。
  5.研究了聚類有效性指標(biāo)。在未知數(shù)據(jù)集中如何確定最佳聚類數(shù)和如何確定真實聚類中心,以及如何度量類內(nèi)緊致度和類間分離度屬于聚類有效性研究的問題。目前許多有效性指標(biāo)算法的類內(nèi)和類間的度量方法都基

8、于歐氏距離方法,這種方法對于球狀數(shù)據(jù)能夠較好的發(fā)現(xiàn)最佳聚類數(shù),但對于重疊度較高的數(shù)據(jù)集和不規(guī)則數(shù)據(jù)集,效果不明顯。本文提出了一種非歐氏距離有效性指標(biāo)VI,指標(biāo)對類內(nèi)采用隸屬度表示數(shù)據(jù)集的緊致程度,而類間度量采用反貼近度方法,能夠有效克服采用歐氏距離作為重疊數(shù)據(jù)集和不規(guī)則數(shù)據(jù)集的度量指標(biāo)而引起的不準(zhǔn)確性。該方法既考慮了模糊劃分又結(jié)合了數(shù)據(jù)的分布特征,對聚類結(jié)果的評價更客觀,颶風(fēng)和赤潮以及其他數(shù)據(jù)集實驗結(jié)果表明,該有效性指標(biāo)都能夠找出最佳聚

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論