基于選擇性集成的增量學(xué)習(xí)研究.pdf_第1頁
已閱讀1頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、近年來,物聯(lián)網(wǎng)、互聯(lián)網(wǎng)金融、云計算、移動通信等應(yīng)用產(chǎn)生了大量的新數(shù)據(jù),這些數(shù)據(jù)具有快速到達和不斷變化的特點。因此,有效的利用這些數(shù)據(jù),并對其進行高效的分析,從而獲得有用的信息和知識,這對指導(dǎo)后續(xù)的決策是至關(guān)重要的。增量學(xué)習(xí)能夠很好的滿足這個需求,所謂增量學(xué)習(xí)是在學(xué)習(xí)新知識的同時盡量保留已學(xué)的知識,以達到不斷積累知識的目的。增量學(xué)習(xí)分為單分類器增量學(xué)習(xí)和集成式增量學(xué)習(xí),其中集成式增量學(xué)習(xí)是將集成學(xué)習(xí)的思想引入到增量學(xué)習(xí)中,進而提高系統(tǒng)的泛

2、化能力。但這樣會出現(xiàn)一些問題:首先,隨著系統(tǒng)的不斷運行,集成分類器規(guī)模增大,導(dǎo)致系統(tǒng)預(yù)測性能的下降和開銷的增加,因此,從眾多基分類器中選出有用的分類器是很有必要的;其次,許多集成式增量學(xué)習(xí)算法采用正確率來衡量基分類器的性能,但在實際應(yīng)用中,正確率暴露出許多的限制和不足,因此,尋找更好的方法來替代正確率具有十分重要的意義。
  針對上述兩方面的問題,本文提出基于AUC(Area Under ROC Curve)方法的集成式增量學(xué)習(xí)算

3、法Learn++AUC,用于解決正確率不能完全準確衡量基分類器性能的問題;提出基于選擇性集成的Learn++AUC-OO算法,解決集成式增量學(xué)習(xí)會導(dǎo)致集成分類器規(guī)模增大、系統(tǒng)開銷增加的問題。本文主要工作和研究如下:
  第一,介紹了增量學(xué)習(xí)相關(guān)技術(shù)。首先闡述了增量學(xué)習(xí)、集成學(xué)習(xí)、選擇性集成以及ROC技術(shù)和AUC方法的基本概念。然后列舉了國內(nèi)外發(fā)展的現(xiàn)狀,特別是對增量學(xué)習(xí)中Learn++算法的研究現(xiàn)狀作了詳細的論述。最后,回顧了集成

4、式增量學(xué)習(xí)和選擇性集成的經(jīng)典算法。
  第二,針對采用正確率衡量分類器預(yù)測性能的限制和不足,在Learn++算法的基礎(chǔ)上提出基于AUC方法的Learn++AUC算法。Learn++AUC采用基分類器的AUC值作為其性能指標,使集成分類器的分類正確率得到提高。通過比較Learn++和Learn++AUC在UCI數(shù)據(jù)集上的分類正確率,驗證了Learn++AUC的有效性。
  第三,針對集成式增量學(xué)習(xí)中集成分類器數(shù)量增加,導(dǎo)致預(yù)測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論