![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/6/23/3d3f9033-39cb-437c-9029-6830dc3b1504/3d3f9033-39cb-437c-9029-6830dc3b1504pic.jpg)
![基于加權(quán)決策樹的隨機(jī)森林模型優(yōu)化.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/6/23/3d3f9033-39cb-437c-9029-6830dc3b1504/3d3f9033-39cb-437c-9029-6830dc3b15041.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨機(jī)森林是一種組合分類器,它的主要思想是基于兩個(gè)隨機(jī)過程(訓(xùn)練樣本隨機(jī)抽取、特征集隨機(jī)抽?。﹣順?gòu)建多棵相對(duì)獨(dú)立的決策樹分類器,然后通過所有決策樹參與投票的方式獲得最終的預(yù)測(cè)結(jié)果,這樣有效避免了過度擬合的問題,并且構(gòu)建決策樹的相對(duì)獨(dú)立性適合于并行計(jì)算提高模型的預(yù)測(cè)效率,方便處理高維數(shù)據(jù)。這些特點(diǎn)使隨機(jī)森林在各個(gè)工程應(yīng)用中得到了迅速、廣泛的使用,成為機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘研究中的熱門算法。
雖然隨機(jī)森林在模型構(gòu)建過程中的隨機(jī)抽樣解決了
2、過擬合的問題,但是也使得模型中不同決策樹的泛化能力存在一定的差異,在傳統(tǒng)隨機(jī)森林模型中這些具有不同泛化能力的決策樹擁有相同的投票權(quán)重,這影響了模型整體預(yù)測(cè)能力的穩(wěn)定性。因此,為了進(jìn)一步提高隨機(jī)森林模型整體的預(yù)測(cè)能力,本文提出了一種優(yōu)化的隨機(jī)森林投票方法,通過使用決策樹的分類性能與樣本的統(tǒng)計(jì)特征來確定決策樹的投票權(quán)重,使用加權(quán)決策樹投票的方式提高隨機(jī)森林整體模型的準(zhǔn)確率與效率。
本文通過研究傳統(tǒng)隨機(jī)森林算法,著重優(yōu)化了隨機(jī)森林的
3、投票過程,針對(duì)投票過程中存在的問題,提出改進(jìn)的方法,并通過在多個(gè)公共數(shù)據(jù)集上展開實(shí)驗(yàn),驗(yàn)證優(yōu)化方法的合理性和優(yōu)越性。本研究的主要工作包括:
(1)從決策樹的分類能力、訓(xùn)練樣本的統(tǒng)計(jì)特性入手,提出了4種計(jì)算決策樹投票權(quán)重的方法,包括OOB評(píng)估、樣本數(shù)據(jù)相關(guān)系數(shù)評(píng)估、卡方評(píng)估和互信息評(píng)估,通過這4種評(píng)估方法為單棵決策樹計(jì)算投票權(quán)重。在8組數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明引入投票加權(quán)的方法可以有效的提高隨機(jī)森林模型整體的泛化能力,
4、其中以相關(guān)系數(shù)作為決策樹投票權(quán)重計(jì)算依據(jù)時(shí),模型表現(xiàn)出更穩(wěn)定、更高的預(yù)測(cè)準(zhǔn)確率。
(2)在引入加權(quán)投票算法的基礎(chǔ)上,本文還提出了一種半投票量模式,對(duì)構(gòu)建好的加權(quán)隨機(jī)森林模型按照決策樹投票權(quán)重進(jìn)行降序排序,在隨機(jī)森林模型進(jìn)行串行投票的過程中,確定半投票量的預(yù)測(cè)終止條件,通過提前觸發(fā)預(yù)測(cè)終止條件來提高模型預(yù)測(cè)的速度。本文在4組數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證了半投票量模式可以在不影響模型預(yù)測(cè)準(zhǔn)確率的前提下顯著提高隨機(jī)森林模型的預(yù)測(cè)速度。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于改進(jìn)隨機(jī)決策樹的入侵檢測(cè)方法研究.pdf
- 基于決策樹算法的客戶分類模型研究.pdf
- 基于半隨機(jī)多決策樹模型的數(shù)據(jù)流概念漂移發(fā)現(xiàn)研究.pdf
- 基于決策樹的數(shù)據(jù)挖掘算法優(yōu)化研究.pdf
- 基于程序演化的決策樹算法優(yōu)化研究.pdf
- 基于隱私保護(hù)的決策樹分類模型的研究.pdf
- 決策樹分類優(yōu)化算法的研究.pdf
- 基于決策樹的電力負(fù)荷預(yù)測(cè)模型研究.pdf
- 不同決策環(huán)境下決策樹模型的研究.pdf
- 決策樹中的加權(quán)模糊規(guī)則及其推理機(jī)制.pdf
- 基于遺傳算法的決策樹優(yōu)化算法研究.pdf
- 基于優(yōu)化決策樹的短期電力負(fù)荷預(yù)測(cè)研究.pdf
- 決策樹分類算法優(yōu)化研究.pdf
- MapReduce框架下并行有序決策樹及有序決策森林.pdf
- 基于決策樹的客戶流失模型研究與應(yīng)用.pdf
- 決策樹風(fēng)險(xiǎn)決策
- 基于決策樹和關(guān)聯(lián)規(guī)則的成績(jī)分析模型.pdf
- 基于決策樹的城市競(jìng)爭(zhēng)力預(yù)測(cè)模型研究.pdf
- 基于決策樹的網(wǎng)絡(luò)隱蔽通道檢測(cè)模型的研究.pdf
- 基于層次分解思想的決策樹.pdf
評(píng)論
0/150
提交評(píng)論