![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/19/12/d6bb9362-9493-489a-9f0b-d6519f99c511/d6bb9362-9493-489a-9f0b-d6519f99c511pic.jpg)
![一種新的多向數(shù)據(jù)分析方法—多重雙線性分解及運用初步.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/19/12/d6bb9362-9493-489a-9f0b-d6519f99c511/d6bb9362-9493-489a-9f0b-d6519f99c5111.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、多向數(shù)據(jù)成為眾多研究領(lǐng)域中越來越常見的一種復(fù)雜數(shù)據(jù)類型,這主要歸因于現(xiàn)代計算機的發(fā)展,各種測量手段的更新,以及研究對象認識的深入。多向數(shù)據(jù)通常是幾組變量集按照相互交叉的組織形式,通過對其測量而獲取的。這樣的復(fù)雜數(shù)據(jù)類型具備多重維度,結(jié)構(gòu)豐富而且復(fù)雜,難以使用矩陣對其予以描述等特點。多向數(shù)組是多向數(shù)據(jù)的數(shù)學(xué)描述形式。多向數(shù)組分析是分析多向數(shù)據(jù)的最為基礎(chǔ)的數(shù)學(xué)工具之一。除此之外,在高階統(tǒng)計理論方面,往往涉及到高階統(tǒng)計量(高階的矩、累積量、譜
2、與倒譜等)均是多向數(shù)組。正如矩陣分析在傳統(tǒng)多元分析中的地位一樣,多向數(shù)組分析也成為高階統(tǒng)計理論研究的基本數(shù)學(xué)工具和方法。因此,急需新的多向數(shù)組分析方法對這類復(fù)雜數(shù)據(jù)的內(nèi)在的潛結(jié)構(gòu)和相互關(guān)系進行探索性分析。
作為多向數(shù)組分析重要部分的多向數(shù)組分解有三種最主要的方法,即,用于多向數(shù)組的二向奇異值分解(Singular Value Decomposition,SVD)、CANDECOMP-PARAFAC分解(Canonical
3、Decomposition-Parallel Factor Analysis,PARAFAC)與TUCKER分解(Tucker's Decomposition,TUCKER)。然而,這三種均有各自的缺陷。如果多向數(shù)據(jù)本質(zhì)上是多重線性的,那么,PARAFAC和TUCKER則可以提供比二向奇異值分解更為穩(wěn)健、更具可解釋性的模型。另外,PARAFAC數(shù)值計算通常并不太穩(wěn)定,而TUCKER卻不保證多向數(shù)組近似的唯一性。
依據(jù)200
4、4年美國數(shù)學(xué)學(xué)會召開的多向數(shù)組分解專題會議所提出的“理想”二向SVD擴展方法的幾個重要特性,本文提出了一種新的多向數(shù)組分解模型。本文假定多向數(shù)據(jù)是由多重雙線性結(jié)構(gòu)生成的,各向?qū)Χ嘞驍?shù)據(jù)變異均有不同程度的貢獻,可以分解成兩個部分,其中一部分為各個向所能單獨解釋的部分,另外一部分則為各個向的交互所能解釋的部分,并且,每個向所能解釋的變異是線性可加的,并且與其它向相交互,這種交互只存在于同一成分中,不同成分中它們的交互則不存在。根據(jù)這些考慮,
5、提出了具備雙重雙線性的多向數(shù)組分解模型?;谶@一模型,本文進而提出了一種新的多向數(shù)組分解方法,稱為多重雙線性分解(MultipleBilinear Decomposition,MBD),它可以看作是二向奇異值分解到多向的一種自然擴展,并且,提出了一種非基于交替最小二乘的算法,此算法可以一步分解只提取一個成分,無需一次性地提取所有成分。
從理論上來說,本文所提出的新方法具有三個重要的性質(zhì),包括載荷向量的正交性,閉式分解形式,
6、以及變異的序列化分解等。這些性質(zhì)暗示多重雙線性分解算法具有數(shù)值穩(wěn)定性。并且,類似于奇異值分解,多重雙線性分解可以提供每步分解的所得到的成分的變異解釋度。對于傳統(tǒng)多向數(shù)組分解方法,如PARAFAC分解,TUCKER分解等,這三個重要性質(zhì)是不具備的,或者,只是部分具備的。在理論上,多重雙線性分解要優(yōu)于傳統(tǒng)的多向數(shù)組分解方法。從模型角度來說,多重雙線性分解是矩陣奇異值分解的一種在更高向下更為合理的推廣。
基于多重雙線性模型,本文
7、所給出的非基于交替最小二乘(ALS)的MBD算法,此算法可以一步分解只提取一個成分,可以序列地逐步對多向數(shù)組進行分解。由此,可以推測本文所給出的MBD算法更容易實現(xiàn),也更易保證其算法數(shù)值的穩(wěn)定性。
為了驗證多重雙線性分解方法的效能,設(shè)計了一個以正交PARAFAC模型為標(biāo)準(zhǔn)模型的Monte Carlo模擬試驗,以載荷向量與其真值的相似度和模型擬合精度作為評價標(biāo)準(zhǔn)。在模擬試驗中,隨著誤差水平的增高,雙重雙線性分解與PARAFA
8、C分解所得的載荷向量相似度的中位數(shù)逐步下降,而其相應(yīng)的四分位數(shù)間距則先增大后減小。但是,在各種誤差水平下,就中位數(shù)而言,MBD所估計的載荷向量相似度均不小于PARAFAC;就標(biāo)準(zhǔn)差而言,MBD的結(jié)果均不大于PARAFAC結(jié)果。需要特別注意的是,如若誤差水平為0,新方法與PARAFAC等價。另外,就模型擬合精度而言,MBD模型擬合于多向數(shù)據(jù)的精度均要高于PARAFAC模型。這些結(jié)果表明,在載荷向量估計的精確度和穩(wěn)定性,以及模型的擬合程度方
9、面,多重雙線性分解均要優(yōu)于PARAFAC,即使新方法沒有直接使用多重線性的先驗信息。另外,由于新方法的分解方式為序列式的,因而,可以認為新方法是PARAFAC的一種更優(yōu)的備擇方法。
本文將多向數(shù)組分解方法引入到公共衛(wèi)生研究領(lǐng)域之中。以女中學(xué)生營養(yǎng)監(jiān)測為例,針對女中學(xué)生貧血血液生化指標(biāo)進行分析,以一項青春期女中學(xué)生健康調(diào)查資料作為實例,從青春期發(fā)育特點和營養(yǎng)性貧血的角度,從成分的變異解釋度和載荷向量的解釋性兩個方面,對新方法
10、與傳統(tǒng)多向數(shù)組分解方法之一的PARAFAC分解進行系統(tǒng)比較。從成分的變異解釋度來看,無論是正常組,還是營養(yǎng)性貧血組,MBD前兩個成分的變異解釋均要高于PARAFAC前兩個成分的變異解釋度。這說明MBD對多向數(shù)據(jù)的擬合程度要高于PARAFAC。從載荷向量的解釋性上來看,相較于PARAFAC分解而言,多重雙線性分解的分析結(jié)果更加切合于現(xiàn)有青春期女性發(fā)育特點和營養(yǎng)性貧血診斷標(biāo)準(zhǔn)。這說明新方法的可解釋性要強于PARAFAC。從實用的角度來可以說
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 一類新的最優(yōu)雙線性對.pdf
- 基于雙線性方法的非線性發(fā)展方程的求解.pdf
- 32511.雙線性基函數(shù)電磁散射的積分方法分析
- 一種新的腫瘤轉(zhuǎn)移模式及初步分析.pdf
- 雙線性時間序列分析——系統(tǒng)分析中的非線性統(tǒng)計方法.pdf
- 基于雙線性方法的孤子可積系統(tǒng).pdf
- 雙線性對的有效計算.pdf
- 雙線性方法在幾類波動方程中的應(yīng)用.pdf
- 雙線性對的有效計算
- 雙線性對快速計算分析與實現(xiàn).pdf
- 雙線性方法在孤子方程求解中的應(yīng)用.pdf
- 基于雙線性映射的代理簽名與代理多重簽名方案的研究.pdf
- 一種即時增量數(shù)據(jù)分析框架設(shè)計及實現(xiàn).pdf
- 保零積的雙線性映射.pdf
- 一種新的圖像稀疏分解方法及其圖像檢索.pdf
- 基于新粗化思想的一種代數(shù)多重網(wǎng)格方法.pdf
- 雙線性對的快速計算研究.pdf
- 基于雙線性對的密碼協(xié)議的設(shè)計與分析.pdf
- 5025.雙線性方法在求解非線性方程中的應(yīng)用
- 一類雙線性時間序列的參數(shù)估計.pdf
評論
0/150
提交評論