版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、知識發(fā)現(xiàn)可靠性是知識發(fā)現(xiàn)領域中一個重要但容易忽視的主題。隨著知識發(fā)現(xiàn)和數(shù)據(jù)挖掘技術的廣泛應用,有一個問題逐漸引起人們的關注,即在什么條件下知識發(fā)現(xiàn)是可靠的,或者說在什么條件下所發(fā)現(xiàn)的知識是可靠的。近年來在知識發(fā)現(xiàn)可靠性方面的研究,大多關注于某一具體數(shù)據(jù)挖掘模型下的可靠性問題。而對于不同模型問存在的可靠性共同主題,比如數(shù)據(jù)質(zhì)量、評估方法等等,迄今為止仍沒有一項系統(tǒng)性研究。針對知識發(fā)現(xiàn)可靠性的共同主題,進行分階段、系統(tǒng)化的總結(jié)和梳理,已成為
2、知識發(fā)現(xiàn)可靠性研究的一大迫切需要。
在知識發(fā)現(xiàn)技術所應用的各個領域,有一個領域特別需要知識發(fā)現(xiàn)可靠性的研究,即中醫(yī)藥領域。作為中華民族重要文化財富和學術成就的中醫(yī)藥,近年來面臨著生存和發(fā)展的挑戰(zhàn)。如何把這一挑戰(zhàn)化為中醫(yī)藥發(fā)展的契機,利用知識發(fā)現(xiàn)技術促進中醫(yī)藥的跨越式發(fā)展,已成為中醫(yī)藥研究人員的一項重要課題。近年來的中醫(yī)藥信息化工作已為知識發(fā)現(xiàn)創(chuàng)造了有利條件。然而,由于中醫(yī)藥數(shù)據(jù)自然語言性強,數(shù)據(jù)表達涵義豐富,表達方式多樣化
3、,而且在數(shù)據(jù)質(zhì)量上還面臨較大問題,在具備這些特征的數(shù)據(jù)上所進行的知識發(fā)現(xiàn),相比其他領域來講,就更加需要關注和研究知識發(fā)現(xiàn)可靠性問題。
在這一背景下,本文圍繞中醫(yī)藥知識發(fā)現(xiàn)可靠性這一主題,從知識發(fā)現(xiàn)整個生命周期的各個階段對可靠性因素進行探討,提出了知識發(fā)現(xiàn)可靠性框架PBRF-KD。針對中醫(yī)藥知識發(fā)現(xiàn)中比較突出的可靠性問題,重點探討中醫(yī)藥知識發(fā)現(xiàn)中的結(jié)構(gòu)性因素、表達性因素和信任性因素三大問題。本文的研究工作與貢獻包括如下幾個方
4、面:
1)提出了基于過程的知識發(fā)現(xiàn)可靠性框架
針對現(xiàn)有知識發(fā)現(xiàn)可靠性研究模型相關的特點,提出了一個與模型/應用無關的知識發(fā)現(xiàn)可靠性框架PBRF-KD,該框架采用基于過程的思路對知識發(fā)現(xiàn)整個流程中的各個階段和可靠性因素進行了梳理,歸納出了7種可靠性相關因素。該框架為知識發(fā)現(xiàn)項目設立了整套與可靠性相關的藍本。
2)提出了結(jié)構(gòu)相關的可靠性因素的優(yōu)化方法
分析了中醫(yī)藥知識發(fā)現(xiàn)中與結(jié)構(gòu)相關的
5、可靠性因素,主要指數(shù)據(jù)完整性。針對文本型字段的完整性問題,提出了基于順序半相關度量的中醫(yī)藥文本缺失字段填補方法。針對中醫(yī)藥文獻類別標簽缺失的問題,提出了基于M-Similarity的多標簽文本分類方法。
3)提出了表達相關的可靠性因素的優(yōu)化方法
分析了中醫(yī)藥知識發(fā)現(xiàn)中與表達相關的可靠性因素,包括表達粒度和表達一致性。針對表達粒度,提出了基于規(guī)則的表達粒度細分方法。針對表達一致性,提出了基于本體的表達一致化方法
6、。該套方法有助于提高中醫(yī)藥與表達相關的可靠性。
4)提出了信任相關的可靠性因素的優(yōu)化方法
分析了中醫(yī)藥知識發(fā)現(xiàn)中與信任相關的可靠性因素,主要指數(shù)據(jù)可信度。針對中醫(yī)藥特有的數(shù)據(jù)可信度問題,提出了基于歷史文獻認可度的數(shù)據(jù)可信度衡量方法,和基于互聯(lián)網(wǎng)知名度的數(shù)據(jù)可信度衡量方法。此外,基于這兩種可信度衡量方法,提出了基于數(shù)據(jù)可信度的加權頻繁模式挖掘算法,并在消渴方和脾胃方數(shù)據(jù)集上獲得了有意義的結(jié)果。該套方法有助于提高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于中醫(yī)藥非相關文獻知識發(fā)現(xiàn)的研究.pdf
- 中醫(yī)藥領域知識關系發(fā)現(xiàn)方法研究與應用.pdf
- 中醫(yī)藥知識
- 中醫(yī)藥信息語義集成與知識發(fā)現(xiàn)若干問題研究.pdf
- 中醫(yī)藥健康知識
- 中醫(yī)藥文獻語義關系圖發(fā)現(xiàn)
- 中醫(yī)藥知識淺談
- 中醫(yī)藥文獻語義關系圖發(fā)現(xiàn)
- 中醫(yī)藥文獻語義關系圖發(fā)現(xiàn)
- 中醫(yī)藥文獻語義關系圖發(fā)現(xiàn)
- 中醫(yī)藥知識宣傳資料
- 中醫(yī)藥知識工程應用.pdf
- 中醫(yī)藥養(yǎng)生知識
- 中醫(yī)藥法知識競賽題庫_中醫(yī)藥法知識競賽試題及答案
- 中醫(yī)藥知識與苷肽
- 中醫(yī)藥知識競賽題庫
- 中醫(yī)藥知識宣傳材料
- 中醫(yī)藥健康知識講座
- 兒童中醫(yī)藥管理項目知識
- 中醫(yī)藥健康知識講座
評論
0/150
提交評論