![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/9/9/e1cc1719-510d-44c7-8a64-2d35f2da4121/e1cc1719-510d-44c7-8a64-2d35f2da4121pic.jpg)
![基于敘詞表的中醫(yī)古籍文獻(xiàn)領(lǐng)域本體建模方法研究.pdf_第1頁(yè)](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/9/9/e1cc1719-510d-44c7-8a64-2d35f2da4121/e1cc1719-510d-44c7-8a64-2d35f2da41211.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1.前言隨著20世紀(jì)90年代中醫(yī)藥文獻(xiàn)數(shù)字化研究的開展,中醫(yī)古籍文獻(xiàn)數(shù)字化工作已經(jīng)走過(guò)了幾個(gè)階段。從2000年國(guó)家中醫(yī)藥管理局設(shè)立的重點(diǎn)研究專項(xiàng)“中醫(yī)藥古代文獻(xiàn)資源數(shù)字化關(guān)鍵問(wèn)題研究”的起步階段,到2001年國(guó)家科技部基礎(chǔ)工作重大項(xiàng)目“中醫(yī)藥科技信息數(shù)據(jù)庫(kù)建設(shè)”項(xiàng)目,再至2003年國(guó)家科技部醫(yī)學(xué)科學(xué)數(shù)據(jù)共享服務(wù)系統(tǒng)“中醫(yī)藥學(xué)科學(xué)數(shù)據(jù)共享服務(wù)中心”建設(shè)項(xiàng)目,中醫(yī)古籍文獻(xiàn)數(shù)字化已成功研制出“中醫(yī)本草文獻(xiàn)數(shù)據(jù)庫(kù)”、“中醫(yī)方劑文獻(xiàn)數(shù)據(jù)庫(kù)”,在全
2、國(guó)三十余家中醫(yī)院校和和研究機(jī)構(gòu)的參與下,成功構(gòu)建了我國(guó)第一個(gè)中醫(yī)古籍文獻(xiàn)知識(shí)庫(kù),目前已收錄了本草、方劑類古籍260余種,6000余萬(wàn)漢字,并于2003年實(shí)現(xiàn)了網(wǎng)絡(luò)運(yùn)行。 在數(shù)字化工作的研究中,導(dǎo)師柳長(zhǎng)華教授提出的基于“知識(shí)元”的中醫(yī)古籍計(jì)算機(jī)知識(shí)表示方法在知識(shí)庫(kù)建設(shè)中取得了進(jìn)展,基本形成了一套較成熟的建庫(kù)技術(shù)。 以這種技術(shù)建立的數(shù)據(jù)庫(kù)使知識(shí)的查詢更加精確,避免了大量冗余信息的出現(xiàn),使用戶最大限度地?cái)[脫了信息爆炸的困擾。但
3、隨之而來(lái)的另一個(gè)問(wèn)題又出現(xiàn)在查詢者面前,這就是所謂的“信息孤島”現(xiàn)象。 古籍?dāng)?shù)字化的功能不僅在于一般的信息查詢,更重要的是古籍文獻(xiàn)中的知識(shí)發(fā)現(xiàn)。普通的數(shù)據(jù)庫(kù)難以達(dá)到知識(shí)挖掘的深層次要求,古籍?dāng)?shù)字化的目標(biāo)是建設(shè)知識(shí)庫(kù)。 2.知識(shí)庫(kù)系統(tǒng)的原理從知識(shí)的使用角度來(lái)看,知識(shí)庫(kù)是由知識(shí)和知識(shí)處理機(jī)構(gòu)組成,知識(shí)庫(kù)形成一個(gè)知識(shí)域,該知識(shí)域中除了事實(shí)、規(guī)則和概念之外還包含各種推理、歸納、演繹等知識(shí)處理方法。 知識(shí)庫(kù)系統(tǒng)的核心組成部
4、分是知識(shí)庫(kù)和推理機(jī)構(gòu)。知識(shí)庫(kù)對(duì)知識(shí)進(jìn)行存儲(chǔ)和管理,推理機(jī)構(gòu)是推理機(jī)使用知識(shí)庫(kù)內(nèi)的知識(shí)執(zhí)行推理的機(jī)構(gòu)。如果一個(gè)系統(tǒng)具有能用計(jì)算機(jī)所存貯的知識(shí)對(duì)輸入的數(shù)據(jù)進(jìn)行解釋和推理,并有對(duì)其進(jìn)行驗(yàn)證的功能,則該系統(tǒng)稱為知識(shí)庫(kù)系統(tǒng)。 知識(shí)庫(kù)系統(tǒng)的實(shí)現(xiàn)涉及到兩個(gè)關(guān)鍵問(wèn)題:知識(shí)表示和知識(shí)推理。知識(shí)庫(kù)的處理過(guò)程分為二個(gè)層面:先將知識(shí)由底層數(shù)據(jù)經(jīng)過(guò)一系列加工,如分類、歸納、綜合等處理過(guò)程而得到上層信息,稱為知識(shí)表示。這種信息再經(jīng)過(guò)解釋、比較、推理得到我們
5、所獲取的知識(shí),即知識(shí)推理的過(guò)程。 為了實(shí)現(xiàn)知識(shí)推理,一種基于本體的知識(shí)表示方法成為各個(gè)領(lǐng)域構(gòu)建知識(shí)庫(kù)推理系統(tǒng)的首選。 3.本體的概念、作用與分類本體(Ontology)起源于哲學(xué)領(lǐng)域,古希臘哲學(xué)家亞里士多德(Aristotle)定義Ontology為“對(duì)世界客觀存在物的系統(tǒng)的描述,即存在論”。Ontology是客觀存在的一個(gè)系統(tǒng)的解釋或說(shuō)明,它關(guān)心的是客觀現(xiàn)實(shí)的抽象本質(zhì)。Ontology這個(gè)哲學(xué)范疇,被人工智能界賦予了新
6、的定義,從而被引入信息科學(xué)中。 目前普遍接受的本體定義為:共享概念模型的形式化規(guī)范說(shuō)明。從內(nèi)涵上來(lái)看,本體是領(lǐng)域(可以是特定領(lǐng)域的,也可以是更廣的范圍)內(nèi)部不同主體(人、機(jī)器、軟件系統(tǒng)等)之間進(jìn)行交流(對(duì)話、互操作、共享等)的一種語(yǔ)義基礎(chǔ),即由本體提供一種明確定義。Ontology自身所要實(shí)現(xiàn)的目標(biāo),即:“在人類和應(yīng)用系統(tǒng)之間實(shí)現(xiàn)共享和相互理解”。 Ontology能夠?qū)㈩I(lǐng)域中的各種概念及概念之間的關(guān)系顯示地、形式化地表
7、達(dá)出來(lái),從而將術(shù)語(yǔ)的語(yǔ)義表達(dá)出來(lái),因而在語(yǔ)義查詢方面發(fā)揮著重要作用。自W3C主席TimBermem-Lee在1998年首先提出了語(yǔ)義web的概念之后,Ontology正在成為人工智能和信息處理領(lǐng)域的研究熱點(diǎn)之一。 本體強(qiáng)調(diào)相關(guān)領(lǐng)域的本質(zhì)概念,同時(shí)強(qiáng)調(diào)這些概念之間的關(guān)聯(lián)。本體論可以有效地表達(dá)知識(shí)和知識(shí)之間的關(guān)系,基于本體論的知識(shí)庫(kù)系統(tǒng)可以建立有效的知識(shí)表達(dá)體系,揭示知識(shí)之間的內(nèi)在關(guān)系。 本體技術(shù)主要在以下幾個(gè)方面提高知識(shí)庫(kù)
8、系統(tǒng)的性能:可重用性、知識(shí)獲取、查找智能性、可靠性、規(guī)范定義、任務(wù)解析、可維護(hù)性。 本體通??煞譃橐韵聨最悾侯I(lǐng)域本體、通用本體、應(yīng)用本體、表示本體。本文關(guān)注的是本體類型中的領(lǐng)域本體,主要討論如何運(yùn)用Ontology技術(shù)構(gòu)建中醫(yī)古籍領(lǐng)域本體。 4.本研究的意義、方法與創(chuàng)新點(diǎn)本文通過(guò)對(duì)本體的國(guó)內(nèi)外研究與發(fā)展現(xiàn)狀的考察,根據(jù)中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)的實(shí)際情況,在知識(shí)推理層面提出了建設(shè)面向中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)應(yīng)用的中醫(yī)古籍文獻(xiàn)領(lǐng)域本體的設(shè)想。參
9、考國(guó)內(nèi)外領(lǐng)域本體的建設(shè)方法,論述了利用敘詞表建設(shè)領(lǐng)域本體的優(yōu)勢(shì),提出了基于敘詞表的適合中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)應(yīng)用的中醫(yī)古籍文獻(xiàn)領(lǐng)域本體建設(shè)方法。最后通過(guò)一個(gè)實(shí)例闡述了中醫(yī)古籍文獻(xiàn)領(lǐng)域本體的具體建設(shè)方法,為中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)的進(jìn)一步建設(shè)提供了理論與實(shí)踐的雙重參考。 研究意義:中醫(yī)古籍知識(shí)庫(kù)建設(shè)的要求;中醫(yī)古籍知識(shí)深入整理研究的要求;便于網(wǎng)絡(luò)中醫(yī)古籍文獻(xiàn)資源的統(tǒng)一管理。 研究方法:文獻(xiàn)調(diào)研法、概念分析法、本體構(gòu)建法。創(chuàng)新點(diǎn):在中醫(yī)古籍文
10、獻(xiàn)數(shù)字化領(lǐng)域提出建立本體系統(tǒng)的設(shè)想;分析了適合中醫(yī)古籍文獻(xiàn)數(shù)據(jù)庫(kù)的本體表示語(yǔ)言和編輯工具;提出中醫(yī)古籍文獻(xiàn)領(lǐng)域本體的建設(shè)目標(biāo);設(shè)計(jì)了中醫(yī)古籍文獻(xiàn)領(lǐng)域本體的建設(shè)方法;建立了一個(gè)以“病證”概念為核心的中醫(yī)古籍文獻(xiàn)領(lǐng)域本體模型。 5.本體的國(guó)內(nèi)外研究現(xiàn)狀國(guó)外主要研究現(xiàn)狀:①理論深化研究;②信息系統(tǒng)中的應(yīng)用;③本體作為一種能在知識(shí)層提供知識(shí)共享和復(fù)用的工具在語(yǔ)義網(wǎng)中的應(yīng)用。 國(guó)外較為知名的本體知識(shí)系統(tǒng):WordNet、Frame
11、Net、GUM、SENSUS、OntoSeek、Cyc、HowNet和SUMO等。國(guó)內(nèi)主要研究現(xiàn)狀:我國(guó)本體的研究尚處于起步階段,一個(gè)是對(duì)W3C發(fā)布的關(guān)于本體的外文資料的翻譯,一個(gè)是主要為面向應(yīng)用的研究,無(wú)論是理論還是實(shí)際應(yīng)用都相對(duì)落后于國(guó)外。 面向中醫(yī)藥領(lǐng)域的研究主要有:浙江大學(xué)網(wǎng)格計(jì)算實(shí)驗(yàn)室開發(fā)的基于語(yǔ)義的中醫(yī)藥信息本體虛擬組織模型——DartGrid服務(wù)棧;北京中醫(yī)藥大學(xué)和中國(guó)科學(xué)院計(jì)算機(jī)研究所開發(fā)的基于本體的中醫(yī)專家臨床
12、病案知識(shí)庫(kù)。 6.領(lǐng)域本體的構(gòu)建20世紀(jì)50年代敘詞表得到了很大發(fā)展,成為主題檢索的主要語(yǔ)言,各國(guó)擁有的敘詞表數(shù)以千計(jì),并涵蓋了各個(gè)領(lǐng)域。從一定意義上講,敘詞表可以說(shuō)是一種輕量級(jí)本體(Light-weightOntology)。基于敘詞表構(gòu)建領(lǐng)域本體有諸多的的優(yōu)越性,目前人工智能界普遍推薦利用敘詞表構(gòu)建領(lǐng)域本體。 中醫(yī)古籍文獻(xiàn)敘詞表與本體的關(guān)系:中醫(yī)古籍文獻(xiàn)敘詞表表示的是中醫(yī)古籍文獻(xiàn)中包含的概念,概念來(lái)自于古籍內(nèi)容與古籍
13、本身,是對(duì)中醫(yī)古籍文獻(xiàn)的客觀反映。 敘詞表表示的是樹狀結(jié)構(gòu),這種樹狀結(jié)構(gòu)反映了古籍文獻(xiàn)內(nèi)部的自然構(gòu)成方式。敘詞表的結(jié)構(gòu)是可見的、清晰的,可稱為顯性結(jié)構(gòu)。領(lǐng)域本體繼承了敘詞表的樹狀結(jié)構(gòu)特征。本體更重在表示一種概念之間的隱含關(guān)系,這種關(guān)系是模糊的,不明顯的,可以稱為隱性結(jié)構(gòu)。相對(duì)來(lái)說(shuō),本體的反映更微細(xì),更深入,為文獻(xiàn)中的知識(shí)關(guān)聯(lián)提供了可實(shí)現(xiàn)的途徑。敘詞表或本體是對(duì)體現(xiàn)古籍內(nèi)涵的概念的集合。 領(lǐng)域本體的建模元語(yǔ):(概念)類、屬
14、性、函數(shù)、公理、實(shí)例。 建模語(yǔ)言:選用OWL語(yǔ)言。本語(yǔ)言的優(yōu)勢(shì)在于:基底層語(yǔ)法符合XML標(biāo)準(zhǔn)格式;為W3C推薦的標(biāo)準(zhǔn)本體編輯語(yǔ)言,便于與數(shù)據(jù)庫(kù)之間的數(shù)據(jù)交換;支持多種語(yǔ)言輸入,并支持中文;網(wǎng)絡(luò)中有免費(fèi)教學(xué)手冊(cè),便于下載學(xué)習(xí)。 編輯工具:選用Protégé-2000。其優(yōu)勢(shì)在于:界面友好,具有圖形化的用戶界面;版本更新速度快,目前已發(fā)布了3.1.1版;支持多種語(yǔ)言格式,支持中文編輯;本體文檔可以不倚賴于本體編輯器進(jìn)行代碼修
15、改,方便與數(shù)據(jù)庫(kù)的連接;網(wǎng)絡(luò)開放資源;是W3C推薦的本體編輯器;是基于XML的本體標(biāo)記語(yǔ)言,多種存儲(chǔ)格式,可以適應(yīng)不同需要。 構(gòu)建方法:選用斯坦弗大學(xué)醫(yī)學(xué)院開發(fā)的七步法。7.中醫(yī)古籍文獻(xiàn)領(lǐng)域本體模型(病證模型)的構(gòu)建元數(shù)據(jù)(Metadata)就是數(shù)據(jù)之?dāng)?shù)據(jù),或描述原始數(shù)據(jù)的獨(dú)立數(shù)據(jù)。元數(shù)據(jù)是針對(duì)網(wǎng)絡(luò)信息標(biāo)引發(fā)展起來(lái)的,它以Web頁(yè)作背景,通過(guò)元數(shù)據(jù)將Web信息組織起來(lái),構(gòu)成基于元數(shù)據(jù)的有序信息系統(tǒng),為網(wǎng)絡(luò)信息資源的組織提供了重要
16、手段。其主要學(xué)術(shù)意義和應(yīng)用價(jià)值在于信息處理。 根據(jù)中醫(yī)文獻(xiàn)數(shù)字化研究室的最新研究,中醫(yī)藥古籍元數(shù)據(jù)包括三類概念:一是表達(dá)古籍外部特征的元數(shù)據(jù),稱為書目元數(shù)據(jù);二是表達(dá)古籍內(nèi)部篇、卷、章、節(jié)層次特征的元數(shù)據(jù),稱為書體結(jié)構(gòu)元數(shù)據(jù);三是表達(dá)古籍知識(shí)單元內(nèi)容的元數(shù)據(jù),稱為語(yǔ)義元數(shù)據(jù)。本領(lǐng)域本體模型以“語(yǔ)義元數(shù)據(jù)”為核心概念集,以“病證”語(yǔ)義元數(shù)據(jù)及其包涵的概念為中心建立本體模型。 有關(guān)病證與其他概念間的關(guān)系主要有二類:等級(jí)關(guān)系,
17、包括上下位關(guān)系和實(shí)例關(guān)系;非等級(jí)關(guān)系,包括同義關(guān)系、交叉關(guān)系、排斥關(guān)系等。 以《諸病源候論》“風(fēng)痙候”為例,為本體添加類和實(shí)例:“風(fēng)痙候”條文:“風(fēng)痙者,口噤不開,背強(qiáng)而直,如發(fā)癇之狀。其重者,耳中策策痛;卒然身體痙直者,死也。由風(fēng)邪傷于太陽(yáng)經(jīng),復(fù)遇寒濕,則發(fā)痙也。診其脈,策策如弦,直上下者,風(fēng)痙脈也?!?“風(fēng)痙候”的概念等級(jí)鏈為:病證——風(fēng)病——風(fēng)痙。條文中與與本概念相關(guān)的其他概念有:證候表現(xiàn)、預(yù)后、病因、病位、脈象。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于本體的中醫(yī)古籍?dāng)⒃~表構(gòu)建方法研究.pdf
- 基于敘詞表的領(lǐng)域本體建模方法研究.pdf
- 基于敘詞表的領(lǐng)域本體建模研究.pdf
- 基于敘詞表的領(lǐng)域本體構(gòu)建.pdf
- 基于敘詞表和文獻(xiàn)數(shù)據(jù)庫(kù)的農(nóng)業(yè)領(lǐng)域本體構(gòu)建方法研究.pdf
- 期貨領(lǐng)域本體構(gòu)建——基于敘詞表與本體的轉(zhuǎn)換研究.pdf
- 基于網(wǎng)絡(luò)環(huán)境下中文敘詞表本體知識(shí)表示的研究
- 基于中醫(yī)骨傷古籍本體的語(yǔ)義檢索研究.pdf
- 基于敘詞表詞間關(guān)系的領(lǐng)域信息檢索.pdf
- 中醫(yī)古籍圖像文獻(xiàn)的自由標(biāo)引方法研究.pdf
- 基于本體的領(lǐng)域需求建模過(guò)程研究.pdf
- 領(lǐng)域敘詞表融合中概念優(yōu)選詞選擇研究.pdf
- 基于OWL的領(lǐng)域本體構(gòu)建方法研究.pdf
- 基于本體的服裝領(lǐng)域知識(shí)表示的建模研究.pdf
- 基于本體的突發(fā)事件領(lǐng)域知識(shí)建模.pdf
- 基于本體的領(lǐng)域構(gòu)件檢索方法的研究.pdf
- 基于MDA的本體建模方法研究.pdf
- 基于中醫(yī)古籍文獻(xiàn)咳嗽病因病機(jī)的研究.pdf
- 基于mda的本體建模方法研究
- 農(nóng)業(yè)科學(xué)敘詞表向農(nóng)業(yè)本體轉(zhuǎn)化系統(tǒng)的研究與實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論