![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/16/db48f690-b9b5-4fd1-8368-b38bee49ce6e/db48f690-b9b5-4fd1-8368-b38bee49ce6epic.jpg)
![面向半結(jié)構(gòu)化文本的領(lǐng)域本體自動(dòng)構(gòu)建研究.pdf_第1頁(yè)](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/16/db48f690-b9b5-4fd1-8368-b38bee49ce6e/db48f690-b9b5-4fd1-8368-b38bee49ce6e1.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、對(duì)于一個(gè)領(lǐng)域的特殊應(yīng)用來說,本體是一個(gè)非常有價(jià)值的資源,尤其在需要領(lǐng)域知識(shí)的情況下。隨著科技的快速發(fā)展,互聯(lián)網(wǎng)的廣泛普及,信息量極大豐富,知識(shí)的增長(zhǎng)與更新速度日益加快,快速構(gòu)建和更新領(lǐng)域知識(shí)庫(kù)的需求更加迫切。本體作為清晰和規(guī)范描述領(lǐng)域概念和實(shí)例及其之間相互關(guān)系的知識(shí)庫(kù)得到越來越廣泛的重視和應(yīng)用。本文主要針對(duì)本體自動(dòng)構(gòu)建中的一些關(guān)鍵技術(shù)進(jìn)行了研究,具體研究?jī)?nèi)容主要包括以下幾個(gè)方面:
(1)設(shè)計(jì)了一種兩個(gè)層級(jí)的領(lǐng)域本體組成結(jié)構(gòu)。該
2、結(jié)構(gòu)將本體中的節(jié)點(diǎn)分為概念層級(jí)和實(shí)例層級(jí),不同的層級(jí)具有不同的本體組成結(jié)構(gòu)。提出了基于核心本體的本體構(gòu)建方法,利用種子實(shí)例來構(gòu)建核心本體,然后利用從文本中獲取知識(shí)的方法來擴(kuò)展本體,最終生成一個(gè)完整的領(lǐng)域本體。
(2)利用網(wǎng)頁(yè)布局特征,提出半結(jié)構(gòu)化文本的領(lǐng)域本體結(jié)構(gòu)及實(shí)例的抽取方法。領(lǐng)域本體結(jié)構(gòu)抽取,包括利用模板的方法抽取領(lǐng)域本體概念的候選屬性,以及利用統(tǒng)計(jì)學(xué)方法對(duì)候選屬性進(jìn)行過濾。領(lǐng)域本體實(shí)例的抽取,將領(lǐng)域本體的結(jié)構(gòu)信息作為線
3、索自動(dòng)生成實(shí)例的抽取模板,進(jìn)而利用Web網(wǎng)頁(yè)特有的結(jié)構(gòu)特征獲得實(shí)例的結(jié)構(gòu)信息。在針對(duì)電影,音樂和圖書三個(gè)領(lǐng)域進(jìn)行的實(shí)驗(yàn)中,本體結(jié)構(gòu)抽取的準(zhǔn)確率和召回率最高為86.7%,100%,實(shí)例抽取的準(zhǔn)確率和召回率最高可達(dá)83.9%,87.4%。
(3)通過模式匹配的方法進(jìn)行關(guān)系抽取和領(lǐng)域本體的更新。在關(guān)系抽取中,利用實(shí)體間的共現(xiàn)抽取關(guān)系模式,經(jīng)聚類以及合并之后獲得若干個(gè)類別的關(guān)系模式。在領(lǐng)域本體更新中,使用各類關(guān)系模式獲得領(lǐng)域本體新實(shí)例
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向非結(jié)構(gòu)化文本的水環(huán)境本體自動(dòng)構(gòu)建.pdf
- 面向結(jié)構(gòu)化數(shù)據(jù)本體自動(dòng)構(gòu)建技術(shù)的研究.pdf
- 基于本體概念的半結(jié)構(gòu)化文本語(yǔ)義檢索.pdf
- 面向領(lǐng)域的半結(jié)構(gòu)化Web信息抽取技術(shù).pdf
- 基于本體的半結(jié)構(gòu)化數(shù)據(jù)集成研究.pdf
- 半結(jié)構(gòu)化文本信息抽取系統(tǒng).pdf
- 面向語(yǔ)義網(wǎng)的領(lǐng)域本體半自動(dòng)構(gòu)建方法的研究.pdf
- 領(lǐng)域本體的半自動(dòng)構(gòu)建方法研究.pdf
- 非結(jié)構(gòu)化文本中領(lǐng)域術(shù)語(yǔ)獲取方法的研究.pdf
- 半結(jié)構(gòu)化文本信息抽取方法研究及應(yīng)用.pdf
- 面向動(dòng)畫領(lǐng)域的本體構(gòu)建與推理研究.pdf
- 半結(jié)構(gòu)化文本中的表格信息抽取技術(shù)的研究.pdf
- 領(lǐng)域需求結(jié)構(gòu)化描述及其自動(dòng)化建模研究.pdf
- 基于純文本的領(lǐng)域本體構(gòu)建與實(shí)現(xiàn).pdf
- 政府信息領(lǐng)域數(shù)字公文本體的構(gòu)建.pdf
- 面向語(yǔ)義信息檢索的模糊本體自動(dòng)化構(gòu)建的研究.pdf
- 面向公眾開放的領(lǐng)域本體構(gòu)建和演化研究.pdf
- 面向JSON半結(jié)構(gòu)化文檔的聚類技術(shù)研究.pdf
- 領(lǐng)域本體的半自動(dòng)構(gòu)建方法研究與實(shí)現(xiàn).pdf
- 基于半結(jié)構(gòu)化文本信息抽取的簡(jiǎn)歷識(shí)別系統(tǒng).pdf
評(píng)論
0/150
提交評(píng)論