基于框架語義的漢語篇章連貫性研究.pdf_第1頁
已閱讀1頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、關(guān)于漢語篇章連貫性的理論和技術(shù)研究是篇章分析領(lǐng)域的一個重要研究課題。從語言學角度看,篇章連貫性是指篇章按照篇章關(guān)系,將篇章中所表達的各種概念關(guān)聯(lián)組織起來形成一個完整的結(jié)構(gòu),從而來表達篇章的語義。從計算機的計算可操作性角度看,為了獲得篇章所表達的語義,我們需要研究一種描述體系來表示篇章的連貫性,并在此基礎(chǔ)上進行相關(guān)技術(shù)研究。
  針對篇章連貫性的表示問題,本文基于漢語框架語義構(gòu)建了篇章連貫性描述體系。同時,為了進一步展開篇章連貫性的

2、相關(guān)技術(shù)研究,本文建設(shè)了相應(yīng)的漢語篇章語料庫。依據(jù)此描述體系,針對漢語篇章連貫性分析的技術(shù)研究主要包括三個子任務(wù):篇章單元切割、篇章結(jié)構(gòu)生成以及篇章關(guān)系識別。本文在自建的語料庫上,對這三個任務(wù)的自動分析技術(shù)進行了初步的句子級探索。
  本文主要研究內(nèi)容和研究成果如下:
 ?。?)針對篇章連貫性的表示問題,本文基于漢語框架語義,建立了方便計算機實現(xiàn)的框架篇章連貫性描述體系。該描述體系將連貫這個篇章語言學中的問題轉(zhuǎn)化為一個可計算

3、的篇章框架語義結(jié)構(gòu)樹分析問題,為篇章連貫提供了合適的表示機制和計算基礎(chǔ)。
  (2)針對漢語篇章語料庫不足,無法進行篇章連貫性技術(shù)研究的問題,本文依據(jù)描述體系建設(shè)了一個包含496篇篇章的漢語篇章框架語料庫,并進行了人工一致性檢驗。該語料庫的建設(shè)不僅彌補了漢語篇章語料庫不足的問題,也為漢語篇章連貫性分析研究任務(wù)提供了資源支撐。
 ?。?)針對篇章單元切割問題,本文結(jié)合漢語標點符號與漢語框架語義的特點制定了一系列規(guī)則,實現(xiàn)了篇章

4、單元的三層級切割。實驗證明,框架語義可以有效切割篇章單元。
 ?。?)針對篇章結(jié)構(gòu)生成問題,本文通過抽取依存句法、短語結(jié)構(gòu)、目標詞、框架等特征,首先訓練篇章關(guān)系存在性最大熵分類模型,然后采用貪婪算法自下向上生成篇章結(jié)構(gòu)樹。實驗結(jié)果證明,對于篇章結(jié)構(gòu)生成任務(wù),框架特征可以有效提升該任務(wù)的準確率。
  (5)針對篇章關(guān)系識別問題,本文通過抽取句首、依存句法、短語結(jié)構(gòu)、目標詞、框架等特征,訓練了基于最大熵的篇章關(guān)系分類器。實驗結(jié)果

5、證明,對于篇章關(guān)系識別任務(wù),框架特征可以有效提升該任務(wù)的準確率。
  本文針對漢語篇章連貫性研究,提出了基于框架語義的漢語篇章連貫性描述體系,并且在自建的漢語篇章框架語料庫上對篇章的連貫性分析研究任務(wù)進行了實驗,實驗結(jié)果證明了框架語義在解決篇章連貫性問題上具有較好的作用,不僅可以從形式上表示篇章的連貫性,并且可以有效提高篇章連貫性三個任務(wù)的正確率。本文關(guān)于篇章連貫性研究的展開為篇章分析領(lǐng)域提供了一種新的篇章連貫性描述體系以及研究方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論