基于遺傳算法的宋詞自動生成研究.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、詩歌作為一種特殊的文學體裁,其計算機模擬生成被視為自然語言生成領(lǐng)域的一大挑戰(zhàn)。本文以漢語古典詩詞為研究對象,對機器自動生成宋詞的可能性和具體實現(xiàn)方法進行了詳細的研究和討論。本文的研究內(nèi)容主要有以下幾大方面: 1、對詩歌生成領(lǐng)域到目前為止的研究成果進行了總結(jié)和分類,介紹了每種方法的主要步驟和代表性詩歌生成系統(tǒng)。并對中國古典詩詞的計算語言學研究進行了綜述。 2、建立宋詞語料庫。通過對格律的研究將詞句細分為子句,對子句字串進行

2、統(tǒng)計,綜合利用頻率、共現(xiàn)度等參數(shù)抽取結(jié)合強度高的字串,并結(jié)合各種已有的詞典資源來建立宋詞詞表。采用條件概率等方法對已切分的宋詞進行注音,建立音韻數(shù)據(jù)庫。 3、建立宋詞生成相關(guān)的語法規(guī)范,提出用確定性自動機(DFA)進行詞句語法合法性判斷的方法。進行語義度量的計算:采用潛在語義分析和互信息兩種方法計算詞義相關(guān)度;采用詞典和語料庫統(tǒng)計相結(jié)合的方法計算詞義相似度;成立專家組對高頻詞進行風格和情感的分級評判。 4、提出基于遺傳算

3、法的宋詞生成模型。根據(jù)宋詞特點,設(shè)計了基于平仄的編碼方式、基于語法和語義加權(quán)值的適應(yīng)度函數(shù)、基于精英主義和輪盤賭算法的選擇策略、部分映射和啟發(fā)式交叉算子和啟發(fā)式變異算子。并詳細介紹了各主要操作的實現(xiàn)步驟。 5、建立基于遺傳算法的宋詞生成系統(tǒng),給出系統(tǒng)框架、主要實現(xiàn)流程和宋詞生成實例。對實驗結(jié)果進行了分析和總結(jié)。 實驗結(jié)果表明,本文建立的計算模型和設(shè)計的系統(tǒng)初步實現(xiàn)了計算機自動生成宋詞的目標,為今后進一步的研究提供了理論和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論