版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、作為中國文化傳承和精美藝術品的詩詞曲聯(lián)作品,在信息時代面臨著重新整理和信息挖掘的問題,而立足于當代,需要運用信息處理工具進行深入分析和智能模擬,由于語料庫技術和機器學習技術的發(fā)展,解決了海量數(shù)據(jù)的結構化存儲和機器自動處理的問題。在機器學習的框架下,傳統(tǒng)詩詞的問題得到探索分析的條件已經(jīng)初步具備,相對而言傳統(tǒng)的文學分析能在信息技術的提攜下,獲得處理理念和視角上的一次更生,使得海量而又錯綜棘手的古典文學分析研究,在機器輔助下,其結果更加易懂明
2、了,其處理更加自動化。 本文是在國家自然科學基金項目“計算機輔助文學藝術創(chuàng)作——詩詞曲聯(lián)(上)(項目編號60173060)的支持下,進行的是應用驅(qū)動型的研究,即“詩詞風格的機器評判和聯(lián)語(對仗)語句的生成”。在本文的研究中,對詩詞采用向量空間模型表示,并用基于機器學習中的Na?ve Bayes等方法,首次提出了古典詩詞的豪放和婉約風格辨析計算模型,并用遺傳算法等方法對模型進行改進,取得較好的詩詞風格評判結果。首次提出了古典詩詞的
3、作者辨析計算模型,該模型已經(jīng)在精典詩詞語料的機器學習基礎上得以實現(xiàn),也獲得較好的詩詞作者評判效果。通過將聯(lián)語應對問題轉(zhuǎn)化為序列學習建模的問題,進行了聯(lián)語應對生成的研究,依據(jù)輸入的上聯(lián),機器能較為成功地應對生成下聯(lián),并在實際的詩詞對聯(lián)語料數(shù)據(jù)上進行了大量的實驗,實驗的結果驗證了這些方法的可行性和有效性。本論文的主要研究內(nèi)容如下: 1)由于機器學習和古典文學數(shù)字化的需要,本文提出的方法和實驗研究都基于語料庫的數(shù)據(jù)驅(qū)動進行,因此簡
4、要介紹了唐詩、宋詞和對聯(lián)語料庫的建立。這部分內(nèi)容主要集中在本文的第二章。 2)針對高度抽象的藝術概念“風格”的辨析,著重從三個問題展開研究。第一、詩詞的風格能否用機器評判,即可行性問題;第二、詩詞的風格由機器通過什么方式評判,即怎么做問題;第三、如何提高機器評判的效果,即優(yōu)化問題。對于第一個問題,本文提出將詩詞的風格評判問題轉(zhuǎn)化為一種文本的模式識別問題而得以解決。對于第二個問題,本文探索了詩詞的韻部和聲調(diào)對風格的影響,發(fā)現(xiàn)兩者
5、對解決詩詞風格的評判問題的難度較大,最后采用了用以字為研究對象的向量空間模型來表示詩詞,使詩詞的風格得以順利進行。對于第三個問題,結合信息增益挑選用于風格評判的漢字,并用遺傳算法等方法改進了詩詞風格的評判效果,用55個漢字獲得了88.5%的評判準確度。這部分內(nèi)容方法論述集中在本文的第三章,實驗介紹在第四章。 3)在文學流派的用字分析中,對于豪放和婉約風格評判的詩詞數(shù)據(jù)進行了探索性分析。分別采用了層次聚類法和自組織映射SOM聚類
6、方法探索了基于字同現(xiàn)關系的關聯(lián)現(xiàn)象,并分別得到了層次聚類樹和視覺可視化的SOM聚類圖。并對聚類結果進行了分析。揭示了豪放和婉約的宋詞中分別常用的同現(xiàn)字,及其兩種風格流派各自的用字風格特點。在SOM聚類的基礎上將有代表性的字選擇出來,作為SVM評判的特征,取得83%準確度的豪放和婉約判別結果。這部分內(nèi)容集中在本文的第五章。 4)詩詞作者的風格評判采用了與詩詞風格的相類似的方法進行了有效的機器評判,并在此基礎上用層次聚類法進行了作
7、者數(shù)據(jù)的探索性分析,揭示了李白和杜甫的在詩詞中分別常用的同現(xiàn)字,及其兩位典型詩人各自的用字風格特點。這部分內(nèi)容與豪放和婉約風格的辨析相類似,方法理論集中在本文的第三章、實驗介紹集中在第四章,聚類分析集中在第五章。 5)在分析傳統(tǒng)對聯(lián)特點的基礎上,將聯(lián)語的應對生成問題抽象為有監(jiān)督的序列學習問題。將對聯(lián)的上下聯(lián)分別可以看作兩個具有相同長度的語言單位的序列,采用機器學習方法對其學習。首次提出了不限字數(shù)的聯(lián)語應對生成的計算模型,并分別
8、用N元統(tǒng)計語言模型序列學習方法、隱馬爾可夫模型序列學習法和基于轉(zhuǎn)換的錯誤驅(qū)動序列學習法,對聯(lián)語應對生成進行建模分析,并在建立的對聯(lián)語料庫機器學習基礎上分別上機編程實現(xiàn)。在僅以字為語言單位的春聯(lián)的應對生成上也取得較好的效果,構造了基于語料庫不限字數(shù)的計算機聯(lián)語應對實驗系統(tǒng),取得了較好的實驗結果,如將針對慶祝神州五號載人飛船發(fā)射而出的上聯(lián)“九天攬月,華夏英豪馳宇宙;”,自動應對得出下聯(lián)“四海迎春,神州崛起舞天下?!?。這部分內(nèi)容理論論述集中在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中學計算機輔助物理教學課件創(chuàng)作研究.pdf
- 遺傳算法在計算機輔助樂曲創(chuàng)作中的研究與應用.pdf
- 產(chǎn)品風格約束的計算機輔助形態(tài)設計技術研究.pdf
- 計算機輔助教學對學習風格因素的影響.pdf
- 計算機輔助分析
- 計算機輔助測量及應用研究.pdf
- 基于產(chǎn)品風格認知模型的計算機輔助概念設計技術的研究.pdf
- 計算機輔助分析系統(tǒng)的研究.pdf
- 計算機輔助診斷塵肺的研究.pdf
- 外文翻譯---計算機輔助設計和計算機輔助(cadcam)
- 車身計算機輔助造型研究.pdf
- 計算機媒介語篇中的詞匯特點.pdf
- 復雜土壤結構中接地網(wǎng)參數(shù)的計算機輔助計算及研究.pdf
- 計算機輔助跟蹤中的數(shù)字濾波.pdf
- 計算機輔助夾具設計.pdf
- 計算機輔助幾何設計
- 計算機輔助定位系統(tǒng)的實現(xiàn)及算法研究.pdf
- 計算機輔助管理試題
- 計算機輔助教育
- 計算機輔助審計系統(tǒng)中關鍵技術的研究.pdf
評論
0/150
提交評論