![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/17/5fa5a3c6-17c2-4da9-b1e1-61d174d065b7/5fa5a3c6-17c2-4da9-b1e1-61d174d065b7pic.jpg)
![基于短語(yǔ)對(duì)齊的漢—英翻譯知識(shí)自動(dòng)獲取.pdf_第1頁(yè)](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/17/5fa5a3c6-17c2-4da9-b1e1-61d174d065b7/5fa5a3c6-17c2-4da9-b1e1-61d174d065b71.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著因特網(wǎng)的迅猛發(fā)展,“信息爆炸”已成為信息處理領(lǐng)域中的瓶頸問題。信息的日益國(guó)際化及語(yǔ)言之間的障礙形成了人們對(duì)機(jī)器翻譯系統(tǒng)的強(qiáng)烈需求,而普遍存在的知識(shí)獲取難題始終制約著翻譯系統(tǒng)的發(fā)展。語(yǔ)言學(xué)知識(shí)和統(tǒng)計(jì)模型在自然語(yǔ)言信息處理領(lǐng)域所取得的成功,為人們利用語(yǔ)言學(xué)資源和統(tǒng)計(jì)方法實(shí)現(xiàn)翻譯知識(shí)自動(dòng)獲取在理論和實(shí)踐方面指明了方向,對(duì)機(jī)器翻譯的研究將具有重要的理論意義和實(shí)用價(jià)值。本文提出了翻譯知識(shí)自動(dòng)獲取及優(yōu)化方案。在知識(shí)獲取方面,研究了平行雙語(yǔ)語(yǔ)料庫(kù)
2、的對(duì)齊加工技術(shù);探索了翻譯模板自動(dòng)獲取方法。在知識(shí)優(yōu)化方面,研究了短語(yǔ)翻譯對(duì)的評(píng)價(jià)與過濾技術(shù);探索了基于評(píng)價(jià)的模板庫(kù)自動(dòng)優(yōu)化方法。將獲取的翻譯知識(shí)用于一個(gè)基于模板的機(jī)器翻譯系統(tǒng)中,并對(duì)機(jī)器譯文進(jìn)行自動(dòng)評(píng)測(cè)。實(shí)驗(yàn)結(jié)果表明:本文提出的知識(shí)獲取方法可以提高系統(tǒng)的譯文輸出質(zhì)量,降低人工獲取翻譯知識(shí)的代價(jià)。具體地講,本文將從以下幾個(gè)方面開展研究:
1.研究了平行雙語(yǔ)語(yǔ)料庫(kù)的短語(yǔ)對(duì)齊加工技術(shù)。分析了常用的短語(yǔ)對(duì)齊方法,及制約對(duì)齊結(jié)果的各項(xiàng)
3、因素。為雙語(yǔ)句對(duì)建立譯文等價(jià)樹,利用貪心算法來消除同層結(jié)點(diǎn)譯文邊界之間的交叉沖突。該等價(jià)樹僅考慮源語(yǔ)言句法信息,避開了源語(yǔ)言和目標(biāo)語(yǔ)兩種語(yǔ)法體系之間的不一致性對(duì)短語(yǔ)對(duì)齊的影響,以便從中獲取高質(zhì)量的短語(yǔ)翻譯對(duì)。
2.研究了短語(yǔ)翻譯對(duì)自動(dòng)優(yōu)化方法。探討了評(píng)價(jià)雙語(yǔ)互譯的常用方法,提出了短語(yǔ)翻譯對(duì)的評(píng)價(jià)特征。該特征同時(shí)包含了源語(yǔ)言與目標(biāo)語(yǔ)兩部分信息,以期望能夠從語(yǔ)言現(xiàn)象本身去反映短語(yǔ)對(duì)的互譯程度,獲取較好的優(yōu)化結(jié)果。使用評(píng)價(jià)特征對(duì)自動(dòng)
4、獲取的短語(yǔ)翻譯對(duì)集合進(jìn)行過濾,以消除其中的噪聲。同時(shí)在評(píng)價(jià)特征的基礎(chǔ)之上,使用多種機(jī)器學(xué)習(xí)算法來提高短語(yǔ)對(duì)的評(píng)價(jià)與過濾性能。
3.研究了翻譯模板自動(dòng)提取技術(shù)。對(duì)比了幾種常用的模板抽取方法,提出了使用錯(cuò)誤驅(qū)動(dòng)的學(xué)習(xí)方法來獲取模板。利用源語(yǔ)言的句法特征、詞性特征、詞法特征、核心結(jié)點(diǎn)信息及機(jī)器翻譯詞典,對(duì)短語(yǔ)對(duì)進(jìn)行簡(jiǎn)單地映射以提取學(xué)習(xí)實(shí)例。采用錯(cuò)誤驅(qū)動(dòng)的學(xué)習(xí)方法從中抽取翻譯模板,力圖解決模板自動(dòng)獲取問題。同時(shí),對(duì)翻譯模板庫(kù)進(jìn)行合理地
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 漢維翻譯系統(tǒng)中的對(duì)齊語(yǔ)料的自動(dòng)獲取技術(shù)研究.pdf
- 基于文本挖掘的翻譯知識(shí)自動(dòng)獲取研究.pdf
- 基于KDD的知識(shí)自動(dòng)獲取及其應(yīng)用.pdf
- 基于短語(yǔ)的蒙漢統(tǒng)計(jì)機(jī)器翻譯研究.pdf
- 英、漢、韓名詞短語(yǔ)修飾成分序列對(duì)比研究.pdf
- 基于對(duì)齊技術(shù)的搭配獲取及其在機(jī)器翻譯中的應(yīng)用研究.pdf
- 基于層次短語(yǔ)模型的蒙-漢統(tǒng)計(jì)機(jī)器翻譯研究.pdf
- 基于WEB的雙語(yǔ)句對(duì)齊語(yǔ)料的獲取和過濾.pdf
- 一種藏漢句子自動(dòng)對(duì)齊系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于層次短語(yǔ)的漢蒙統(tǒng)計(jì)機(jī)器翻譯后處理研究.pdf
- 基于關(guān)聯(lián)度和詞對(duì)齊的雙語(yǔ)組塊獲取研究.pdf
- 基于短語(yǔ)句法結(jié)構(gòu)的樹-串漢英對(duì)齊模板抽取研究.pdf
- 英到漢-外文翻譯-汽車轉(zhuǎn)向系統(tǒng)
- 功能翻譯理論視角下的英-漢新聞編譯.pdf
- 基于跨語(yǔ)言映射的漢語(yǔ)語(yǔ)義知識(shí)自動(dòng)獲取方法的研究.pdf
- 英-漢翻譯心理詞匯交叉作用之研究.pdf
- 漢日英翻譯中的擬聲、擬態(tài)詞對(duì)比研究.pdf
- 基于知識(shí)管理的客戶知識(shí)獲取研究
- 服務(wù)于漢維機(jī)器翻譯系統(tǒng)的雙語(yǔ)句子對(duì)齊的研究.pdf
- 基于規(guī)則和基于統(tǒng)計(jì)相結(jié)合的中英雙語(yǔ)平行句對(duì)短語(yǔ)對(duì)齊方法.pdf
評(píng)論
0/150
提交評(píng)論