![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/15/6afaa4d2-6e2b-485b-a0fd-a15ffb2c9327/6afaa4d2-6e2b-485b-a0fd-a15ffb2c9327pic.jpg)
![口語解析與短語翻譯對(duì)自動(dòng)抽取方法研究.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/15/6afaa4d2-6e2b-485b-a0fd-a15ffb2c9327/6afaa4d2-6e2b-485b-a0fd-a15ffb2c93271.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、口語翻譯是語音、語言技術(shù)領(lǐng)域重要的研究方向之一,具有巨大的應(yīng)用價(jià)值??谡Z翻譯涉及到語言學(xué)、計(jì)算機(jī)科學(xué)、語音識(shí)別、語音合成和通訊等多種學(xué)科和技術(shù),開展這項(xiàng)研究具有非常重要的科學(xué)意義。 隨著各國人們在文化,經(jīng)濟(jì),體育等各方面的日常交流日趨頻繁,口語翻譯越來越受到人們的關(guān)注。本文針對(duì)基于中間語言的口語翻譯方法中的口語解析問題和基于統(tǒng)計(jì)模型的口語翻譯方法中的短語翻譯對(duì)自動(dòng)抽取問題以及口語翻譯系統(tǒng)實(shí)驗(yàn)平臺(tái)建設(shè)等幾個(gè)方面做了相關(guān)的研究和實(shí)現(xiàn)
2、工作,主要內(nèi)容歸納為如下幾點(diǎn): 1.論文在面向中間轉(zhuǎn)換格式(InterchangeFormat,IF)【"NESPOLE",2002】的口語解析方法研究方面,提出了一種基于語義分類樹的漢語口語淺層語義解析方法,用來獲取漢語口語句子的淺層語義領(lǐng)域行為(IF的一部分)。該方法利用統(tǒng)計(jì)模型從訓(xùn)練語料中自動(dòng)獲取語義規(guī)則構(gòu)造語義分類樹,并利用語義分類樹對(duì)句子中和領(lǐng)域行為密切相關(guān)的詞語進(jìn)行解析,然后對(duì)多個(gè)詞的解析結(jié)果利用統(tǒng)計(jì)解析模型進(jìn)行選擇
3、和組合,從而生成句子的領(lǐng)域行為表示。規(guī)則自動(dòng)獲取方法避免了人工制定規(guī)則的繁瑣性和主觀性,保證了解析具有較高的魯棒性;利用統(tǒng)計(jì)模型對(duì)領(lǐng)域行為各部分進(jìn)行組合,避免了對(duì)IF表達(dá)能力的影響;與HMM相比,語義分類樹擴(kuò)大了解析窗口,更好地利用了上下文信息。實(shí)驗(yàn)結(jié)果表明:這種方法在限定領(lǐng)域內(nèi)進(jìn)行漢語口語淺層語義解析具有較高的準(zhǔn)確率和魯棒性。 2.基于統(tǒng)計(jì)模型的口語翻譯方法是目前口語翻譯研究領(lǐng)域中非常重要的方法?;诙陶Z的統(tǒng)計(jì)翻譯方法與基于單
4、個(gè)詞的統(tǒng)計(jì)翻譯方法相比,可以更好地處理句子中短語內(nèi)部詞語之間的關(guān)系,從而有效地提高機(jī)器翻譯系統(tǒng)的性能。基于短語的統(tǒng)計(jì)翻譯方法之一把短語翻譯對(duì)作為知識(shí)源加入到系統(tǒng)中,這樣整個(gè)系統(tǒng)的性能對(duì)于使用的短語翻譯對(duì)的質(zhì)量具有非常大的依賴性,針對(duì)這個(gè)問題,論文提出了一種改進(jìn)的基于HMM的短語翻譯對(duì)抽取方法,從大規(guī)模訓(xùn)練語料中自動(dòng)抽取高質(zhì)量的短語翻譯對(duì),作為統(tǒng)計(jì)口語翻譯的知識(shí)源。這種方法首先利用HMM對(duì)雙語句子進(jìn)行雙向?qū)R,然后根據(jù)對(duì)齊的結(jié)果抽取短語翻
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于統(tǒng)計(jì)的中文文本關(guān)鍵短語自動(dòng)抽取方法研究.pdf
- 領(lǐng)域術(shù)語自動(dòng)抽取方法研究.pdf
- 基于WEB的雙語翻譯對(duì)抽取方法研究.pdf
- 詞語搭配自動(dòng)抽取方法對(duì)比研究.pdf
- 短語級(jí)復(fù)述的識(shí)別與抽取.pdf
- 中文術(shù)語自動(dòng)抽取相關(guān)方法研究.pdf
- 網(wǎng)頁信息的自動(dòng)抽取方法研究.pdf
- 短語級(jí)復(fù)述的識(shí)別與抽取
- 金融領(lǐng)域信息的自動(dòng)抽取與分析方法.pdf
- 特定領(lǐng)域術(shù)語自動(dòng)抽取方法的研究.pdf
- 基于DOM信息抽取技術(shù)的網(wǎng)頁自動(dòng)翻譯方法的應(yīng)用研究.pdf
- Web記錄自動(dòng)抽取與去重方法的研究與實(shí)現(xiàn).pdf
- 可比語料中命名實(shí)體翻譯等價(jià)對(duì)抽取方法研究.pdf
- 基于Hadoop的Web評(píng)論自動(dòng)抽取方法研究.pdf
- 英漢機(jī)器翻譯模板自動(dòng)抽取算法的研究與實(shí)現(xiàn).pdf
- 文本宏特征抽取與基于質(zhì)心的自動(dòng)分類方法研究.pdf
- 關(guān)鍵短語抽取及相關(guān)技術(shù)研究.pdf
- 利用web抽取雙語翻譯對(duì)的研究與實(shí)現(xiàn).pdf
- 關(guān)鍵短語抽取及相關(guān)技術(shù)研究
- 典型關(guān)系抽取系統(tǒng)的技術(shù)方法解析
評(píng)論
0/150
提交評(píng)論