[發(fā)明專利]評價中間語的詞語的方法和裝置以及機(jī)器翻譯方法和設(shè)備有效
| 申請?zhí)枺?/td> | 201310150456.1 | 申請日: | 2013-04-26 |
| 公開(公告)號: | CN104123274B | 公開(公告)日: | 2018-06-12 |
| 發(fā)明(設(shè)計)人: | 付亦雯;葛乃晟;鄭仲光;孟遙;于浩 | 申請(專利權(quán))人: | 富士通株式會社 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 康建峰;王娜麗 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 中間語 詞語 目標(biāo)語 源語言 機(jī)器翻譯 可靠性分?jǐn)?shù) 詞語翻譯 機(jī)器翻譯設(shè)備 方法和設(shè)備 方法和裝置 語義準(zhǔn)確性 橋梁 平衡 | ||
本發(fā)明涉及一種對中間語的詞語進(jìn)行評價的方法和對中間語的詞語進(jìn)行評價的裝置以及機(jī)器翻譯方法和機(jī)器翻譯設(shè)備。對中間語的詞語進(jìn)行評價的方法,包括確定中間語的詞語相對于源語言的第一特定屬性;確定中間語的詞語相對于目標(biāo)語的第二特定屬性;根據(jù)第一特定屬性和第二特定屬性來計算中間語的詞語的可靠性分?jǐn)?shù);以及根據(jù)可靠性分?jǐn)?shù)來評價中間語的詞語,其中,中間語的詞語是將源語言的特定詞語翻譯成目標(biāo)語的詞語的橋梁,其中,中間語的詞語的可靠性是該中間語的詞語成為將源語言的特定詞語翻譯成目標(biāo)語的詞語的橋梁的可能性與語義準(zhǔn)確性的平衡。
技術(shù)領(lǐng)域
本發(fā)明涉及語言處理領(lǐng)域,具體涉及對中間語的詞語進(jìn)行評價的方法和對中間語的詞語進(jìn)行評價的裝置以及機(jī)器翻譯方法和機(jī)器翻譯設(shè)備。
背景技術(shù)
平行的詞匯信息在交叉語言應(yīng)用(包括機(jī)器翻譯、交叉語言信息獲取等等)中占有至關(guān)重要的地位。然而,不是任何兩種語言的平行詞匯信息的獲取都是可行的,尤其是那些使用范圍非常有限的語言。另外,由于新名詞的發(fā)展十分迅速,因而想要使所掌握的平行詞匯信息能夠追趕上新名詞的發(fā)展十分困難。因此,中間語(Pivot language)這一概念被引入。通過中間語來補(bǔ)充更多的平行詞匯信息。然而,對中間語的使用主要存在兩個主要障礙,第一是歧義性,第二是不匹配。
為解決源語言(Source language)、中間語與目標(biāo)語(Target language)的歧義問題,傳統(tǒng)方法使用結(jié)構(gòu)化雙語詞典、語義類別(semantic class)、多個中間語言、相關(guān)頻率、編輯距離等信息。傳統(tǒng)方法始終相信源語言與中間語之間的翻譯概率、中間語與目標(biāo)語之間的翻譯概率可以反映歧義問題,并可以通過選擇最高概率來解決歧義問題。
通過中間語獲取雙語信息的傳統(tǒng)方法基本遵循如下過程。首先獲取源語言與中間語的信息、中間語與目標(biāo)語的信息,例如,翻譯概率、詞匯化翻譯概率、編輯距離,語義信息等。通過這些信息選擇出最可靠的成對的源語言詞語與目標(biāo)語詞語。然而,如果中間語含有多個語義,傳統(tǒng)方法并不會對這種情況進(jìn)行特殊處理,而是依舊選擇翻譯概率最高的詞語作為最終結(jié)果。這種做法忽略了源自非平行語料的源語言和目標(biāo)語不具有相同涵義這一特點,因此,在中間語的詞語具有歧義的情況下,翻譯概率并不能反映源語言的詞語與目標(biāo)語的詞語之間的語義關(guān)系。
因此,期望提出一種能夠解決上述問題的技術(shù)。
發(fā)明內(nèi)容
在下文中給出關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。
本發(fā)明的一個主要目的在于,提供一種對中間語的詞語進(jìn)行評價的方法和對中間語的詞語進(jìn)行評價的裝置以及機(jī)器翻譯方法和機(jī)器翻譯設(shè)備。
根據(jù)本發(fā)明的一個方面,提供了一種對中間語的詞語進(jìn)行評價的方法。該方法包括:確定中間語的詞語相對于源語言的第一特定屬性,其中所述第一特定屬性包括所述中間語的詞語在所述源語言中的第一語義范圍,所述第一語義范圍是所述源語言中與所述中間語的詞語對應(yīng)的詞語的數(shù)量或該數(shù)量的函數(shù);確定中間語的詞語相對于目標(biāo)語的第二特定屬性,其中所述第二特定屬性包括所述中間語的詞語在所述目標(biāo)語中的第二語義范圍,所述第二語義范圍是所述目標(biāo)語中與所述中間語的詞語對應(yīng)的詞語的數(shù)量或該數(shù)量的函數(shù);根據(jù)第一特定屬性和第二特定屬性來計算中間語的詞語的可靠性分?jǐn)?shù);以及根據(jù)可靠性分?jǐn)?shù)來評價中間語的詞語,其中,中間語的詞語是將源語言的特定詞語翻譯成目標(biāo)語的詞語的橋梁,其中,中間語的詞語的可靠性是該中間語的詞語成為將源語言的特定詞語翻譯成目標(biāo)語的詞語的橋梁的可能性與語義準(zhǔn)確性的平衡。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于富士通株式會社,未經(jīng)富士通株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310150456.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 多語言系統(tǒng)實現(xiàn)統(tǒng)一開發(fā)的方法及系統(tǒng)
- 中間語系統(tǒng)、中間語引擎、中間語翻譯系統(tǒng)和相應(yīng)方法
- 評價中間語的詞語的方法和裝置以及機(jī)器翻譯方法和設(shè)備
- 生成單語解析模型的方法和裝置以及語言轉(zhuǎn)換裝置
- 利用TCL實現(xiàn)網(wǎng)頁自動化測試的方法及系統(tǒng)
- 一種基于中間語言的PLC程序驗證系統(tǒng)
- 一種基于中間語言的PLC程序驗證方法
- 提供安全性的設(shè)備和方法以及針對通用中間語言執(zhí)行安全性的設(shè)備和方法
- 一種基于中間語言的形式化規(guī)約語言簡化方法
- 一種編譯驗證方法、裝置、設(shè)備及計算機(jī)可讀存儲介質(zhì)





