[發(fā)明專利]評價中間語的詞語的方法和裝置以及機器翻譯方法和設備有效
| 申請?zhí)枺?/td> | 201310150456.1 | 申請日: | 2013-04-26 |
| 公開(公告)號: | CN104123274B | 公開(公告)日: | 2018-06-12 |
| 發(fā)明(設計)人: | 付亦雯;葛乃晟;鄭仲光;孟遙;于浩 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 康建峰;王娜麗 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 中間語 詞語 目標語 源語言 機器翻譯 可靠性分數 詞語翻譯 機器翻譯設備 方法和設備 方法和裝置 語義準確性 橋梁 平衡 | ||
本發(fā)明涉及一種對中間語的詞語進行評價的方法和對中間語的詞語進行評價的裝置以及機器翻譯方法和機器翻譯設備。對中間語的詞語進行評價的方法,包括確定中間語的詞語相對于源語言的第一特定屬性;確定中間語的詞語相對于目標語的第二特定屬性;根據第一特定屬性和第二特定屬性來計算中間語的詞語的可靠性分數;以及根據可靠性分數來評價中間語的詞語,其中,中間語的詞語是將源語言的特定詞語翻譯成目標語的詞語的橋梁,其中,中間語的詞語的可靠性是該中間語的詞語成為將源語言的特定詞語翻譯成目標語的詞語的橋梁的可能性與語義準確性的平衡。
技術領域
本發(fā)明涉及語言處理領域,具體涉及對中間語的詞語進行評價的方法和對中間語的詞語進行評價的裝置以及機器翻譯方法和機器翻譯設備。
背景技術
平行的詞匯信息在交叉語言應用(包括機器翻譯、交叉語言信息獲取等等)中占有至關重要的地位。然而,不是任何兩種語言的平行詞匯信息的獲取都是可行的,尤其是那些使用范圍非常有限的語言。另外,由于新名詞的發(fā)展十分迅速,因而想要使所掌握的平行詞匯信息能夠追趕上新名詞的發(fā)展十分困難。因此,中間語(Pivot language)這一概念被引入。通過中間語來補充更多的平行詞匯信息。然而,對中間語的使用主要存在兩個主要障礙,第一是歧義性,第二是不匹配。
為解決源語言(Source language)、中間語與目標語(Target language)的歧義問題,傳統(tǒng)方法使用結構化雙語詞典、語義類別(semantic class)、多個中間語言、相關頻率、編輯距離等信息。傳統(tǒng)方法始終相信源語言與中間語之間的翻譯概率、中間語與目標語之間的翻譯概率可以反映歧義問題,并可以通過選擇最高概率來解決歧義問題。
通過中間語獲取雙語信息的傳統(tǒng)方法基本遵循如下過程。首先獲取源語言與中間語的信息、中間語與目標語的信息,例如,翻譯概率、詞匯化翻譯概率、編輯距離,語義信息等。通過這些信息選擇出最可靠的成對的源語言詞語與目標語詞語。然而,如果中間語含有多個語義,傳統(tǒng)方法并不會對這種情況進行特殊處理,而是依舊選擇翻譯概率最高的詞語作為最終結果。這種做法忽略了源自非平行語料的源語言和目標語不具有相同涵義這一特點,因此,在中間語的詞語具有歧義的情況下,翻譯概率并不能反映源語言的詞語與目標語的詞語之間的語義關系。
因此,期望提出一種能夠解決上述問題的技術。
發(fā)明內容
在下文中給出關于本發(fā)明的簡要概述,以便提供關于本發(fā)明的某些方面的基本理解。應當理解,這個概述并不是關于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
本發(fā)明的一個主要目的在于,提供一種對中間語的詞語進行評價的方法和對中間語的詞語進行評價的裝置以及機器翻譯方法和機器翻譯設備。
根據本發(fā)明的一個方面,提供了一種對中間語的詞語進行評價的方法。該方法包括:確定中間語的詞語相對于源語言的第一特定屬性,其中所述第一特定屬性包括所述中間語的詞語在所述源語言中的第一語義范圍,所述第一語義范圍是所述源語言中與所述中間語的詞語對應的詞語的數量或該數量的函數;確定中間語的詞語相對于目標語的第二特定屬性,其中所述第二特定屬性包括所述中間語的詞語在所述目標語中的第二語義范圍,所述第二語義范圍是所述目標語中與所述中間語的詞語對應的詞語的數量或該數量的函數;根據第一特定屬性和第二特定屬性來計算中間語的詞語的可靠性分數;以及根據可靠性分數來評價中間語的詞語,其中,中間語的詞語是將源語言的特定詞語翻譯成目標語的詞語的橋梁,其中,中間語的詞語的可靠性是該中間語的詞語成為將源語言的特定詞語翻譯成目標語的詞語的橋梁的可能性與語義準確性的平衡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310150456.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據查詢方法及裝置
- 下一篇:數據傳輸方法、觸控數據處理方法以及電子裝置





