[發明專利]評價中間語的詞語的方法和裝置以及機器翻譯方法和設備有效
| 申請號: | 201310150456.1 | 申請日: | 2013-04-26 |
| 公開(公告)號: | CN104123274B | 公開(公告)日: | 2018-06-12 |
| 發明(設計)人: | 付亦雯;葛乃晟;鄭仲光;孟遙;于浩 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 康建峰;王娜麗 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 中間語 詞語 目標語 源語言 機器翻譯 可靠性分數 詞語翻譯 機器翻譯設備 方法和設備 方法和裝置 語義準確性 橋梁 平衡 | ||
1.一種對中間語的詞語進行評價的方法,包括:
確定所述中間語的詞語相對于源語言的第一特定屬性,其中所述第一特定屬性包括所述中間語的詞語在所述源語言中的第一語義范圍,所述第一語義范圍是所述源語言中與所述中間語的詞語對應的詞語的數量或該數量的函數;
確定所述中間語的詞語相對于目標語的第二特定屬性,其中所述第二特定屬性包括所述中間語的詞語在所述目標語中的第二語義范圍,所述第二語義范圍是所述目標語中與所述中間語的詞語對應的詞語的數量或該數量的函數;
根據所述第一特定屬性和所述第二特定屬性來計算所述中間語的詞語的可靠性分數;以及
根據所述可靠性分數來評價所述中間語的詞語,
其中,所述中間語的詞語是將源語言的特定詞語翻譯成目標語的詞語的橋梁,
其中,所述中間語的詞語的可靠性是所述中間語的詞語成為將所述源語言的特定詞語翻譯成所述目標語的詞語的橋梁的可能性與語義準確性的平衡。
2.根據權利要求1所述的方法,其中,所述第一特定屬性還包括:
所述中間語的詞語到所述源語言的特定詞語的翻譯概率;和/或
所述中間語的詞語到所述源語言的特定詞語的詞匯化翻譯概率。
3.根據權利要求1所述的方法,其中,在確定所述中間語的詞語相對于源語言的第一特定屬性的步驟之前,所述方法還包括:
將所述源語言的特定詞語與所述中間語的語庫中的詞語對齊以得到所述中間語的第一詞語;
從所述第一詞語中去除不與所述源語言的特定詞語對應的部分以得到第一對齊詞語;
將所述目標語的語庫中的詞語與所述中間語的語庫中的詞語對齊以得到所述中間語的第二詞語;
從所述第二詞語中去除不與所述目標語的語庫中的詞語對齊的部分以得到第二對齊詞語;以及
將所述第一對齊詞語和所述第二對齊詞語的交集中的詞語作為所述中間語的待評價的詞語。
4.根據權利要求3所述的方法,其中,在將所述第一對齊詞語和所述第二對齊詞語的交集中的詞語作為所述中間語的待評價的詞語的步驟之前還包括:
分別判斷所述第一對齊詞語的起始部分和所述第二對齊詞語的起始部分是否穩定,
如果所述第一對齊詞語的起始部分和所述第二對齊詞語的起始部分不穩定,則去除所述起始部分。
5.根據權利要求4所述的方法,其中,判斷所述第一對齊詞語的起始部分和所述第二對齊詞語的起始部分是否穩定的步驟包括:
分別判斷所述第一對齊詞語的起始部分和所述第二對齊詞語的起始部分在所述源語言中的語義范圍是否超過第一閾值;和/或
分別判斷所述第一對齊詞語的起始部分和所述第二對齊詞語的起始部分在所述目標語中的語義范圍是否超過第二閾值。
6.一種機器翻譯方法,包括:
根據權利要求1至5中任一項所述的方法獲得所述中間語的詞語的可靠性分數;
根據所述中間語的詞語的可靠性分數、以及將源語言的特定詞語通過所述中間語的詞語翻譯成所述目標語的候選詞語的機器翻譯分數,計算所述目標語的所述候選詞語的翻譯分數;以及
根據所述翻譯分數從所述目標語的所述候選詞語中選擇所述目標語的詞語作為翻譯結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310150456.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據查詢方法及裝置
- 下一篇:數據傳輸方法、觸控數據處理方法以及電子裝置





