[發明專利]機器翻譯設備、方法和系統無效
| 申請號: | 200810149207.X | 申請日: | 2008-09-17 |
| 公開(公告)號: | CN101393547A | 公開(公告)日: | 2009-03-25 |
| 發明(設計)人: | 鈴木博和;木下聰 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 永新專利商標代理有限公司 | 代理人: | 鐘勝光 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器翻譯 設備 方法 系統 | ||
1、一種機器翻譯設備,其包括:
辭典存儲單元,其用于存儲雙語詞條信息和標識信息,在所述雙語詞條信息中使第一語言形式的第一單詞和第二語言形式的第二單詞彼此相關聯,所述標識信息標識所述雙語詞條信息;
源語句存儲單元,其用于存儲彼此相關聯的所述第一語言形式的源語句和用于翻譯所述源語句的所述雙語詞條信息的標識信息;
接收單元,其用于接收包括所述第一語言形式的輸入語句的翻譯請求;
源語句獲得單元,其用于計算所述輸入語句和所述源語句之間的相似度,并從所述源語句存儲單元獲得所述相似度高于預定閾值的所述源語句;
雙語詞條信息獲得單元,其用于從所述辭典存儲單元獲得所述標識信息對應于由所述源語句獲得單元獲得的所述源語句的所述雙語詞條信息;以及
翻譯單元,其用于判斷由所述雙語詞條信息獲得單元獲得的所述雙語詞條信息中的所述第一單詞是否包括在所述輸入語句中,并且在所述第一單詞包括在所述輸入語句中時,將在所述輸入語句中包括的所述第一單詞翻譯成所述雙語詞條信息中的所述第二單詞。
2、根據權利要求1所述的設備,其中
所述接收單元接收所述翻譯請求,所述翻譯請求包括所述輸入語句和在翻譯所述輸入語句期間要使用的輸入雙語詞條信息,以及
所述翻譯單元還判斷所獲得的雙語詞條信息中的所述第一單詞與所述輸入雙語詞條信息中的所述第一單詞是否相同,并且在所獲得的雙語詞條信息中的所述第一單詞與所述輸入雙語詞條信息中的所述第一單詞相同且所述相同的第一單詞包括在所述輸入語句中時,將所述輸入語句中包括的所述第一單詞翻譯成所述輸入雙語詞條信息中的所述第二單詞。
3、根據權利要求1所述的設備,其中,所述源語句獲得單元計算所述輸入語句和所述源語句之間的編輯距離,并為編輯距離較小的所述源語句分配比編輯距離較大的所述源語句更高的相似度。
4、根據權利要求1所述的設備,其中
所述源語句存儲單元存儲包括所述源語句中的單詞的索引、所述源語句和所述標識信息,其中包括所述源語句中的單詞的索引、所述源語句和所述標識信息彼此相關聯,以及
所述源語句獲得單元從所述源語句存儲單元獲得與包括所述輸入語句中的單詞的所述索引相關聯的所述源語句,并計算所獲得的源語句和所述輸入語句之間的所述相似度。
5、根據權利要求1所述的設備,其中,所述源語句獲得單元從所述源語句存儲單元在所述相似度高于所述閾值的所述源語句中獲得預定數量的按所述相似度以降序排序的所述源語句。
6、根據權利要求1所述的設備,還包括:
轉換單元,其用于將所述輸入語句轉換成能夠與其他語句比較相似度的預定形式,其中
所述源語句存儲單元存儲彼此相關聯的所述標識信息和被轉換成所述預定形式的所述源語句,以及
所述源語句獲得單元計算所述轉換的輸入語句和所述源語句之間的所述相似度,并從所述源語句存儲單元獲得所述相似度高于所述閾值的所述源語句。
7、根據權利要求6所述的設備,其中
所述預定形式為矢量形式,所述矢量形式是通過將對所述輸入語句進行語形學分析獲得的語素轉換成矢量而獲得的,以及
所述源語句獲得單元將所述矢量形式的輸入語句和所述矢量形式的源語句之間的所述相似度作為余弦相似度加以計算,并從所述源語句存儲單元獲得所述余弦相似度高于所述閾值的所述源語句。
8、根據權利要求1所述的設備,其中
所述辭典存儲單元存儲彼此相關聯的所述雙語詞條信息、所述標識信息和存儲所述雙語詞條信息的日期和時間,以及
所述雙語詞條信息獲得單元從所述辭典存儲單元在所述標識信息對應于所獲得的源語句的所述雙語詞條信息中,優先于獲得相關日期和時間較早的所述雙語詞條信息,而獲得相關日期和時間較近的所述雙語詞條信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810149207.X/1.html,轉載請聲明來源鉆瓜專利網。





