[發明專利]計算機翻譯數據處理方法及裝置在審
| 申請號: | 201210285384.7 | 申請日: | 2012-08-10 |
| 公開(公告)號: | CN103577397A | 公開(公告)日: | 2014-02-12 |
| 發明(設計)人: | 吳克文;廖劍;張永剛;林鋒 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機 翻譯 數據處理 方法 裝置 | ||
1.一種計算機翻譯數據處理方法,其特征在于,包括以下步驟:
接收待翻譯的源語句,對所述源語句進行切分;
將切分得到的詞語在分類詞典中進行查詢,確定各詞語的類別;
根據所述源語句各詞語的類別在語義模式數據庫中查找確定所述源語句的語義模式;
查找所述語義模式對應的翻譯規則,根據所述翻譯規則對源語句進行翻譯。
2.如權利要求1所述的計算機翻譯數據處理方法,其特征在于,所述根據所述源語句各詞語的類別在語義模式數據庫中查找確定所述源語句的語義模式包括:
確定源語句的類別組合;
將得到的類別組合分別代入語義模式數據庫中查找匹配的語義模式,若能夠找到,則獲取所述語義模式;
比較所述各匹配的語義模式所對應的類別組合中的類別數量,選取類別數量最多的類別組合所對應的語義模式為源語句的語義模式。
3.如權利要求2所述的計算機翻譯數據處理方法,其特征在于,所述選取類別數量最多的類別組合所對應的語義模式為源語句的語義模式包括:
判斷所述類別數量最多的類別組合是否為源語句的全部詞語類別,若是,則選取所述類別數量最多的類別組合所對應的語義模式為源語句的語義模式;
若否,則判斷源語句剩余的詞語類別組合是否有對應的語義模式,若是,則獲取其語義模式,并與所述類別數量最多的類別組合所對應的語義模式共同作為源語句的語義模式,若否,則將所述類別數量最多的類別組合所對應的語義模式作為源語句的語義模式。
4.如權利要求2或3所述的計算機翻譯數據處理方法,其特征在于,所述確定源語句的類別組合包括:
若類別數量N為2,則類別組合為一個;
若類別數量N>2,則類別組合一共有N-1個,包括從第一個類別開始的前兩個類別為第一類別組合;從第一個類別開始的前三個類別為第二類別組合,直到從第一個類別開始的N個類別為第N-1類別組合。
5.如權利要求1所述的計算機翻譯數據處理方法,其特征在于,若源語句的語義模式為至少兩個語義模式的組合,所述根據所述翻譯規則對源語句進行翻譯包括:
按照各語義模式所對應的翻譯規則對源語句中對應部分進行翻譯得到部分翻譯結果,將所述部分翻譯結果組合得到源語句的最終翻譯結果;或
按照各語義模式所對應的翻譯規則對源語句中對應部分進行翻譯得到部分翻譯結果,獲取各語義模式間的翻譯規則,根據所述翻譯規則對部分翻譯結果進行調整,得到源語句的最終翻譯結果。
6.一種計算機翻譯數據處理裝置,其特征在于,包括:
數據獲取模塊,用于接收待翻譯的源語句,對所述源語句進行切分;
類別確定模塊,用于將切分得到的詞語在分類詞典中進行查詢,確定各詞語的類別;
語義模式確定模塊,用于根據所述源語句各詞語的類別在語義模式數據庫中查找確定所述源語句的語義模式;
翻譯模塊,用于查找所述語義模式對應的翻譯規則,根據所述翻譯規則對源語句進行翻譯。
7.如權利要求6所述的計算機翻譯數據處理裝置,其特征在于,所述語義模式確定模塊包括:
類別組合確定單元,用于確定源語句的類別組合;
語義模式匹配單元,用于將得到的類別組合分別代入語義模式數據庫中查找匹配的語義模式,若能夠找到,則獲取所述語義模式;
比較選取單元,用于比較所述各匹配的語義模式所對應的類別組合中的類別數量,選取類別數量最多的類別組合所對應的語義模式為源語句的語義模式。
8.如權利要求7所述的計算機翻譯數據處理裝置,其特征在于,所述比較選取單元包括:
判斷子單元,用于判斷所述類別數量最多的類別組合是否為源語句的全部詞語類別,若是,則選取所述類別數量最多的類別組合所對應的語義模式為源語句的語義模式;
若否,則判斷源語句剩余的詞語類別組合是否有對應的語義模式,若是,則獲取其語義模式,并與所述類別數量最多的類別組合所對應的語義模式共同作為源語句的語義模式,若否,則將所述類別數量最多的類別組合所對應的語義模式作為源語句的語義模式。
9.如權利要求6所述的計算機翻譯數據處理裝置,其特征在于,若源語句的語義模式為至少兩個語義模式的組合,所述翻譯模塊包括:
翻譯單元,用于按照各語義模式所對應的翻譯規則對源語句中對應部分進行翻譯得到部分翻譯結果;
組合單元,用于將所述部分翻譯結果組合得到源語句的最終翻譯結果;或根據語義模式間的翻譯規則對所述部分翻譯結果進行調整,得到源語句的最終翻譯結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210285384.7/1.html,轉載請聲明來源鉆瓜專利網。





