[發明專利]基于人工智能的語言轉換處理方法、裝置及終端有效
| 申請號: | 201710336033.7 | 申請日: | 2017-05-12 |
| 公開(公告)號: | CN107193807B | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 趙世奇 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/44 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 語言 轉換 處理 方法 裝置 終端 | ||
1.一種基于人工智能的語言轉換處理方法,其特征在于,包括以下步驟:
接收語言轉換請求,所述請求中包括待轉換的語句,且所述待轉換的語句中包括源語言詞語及目標語言詞語;
根據預設的規則,確定與所述源語言詞語對應的各候選詞語;
確定所述各候選詞語,分別在所述待轉換的語句中對應的各分值;
根據所述各候選詞語分別對應的各分值,確定與所述源語言詞語對應的目標詞語;
所述確定所述各候選詞語,分別在所述待轉換的語句中對應的各分值,包括:
確定所述源語言詞語與第一候選詞語的第一對齊概率;
根據所述第一候選詞語在目標領域中的第一語言模型,確定所述第一候選詞語在所述待轉換的語句中的第一分值,其中,所述目標領域為所述待轉換的語句所屬的領域;
根據所述第一對齊概率和所述第一分值,確定所述候選詞語在所述待轉換的語句中對應的分值。
2.如權利要求1所述的方法,其特征在于,所述待轉換的語句中包括的源語言詞語與目標語言詞語的比例,小于第一閾值。
3.如權利要求1所述的方法,其特征在于,還包括:
根據所述待轉換的語句包括的各類型語言的詞語數量,確定源語言詞語及目標語言詞語。
4.如權利要求1所述的方法,其特征在于,所述根據預設的規則,確定與所述源語言詞語對應的各候選詞語,包括:
根據預設的語言對齊模型,確定與所述源語言詞語對應的各候選詞語;
或者,
根據語言模型,確定與所述源語言詞語對應的各候選詞語。
5.如權利要求4所述的方法,其特征在于,所述根據預設的語言對齊模型,確定與所述源語言詞語對應的各候選詞語之前,還包括:
獲取所述源語言詞語與所述目標語言詞語,在通用領域中的平行語料;
對所述平行語料進行訓練,確定與所述源語言詞語對應的對齊模型。
6.如權利要求4所述的方法,其特征在于,所述根據預設的語言對齊模型,確定與所述源語言詞語對應的各候選詞語,包括:
根據預設的語言對齊模型,確定與所述源語言詞語的對齊概率大于第二閾值的詞語為候選詞語。
7.如權利要求4所述的方法,其特征在于,所述根據語言模型,確定與所述源語言詞語對應的各候選詞語,包括:
確定所述源語言詞語在目標領域中對應的各目標語言類型詞語;
根據所述各目標語言類型詞語,在目標領域中的語言模型,確定與所述源語言詞語對應的各候選詞語。
8.如權利要求1所述的方法,其特征在于,所述根據所述第一對齊概率和所述第一分值,確定所述候選詞語在所述待轉換的語句中對應的分值,包括:
根據第i個源語言詞語與第j個候選詞的對齊概率、預設參數及第j個候選詞在所述待轉換的語句中所屬的目標領域中的分值,確定第i個源語言詞語對應的第j個候選詞在待轉換的語句中的分值;
其中,所述第j個候選詞在所述待轉換的語句中所屬的目標領域中的分值,是根據所述第j個候選詞在所述待轉換的語句所屬的目標領域中的語言模型確定的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710336033.7/1.html,轉載請聲明來源鉆瓜專利網。





