[發明專利]機器糾錯方法、裝置、電子設備和可讀存儲介質在審
| 申請號: | 202110298083.7 | 申請日: | 2021-03-19 |
| 公開(公告)號: | CN113051937A | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 陳昌儒;吳雨璇;楊惠;徐培來 | 申請(專利權)人: | 北京大米科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/232;G06Q50/20 |
| 代理公司: | 北京睿派知識產權代理事務所(普通合伙) 11597 | 代理人: | 劉鋒 |
| 地址: | 100142 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器 糾錯 方法 裝置 電子設備 可讀 存儲 介質 | ||
1.一種機器糾錯方法,其特征在于,所述方法包括:
獲取待糾錯文本;
基于預先設置的中間翻譯網絡,對所述待糾錯文本進行翻譯,確定所述待糾錯文本對應的第一文本;以及
至少基于預先設置的融合翻譯網絡、所述第一文本和所述待糾錯文本,對所述第一文本進行融合翻譯,確定第二文本,所述第二文本與所述待糾錯文本的語種相同。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
獲取所述待糾錯文本對應的原始文本,所述原始文本與所述第一文本的語種相同;
所述至少基于預先設置的融合翻譯網絡、所述第一文本和所述待糾錯文本,對所述第一文本進行融合翻譯,確定第二文本,包括:
確定所述第一文本與所述原始文本之間的文本相似度;以及
基于預先設置的融合翻譯網絡、所述第一文本、所述原始文本、所述待糾錯文本和所述文本相似度,對所述第一文本進行融合翻譯,確定第二文本。
3.根據權利要求2所述的方法,其特征在于,所述確定所述第一文本與所述原始文本之間的文本相似度,包括:
對所述第一文本進行特征提取,確定所述第一文本對應的第一文本特征向量;
對所述原始文本進行特征提取,確定所述原始文本對應的原始文本特征向量;以及
確定所述第一文本特征向量和所述原始文本特征向量之間的特征距離,所述特征距離用于表征所述第一文本與所述原始文本之間的文本相似度。
4.根據權利要求2所述的方法,其特征在于,所述確定所述第一文本與所述原始文本之間的文本相似度,包括:
將所述第一文本和所述原始文本輸入預先設置的語言統計模型,確定所述第一文本和所述原始文本之間的文本相似度。
5.根據權利要求1所述的方法,其特征在于,所述至少基于預先設置的融合翻譯網絡、所述第一文本和所述待糾錯文本,對所述第一文本進行融合翻譯,確定第二文本,包括:
基于預先設置的融合翻譯網絡、所述第一文本、所述待糾錯文本和第一預定翻譯策略,對所述第一文本進行融合翻譯,確定第二文本;
其中,所述第一預定翻譯策略用于表征所述第一文本在所述融合翻譯網絡中的權重、所述待糾錯文本在所述融合翻譯網絡中的權重、所述第一文本和所述待糾錯文本在所述融合翻譯網絡中的拼接方式。
6.根據權利要求2所述的方法,其特征在于,所述基于預先設置的融合翻譯網絡、所述第一文本、所述原始文本、所述待糾錯文本和所述文本相似度,對所述第一文本進行融合翻譯,確定第二文本,包括:
基于預先設置的融合翻譯網絡、所述第一文本、所述原始文本、所述待糾錯文本、所述文本相似度和第二預定翻譯策略,對所述第一文本進行融合翻譯,確定第二文本;
其中,所述第二預定翻譯策略用于表征所述第一文本在所述融合翻譯網絡中的權重、所述原始文本在所述融合翻譯網絡中的權重、所述待糾錯文本在所述融合翻譯網絡中的權重、所述文本相似度在所述融合翻譯網絡中的權重,以及所述第一文本、所述原始文本、所述待糾錯文本和所述文本相似度在所述融合翻譯網絡中的拼接方式。
7.根據權利要求5或6所述的方法,其特征在于,所述融合翻譯網絡基于深度神經網絡構建;
所述方法還包括:
對所述第一文本和所述待糾錯文本進行數據預處理,或者,對所述第一文本、所述原始文本、所述待糾錯文本和所述文本相似度進行數據預處理,所述數據預處理至少包括特征提取。
8.根據權利要求1或2所述的方法,其特征在于,所述方法還包括:
在預定顯示界面顯示所述第二文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大米科技有限公司,未經北京大米科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110298083.7/1.html,轉載請聲明來源鉆瓜專利網。





