[發明專利]一種文本糾錯方法、裝置、電子設備和介質有效
| 申請號: | 202210371375.3 | 申請日: | 2022-04-11 |
| 公開(公告)號: | CN114462356B | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 李曉川;趙雅倩;李仁剛;郭振華;范寶余 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F40/126 | 分類號: | G06F40/126;G06F40/232;G06K9/62;G06V10/74 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張倩 |
| 地址: | 215100 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 糾錯 方法 裝置 電子設備 介質 | ||
1.一種文本糾錯方法,其特征在于,包括:
對獲取的待分析圖像進行圖像編碼,得到圖像特征;
對獲取的帶噪文本進行文本編碼,得到文本特征;
按照設定的注意力機制,對所述圖像特征和所述文本特征進行特征對比,得到糾錯信號;
利用訓練好的解碼器依據所述糾錯信號對初始文本標簽進行預測,得到糾錯后的文本信息;
所述注意力機制包括自注意力機制和跨注意力機制;
所述按照設定的注意力機制,對所述圖像特征和所述文本特征進行特征對比,得到糾錯信號包括:
按照所述自注意力機制,對所述圖像特征和所述文本特征進行關聯性分析,得到對齊特征;其中,所述對齊特征包括所述圖像特征和所述文本特征的對應關系;
按照所述自注意力機制和所述跨注意力機制,對所述對齊特征和所述文本特征進行分析,得到糾錯信號;跨注意力機制包括利用歸一化指數函數對對齊特征的自注意力向量和文本特征的自注意力向量進行處理。
2.根據權利要求1所述的文本糾錯方法,其特征在于,所述按照所述自注意力機制,對所述圖像特征和所述文本特征進行關聯性分析,得到對齊特征包括:
按照如下公式,確定出所述圖像特征和所述文本特征的自注意力向量;其中,所述自注意力向量包含所述圖像特征的每維特征與所述文本特征的每維特征的關聯特征;
;
其中,,
對所述自注意力向量進行層歸一化和相加處理,得到對齊特征。
3.根據權利要求1所述的文本糾錯方法,其特征在于,所述按照所述自注意力機制和所述跨注意力機制,對所述對齊特征和所述文本特征進行分析,得到糾錯信號包括:
按照所述自注意力機制,對所述對齊特征進行注意力分析,得到所述對齊特征的自注意力特征;
按照所述自注意力機制,對所述文本特征進行注意力分析,得到所述文本特征的自注意力特征;
按照如下公式,確定出所述對齊特征的自注意力特征和所述文本特征的自注意力特征之間的跨注意力向量,
;
其中,
對所述跨注意力向量進行層歸一化、相加和糾錯處理,得到糾錯信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210371375.3/1.html,轉載請聲明來源鉆瓜專利網。





