[發(fā)明專利]基于神經網絡的合同核對方法及裝置在審
| 申請?zhí)枺?/td> | 201811512895.1 | 申請日: | 2018-12-11 |
| 公開(公告)號: | CN109800784A | 公開(公告)日: | 2019-05-24 |
| 發(fā)明(設計)人: | 張瑞光;馮心;劉文慧;劉勝強;李玉蓮;張浩;馬蕊 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 深圳市隆天聯(lián)鼎知識產權代理有限公司 44232 | 代理人: | 劉抗美 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 核對 文本圖像 合同 像素信息 神經網絡 人工智能技術 字符識別 不一致 配置的 像素 標注 匹配 | ||
1.一種基于神經網絡的合同核對方法,其特征在于,包括:
獲取對照合同的文本圖像和待核對合同的文本圖像;
對所述對照合同的文本圖像進行字符識別,獲得為進行合同核對所配置的每一關鍵字在所述對照合同的文本圖像中所在的像素信息;
按照所述像素信息,在所述待核對合同的文本圖像中提取位于所述像素信息所指示像素的待核對關鍵字;
對所述關鍵字和所述待核對關鍵字進行匹配,確定所述待核對關鍵字是否與所述關鍵字一致;
若不一致,在所述待核對合同的文本圖像中標注出所述待核對關鍵字。
2.根據(jù)權利要求1所述的方法,其特征在于,所述獲取對照合同的文本圖像和待核對合同的文本圖像,包括:
獲取根據(jù)所述對照合同所獲得的對照合同圖像,和獲取根據(jù)所述待核對合同所獲得的待核對合同圖像;
對所述對照合同圖像進行預處理得到所述對照合同的文本圖像,以及對所述待核對合同圖像進行預處理,得到所述待核對合同的文本圖像。
3.根據(jù)權利要求1所述的方法,其特征在于,所述對所述對照合同的文本圖像進行光學字符識別,獲得為進行合同核對所配置的每一關鍵字在所述對照合同的文本圖像中的位置信息之前,還包括:
獲取所述對照合同的文本信息;
通過神經網絡模型對所述文本信息進行關鍵字預測,得到為所述對照合同所預測的若干所述關鍵字。
4.根據(jù)權利要求3所述的方法,其特征在于,所述通過神經網絡模型對文本信息進行關鍵字預測,得到為所述對照合同所預測的若干所述關鍵字之前,還包括:
獲取若干樣本合同和為每一所述樣本合同所設定的若干樣本關鍵字;
通過所述若干樣本合同和所對應設定的所述樣本關鍵字訓練所述神經網絡模型;
當所述神經網絡模型收斂,結束所述神經網絡模型的訓練。
5.根據(jù)權利要求1所述的方法,其特征在于,所述對所述對照合同的文本圖像進行字符識別,獲得為進行合同核對所配置的每一關鍵字在所述對照合同的文本圖像中的像素信息,包括:
通過對所述對照合同的文本圖像進行字符識別,確定所述對照合同的文本內容,并獲得所述文本內容中每一字符的像素信息,所述像素信息指示了所述字符在所述對照合同的文本圖像中的像素;
在所述對照合同的文本內容中分別進行每一所述關鍵字的查找;
根據(jù)所查找到的所述關鍵字所在像素,獲得所述關鍵字在所述對照合同的文本圖像中的像素信息。
6.根據(jù)權利要求1所述的方法,其特征在于,所述按照所述像素信息,在所述待核對合同的文本圖像中提取位于所述像素信息所指示像素的待核對關鍵字,包括:
在所述待核對合同的文本圖像中進行所述像素信息所指示像素的定位;
對位于所定位到像素的字符進行字符識別,獲得所述待核對關鍵字。
7.根據(jù)權利要求1所述的方法,其特征在于,所述對所述關鍵字和所述待核對關鍵字進行匹配,確定所述待核對關鍵字是否與所述關鍵字一致,包括:
對所述關鍵字中的關鍵字名稱和所述待核對關鍵字中的關鍵字名稱進行匹配;
若所述關鍵字名稱不相同,則確定所述待核對關鍵字與所述關鍵字不一致;以及
若所述關鍵字名稱相同,則繼續(xù)對所述關鍵字中的關鍵字內容和所述待核對關鍵字中的關鍵字內容進行匹配;若所述關鍵字內容不相同,則確定所述待核對關鍵字與所述關鍵字不一致。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811512895.1/1.html,轉載請聲明來源鉆瓜專利網。





