[發明專利]文件鑒偽比對方法及裝置、終端和存儲介質在審
| 申請號: | 202010847256.1 | 申請日: | 2020-08-21 |
| 公開(公告)號: | CN112183574A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 朱穎剛;楊永洲;崔崢征;李云帆;尤自強;蔣聯沖;劉恒 | 申請(專利權)人: | 深圳市銀之杰科技股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/34 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 景鵬 |
| 地址: | 518048 廣東省深圳市福田區沙*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文件 方法 裝置 終端 存儲 介質 | ||
本發明公開了一種文件鑒偽比對方法及裝置、終端和存儲介質,該文件鑒偽比對方法包括獲取待比對的電子文件;判斷待比對的電子文件與預存的電子文檔的頁面排序是否一致,若一致,則逐頁進行比對;根據預設的切分方式,將待比對的電子文件的每張單頁切分成多個第一子區域,其中,第一子區域由Si表示,i為大于1的整數;根據預設的切分方式,將預存的電子文檔的每張單頁切分成多個第二子區域,其中,第二子區域由Wj表示,j為大于1的整數;分別將第一子區域Si與第二子區域Wj進行逐個比對,其中,i與j的值相等;將比對結果反饋至待比對的電子文件的每張單頁上并顯示。
技術領域
本發明涉及信息處理技術領域,尤其是涉及一種文件鑒偽比對方法及裝置、終端和存儲介質。
背景技術
用戶對紙質文件蓋章前,需要通過掃描設備將待蓋章的紙質文件與預存的電子文檔進行鑒偽比對,以判斷待蓋章的紙質文件的內容與預存的電子文檔的內容的差異度;若差異度超過設定范圍,則禁止對紙質文件進行蓋章操作,并根據鑒偽比對結果修改紙質文件。現有的掃描設備中采用的文件鑒偽比對方法,當待比對的文件內容較多時,需耗費大量的時間,工作效率較低;且易受到數據多、差異小、打印清晰度等的影響,識別結果的準確度較低;難以滿足在計算機終端快速、準確地實現文件的鑒偽比對的需求。
發明內容
本發明旨在至少解決現有技術中存在的技術問題之一。
為此,本發明提出了一種文件鑒偽比對方法及裝置、終端和存儲介質,在提高文件鑒偽比對的效率的同時,能夠有效地保證鑒偽比對結果的準確性。
根據本申請的第一方面,提供了一種文件鑒偽比對方法,該方法包括:
獲取待比對的電子文件;
判斷所述待比對的電子文件與預存的電子文檔的頁面排序是否一致,若一致,則逐頁進行比對;
根據預設的切分方式,將所述待比對的電子文件的每張單頁切分成多個第一子區域,其中,所述第一子區域由Si表示,i為大于1的整數;
根據所述預設的切分方式,將所述預存的電子文檔的每張單頁切分成多個第二子區域,其中,所述第二子區域由Wj表示,j為大于1的整數;
分別將所述第一子區域Si與所述第二子區域Wj進行逐個比對,其中,i與j的值相等;
將比對結果反饋至所述待比對的電子文件的每張單頁上并顯示。
在上述方法中,所述分別將所述第一子區域Si與所述第二子區域Wj進行逐個比對的步驟,包括:
計算所述第一子區域Si與所述第二子區域Wj的相似度數值,若所述相似度數值低于預設值,則標記出該第一子區域Si。
在上述方法中,所述計算所述第一子區域Si與所述第二子區域Wj的相似度數值的步驟,包括:
對所述第一子區域Si和所述第二子區域Wj內的所有字符進行相似度比對,以獲得每個字符的相似度數值,其中,先針對所述第一子區域Si和所述第二子區域Wj中的非敏感信息進行像素點比對,再針對所述第一子區域Si和所述第二子區域Wj中的敏感信息進行OCR識別比對;
對所有字符的相似度數值求平均值,以獲得所述第一子區域Si和所述第二子區域Wj的相似度數值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市銀之杰科技股份有限公司,未經深圳市銀之杰科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010847256.1/2.html,轉載請聲明來源鉆瓜專利網。





