[發明專利]一種紙質合同防篡改校驗方法及系統有效
| 申請號: | 202010536424.5 | 申請日: | 2020-06-12 |
| 公開(公告)號: | CN112784220B | 公開(公告)日: | 2021-10-19 |
| 發明(設計)人: | 胡為民;鄭喜 | 申請(專利權)人: | 深圳市迪博企業風險管理技術有限公司 |
| 主分類號: | G06F21/10 | 分類號: | G06F21/10;G06F40/194;G06F40/279;G06K9/00;G06Q50/18 |
| 代理公司: | 深圳余梅專利代理事務所(特殊普通合伙) 44519 | 代理人: | 高真輝 |
| 地址: | 518000 廣東省深圳市福田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 紙質 合同 篡改 校驗 方法 系統 | ||
1.一種紙質合同防篡改校驗方法,其特征在于,該方法基于一系統實現,所述系統包括有錄入單元(1)、OCR識別單元(2)、存儲單元(3)、讀取單元(4)和校驗單元(5),所述方法包括如下步驟:
步驟S1,將所述紙質合同的原始電子文檔保存于所述存儲單元(3);
步驟S2,獲取所述紙質合同的掃描件;
步驟S3,所述OCR識別單元(2)利用OCR識別技術對所述掃描件進行文字識別,將識別得到的文字信息保存為目標文件;
步驟S4,所述讀取單元(4)向所述存儲單元(3)獲取原始電子文檔,然后讀取所述原始電子文檔的文字信息并保存為參照文件;
步驟S5,所述校驗單元(5)對所述目標文件與所述參照文件中的文字信息進行逐行比較,對所述目標文件中與所述參照文件不同的文字進行標示;
所述步驟S3中,首先構建一個總列表listIn和一個段落列表listPara,所述OCR識別單元(2)對所述掃描件進行文字識別的過程包括:
步驟S30,將所述OCR識別單元(2)識別的每行文字信息按照預設順序寫入所述總列表listIn中;
步驟S31,將當前行作為新段落的開始行,寫入所述段落列表listPara中;
步驟S32,讀取下一行進行判斷處理:
步驟S320,判斷當前行高與上一行高之差是否達到預設的行高閾值,若是,則表示字體大小發生變化,上一段落已結束,將當前行作為新段落的第一行,然后執行步驟S33;若否,則執行步驟S321;
步驟S321,判斷當前行縮進是否超過兩個字段,若是,則表示上一段落已經結束,將當前行記為新段落的第一行,然后執行步驟S33;若否,則執行步驟S322;
步驟S322,判斷當前行的終止位置坐標是否大于上一行終止位置坐標兩個字符,若是,則表示上一段落已經結束,當前行記為新段落的第一行,然后執行步驟S33;若否,則執行步驟S323;
步驟S323,判斷當前行終止位置坐標是否小于上一行終止位置坐標兩個字符,若是,則表示當前行為段落結束行,先將當前行寫入所述段落列表listPara中,然后調取下一行作為當前行,并執行步驟S33;若否,則執行步驟S34;
步驟S33,將所述段落列表listPara中的內容合并后作為段落寫入預設的輸出列表listOut中,同時清空所述段落列表listPara,返回至所述步驟S31;
步驟S34,若所述步驟S320、所述步驟S321、所述步驟S322和所述步驟S323的判斷結果皆為否,說明當前行是段落中的一行,將當前行直接寫入所述段落列表listPara中,然后調取下一行作為當前行,返回至所述步驟S32;
循環執行所述步驟S31至步驟S34,直至所述總列表listIn中的全部文本行識別完成,將所述輸出列表listOut的輸出結果保存為目標文件。
2.如權利要求1所述的紙質合同防篡改校驗方法,其特征在于,所述文字信息包括行標志、行寬度標志、行高度標志、頁標志以及文字內容。
3.如權利要求1所述的紙質合同防篡改校驗方法,其特征在于,所述步驟S1中,所述原始電子文檔的格式為WORD格式或者PDF格式。
4.如權利要求1所述的紙質合同防篡改校驗方法,其特征在于,所述步驟S2中,所述掃描件通過掃描儀對所述紙質合同進行掃描后得到,或者對所述紙質合同拍照合并形成PDF格式文件后得到。
5.如權利要求1所述的紙質合同防篡改校驗方法,其特征在于,所述步驟S4中,所述讀取單元(4)基于PDFBOX、iText或者POI文檔處理技術向所述存儲單元(3)獲取原始電子文檔。
6.如權利要求1所述的紙質合同防篡改校驗方法,其特征在于,所述步驟S5中,所述校驗單元(5)利用預設的diff-utils工具對所述目標文件與所述參照文件中的文字信息進行逐行比較,根據所述diff-utils工具輸出的比較結果生成文檔差異表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市迪博企業風險管理技術有限公司,未經深圳市迪博企業風險管理技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010536424.5/1.html,轉載請聲明來源鉆瓜專利網。





