[發明專利]一種基于大數據分析的OFD版式文件的自動簽章方法及系統在審
申請號: | 202110361731.9 | 申請日: | 2021-04-02 |
公開(公告)號: | CN113112222A | 公開(公告)日: | 2021-07-13 |
發明(設計)人: | 陸猛;孫高健;趙云;莊玉龍;張偉;謝文迅;孫肖輝;郭尚;楊瑞欽 | 申請(專利權)人: | 北京點聚信息技術有限公司 |
主分類號: | G06Q10/10 | 分類號: | G06Q10/10;G06F40/289;G06K9/00 |
代理公司: | 北京工信聯合知識產權代理有限公司 11266 | 代理人: | 蘆玲玲 |
地址: | 100096 北京市海淀*** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 基于 數據 分析 ofd 版式 文件 自動 簽章 方法 系統 | ||
本發明公開了一種基于大數據分析的OFD版式文件的自動簽章方法及系統,包括:構建初始的自動簽章模型;其中,所述自動簽章模型,包括:基礎信息和規則信息;獲取用戶的至少一個歷史簽章文檔,對所述至少一個歷史簽章文檔以簽章位置為中心解析預設范圍內的文字內容,并對所述文字內容進行分詞處理,獲取每個歷史簽章文檔對應的規則信息;根據用戶的基礎信息和每個歷史簽章文檔對應的規則信息對所述初始的自動簽章模型進行訓練,以獲取經過訓練的自動簽章模型;接收用戶根據待簽章文檔發送的文檔簽章請求,對所述文檔簽章請求進行解析,確定目標基礎信息,并根據所述目標基礎信息利用所述經過訓練的自動簽章模型自動對所述待簽章文檔進行簽章。
技術領域
本發明涉及自動簽章技術領域,并且更具體地,涉及一種基于大數據分析的OFD版式文件的自動簽章方法及系統。
背景技術
印章的使用,最繁瑣的便是確定印章加蓋位置,無論是傳統的紙質文件蓋章還是無紙化辦公的電子印章蓋章,都無法避免需要人工確定蓋章位置。
目前已經有很多電子印章產品提供了自動簽章功能,但需要用戶預設蓋章定位信息,如關鍵文字定位蓋章、絕對坐標定位蓋章等信息。但很多應用場景中文檔內容差異較大、無法精確的進行預設定位信息,用戶只能逐個文檔打開進行手動簽章,無法實現真正的高效率辦公的目的。
發明內容
本發明提出一種基于大數據分析的OFD版式文件的自動簽章方法及系統,以解決如何實現自動簽章的問題。
為了解決上述問題,根據本發明的一個方面,提供了一種基于大數據分析的OFD版式文件的自動簽章方法,所述方法包括:
構建初始的自動簽章模型;其中,所述自動簽章模型,包括:基礎信息和規則信息;
獲取用戶的至少一個歷史簽章文檔,對所述至少一個歷史簽章文檔以簽章位置為中心解析預設范圍內的文字內容,并對所述文字內容進行分詞處理,獲取每個歷史簽章文檔對應的規則信息;
根據用戶的基礎信息和每個歷史簽章文檔對應的規則信息對所述初始的自動簽章模型進行訓練,以獲取經過訓練的自動簽章模型;
接收用戶根據待簽章文檔發送的文檔簽章請求,對所述文檔簽章請求進行解析,確定目標基礎信息,并根據所述目標基礎信息利用所述經過訓練的自動簽章模型自動對所述待簽章文檔進行簽章。
優選地,其中所述基礎信息,包括:印章信息和用戶信息,所述規則信息,包括:簽章位置中心的核心文字、簽章位置與核心文字的相對坐標信息和相關文字。
優選地,其中所述方法還包括:
采集用戶每次對文檔手動蓋章的位置信息,并計算每個文字使用的次數,確定每個文字對應的頻度,優化自動簽章模型的可用性和適用性;針對每個自動簽章模型中的多個文字內容生成對應的頻繁項集:{X,Y1,Y2,…,Yn}=Z;即X,Y1,Y2,…,Xn出現在同一個區域,則X所在區域為簽章位置;其中,X為核心文字,Y1,Y2,…,Xn為相關文字;Z為蓋章區域。
優選地,其中所述方法還包括:
針對每個自動簽章模型,設置對應的最小頻度,通過最小頻度進行模型評價,使用已簽章的文檔進行重復簽章測試,確定自動簽章位置與已簽章位置的差異;其中,評價模型質量的指標包括:平均誤差率和線性回歸判定系數R2。
優選地,其中所述根據所述目標基礎信息利用所述經過訓練的自動簽章模型自動對所述待簽章文檔進行簽章,包括:
根據所述目標基礎信息確定對應的經過訓練的自動簽章模型,并利用對應的經過訓練的自動簽章模型確定至少一個核心文字;
選取所述至少一個核心文字中頻度最大的文字作為目標核心文字,根據所述目標核心文字關聯出模型庫中的相關文字,并選取所述相關文字中頻度最大的文字作為目標相關文字;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京點聚信息技術有限公司,未經北京點聚信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110361731.9/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置