[發明專利]公文文件處理方法、裝置、計算機設備及存儲介質有效
申請號: | 202010523793.0 | 申請日: | 2020-06-10 |
公開(公告)號: | CN111680634B | 公開(公告)日: | 2023-08-01 |
發明(設計)人: | 金曉輝;阮曉雯;徐亮 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
主分類號: | G06V30/40 | 分類號: | G06V30/40;G06V30/418;G06V30/14;G06V30/19;G06V10/82;G06N3/0455 |
代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 譚果林 |
地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 公文 文件 處理 方法 裝置 計算機 設備 存儲 介質 | ||
本發明屬于大數據領域,尤其涉及一種公文文件處理方法、裝置、計算機設備及存儲介質。所述方法包括:對待評審公文文件進行格式解析后,獲取標準文件類型的待評審公文文件,并識別標準文件類型的待評審公文文件中的所有文件成分內容;通過預設文本處理模型同步執行文本格式檢測、文本內容檢測以及框架版式檢測之后,獲取格式檢測結果、內容檢測結果和版式檢測結果;通過格式檢測結果、內容檢測結果和版式檢測結果生成檢測錯誤內容,調用出與檢測錯誤內容對應的標準寫作規則,將檢測錯誤內容和標準寫作規則標注在待評審公文文件中。本發明還涉及區塊鏈技術,所述標準寫作規則存儲于區塊鏈中。通過本發明能提高公文文件的評審效率。
技術領域
本發明涉及大數據的數據分析領域,尤其涉及一種公文文件處理方法、?裝置、計算機設備及存儲介質。
背景技術
目前,在將要發布公文文件時,首先需要對公文文件的規范進行評審,?在現有技術中,需要人工對公文文件的文面格式和要求等進行詳盡的評審,?在人工評審公文文件的過程中,要求評審人員對《黨政機關公文處理工作條?例》的15類公文文種中不同組成要素的各個評審規范都了如指掌,但目前各?機關部門的公文文件產出量大,若采用人工針對每次不同的公文文件去進行?逐字逐句的評審,耗時耗力,而且極易出現評審規范點遺漏的問題。因此本?領域人員亟需尋找一種可自動對公文文件進行精準評審的方法以解決上述提到的問題。
發明內容
基于此,有必要針對上述技術問題,提供一種公文文件處理方法、裝置、?計算機設備及存儲介質,用于自動化對公文文件進行評審處理,以提高公文?文件的評審效率和評審精準度。
一種公文文件處理方法,包括:
接收用戶發送的包含待評審公文文件的評審請求,對所述待評審公文文?件進行格式解析并獲取所述待評審公文文件的文件類型后,獲取標準文件類?型的所述待評審公文文件,并通過預設bert模型識別標準文件類型的所述待?評審公文文件中的所有文件成分內容;
通過基于分布式框架構建的預設文本處理模型同步執行文本格式檢測、?文本內容檢測以及框架版式檢測之后,獲取格式檢測結果、內容檢測結果和?版式檢測結果;所述文本格式檢測包括調用與每一個所述文件成分內容對應?的格式檢測規則,提取所述文件成分內容中的文本格式關鍵詞,根據所述文?本格式關鍵詞以及與其對應的所述格式檢測規則中的格式條獲取格式檢測結?果;所述文本內容檢測包括對所述文件成分內容進行內容檢測后,獲取內容?檢測結果;所述框架版式檢測包括對標準文件類型的所述待評審公文文件進?行坐標信息的劃分,并根據劃分的所述坐標信息以對所述待評審公文文件進?行框架版式檢測,獲取版式檢測結果;
通過所述格式檢測結果、內容檢測結果和版式檢測結果生成檢測錯誤內?容,調用出與所述檢測錯誤內容對應的標準寫作規則,將所述檢測錯誤內容?和所述標準寫作規則標注在所述待評審公文文件中的預設位置,并將已標注?成功的所述待評審公文文件根據所述用戶指定的存放路徑發送至預設接收位?置。
一種公文文件處理裝置,包括:
識別模塊,用于接收用戶發送的包含待評審公文文件的評審請求,對所?述待評審公文文件進行格式解析并獲取所述待評審公文文件的文件類型后,?獲取標準文件類型的所述待評審公文文件,并通過預設bert模型識別標準文?件類型的所述待評審公文文件中的所有文件成分內容;
獲取模塊,用于通過基于分布式框架構建的預設文本處理模型同步執行?文本格式檢測、文本內容檢測以及框架版式檢測之后,獲取格式檢測結果、?內容檢測結果和版式檢測結果;所述文本格式檢測包括調用與每一個所述文?件成分內容對應的格式檢測規則,提取所述文件成分內容中的文本格式關鍵?詞,根據所述文本格式關鍵詞以及與其對應的所述格式檢測規則中的格式條?獲取格式檢測結果;所述文本內容檢測包括對所述文件成分內容進行內容檢?測后,獲取內容檢測結果;所述框架版式檢測包括對標準文件類型的所述待?評審公文文件進行坐標信息的劃分,并根據劃分的所述坐標信息以對所述待?評審公文文件進行框架版式檢測,獲取版式檢測結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010523793.0/2.html,轉載請聲明來源鉆瓜專利網。