[發明專利]基于人工智能的非結構化文檔監管方法及存儲介質在審
| 申請號: | 202111344801.6 | 申請日: | 2021-11-15 |
| 公開(公告)號: | CN114064920A | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 鄭敏;阮義清;羅建新;池毓成;陳穎華 | 申請(專利權)人: | 福建正孚軟件有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06N3/04;G06N3/08;G06Q10/06 |
| 代理公司: | 福州市景弘專利代理事務所(普通合伙) 35219 | 代理人: | 施文武 |
| 地址: | 350001 福建省福州市鼓樓*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 結構 文檔 監管 方法 存儲 介質 | ||
本發明涉及一種基于人工智能的非結構化文檔監管方法及存儲介質,所述存儲介質包括以下步驟:從企業或者項目中獲取監管文檔作為雙向LSTM+RNN實體及實體關系抽取聯合模型訓練的素材,并通過模型訓練輸出實體及實體關系抽取聯合模型;將訓練得到的實體及實體關系抽取聯合模型封裝為實體及實體關系識別服務;監管過程中,不斷輸入監管文檔供實體及實體關系識別服務進行信息抽取,構建監管知識圖譜;通過監管知識圖譜,對非結構文檔進行監管。代替原有的通過人工梳理規則,效果更顯著,覆蓋更全面。
技術領域
本發明涉及文檔監管技術領域,特別涉及一種基于人工智能的非結構化文檔監管方法及存儲介質。
背景技術
在企業運營或者項目管理過程中存在各種工程項目過程文檔、財務文件、制度規范文檔等等,從中挖掘項目過程紕漏、環節缺失、財務資金混亂、制度執行不到位等信息,并予以集中發現、監管和風險評估;以往這些工作從海量文檔中人工批閱且分析發現文檔信息問題的監管模式,需要投入大量的人力,存在效率低下、遺漏多、監管滯后等等眾多問題。而現有的文檔監管的技術方案中,如申請號為CN202111021148.X公開的一種基于綜合安全審計的文檔監控管理系統,如申請號為CN202110759545.0基于云平臺的電子文檔分類監管系統,雖然可以對文檔進行監控或者監管,但是均未解決發現多個文檔潛在關系,并對文檔內容實體或者實體關系進行監管,同時數據補入均采用人工錄入方式,人工成本高。
發明內容
為此,需要提供一種基于人工智能的非結構化文檔監管方法及存儲介質,解決現有的企業運營或者項目管理過程中的各種文檔監管需要投入大量人力,效率低下、遺漏多、監管滯后以及無法解決發現多個文檔潛在關系等監管問題。
為實現上述目的,發明人提供了一種基于人工智能的非結構化文檔監管方法,包括以下步驟:
從企業或者項目中獲取監管文檔作為雙向LSTM+RNN實體及實體關系抽取聯合模型訓練的素材,并通過模型訓練輸出實體及實體關系抽取聯合模型;
將訓練得到的實體及實體關系抽取聯合模型封裝為實體及實體關系識別服務;
監管過程中,不斷輸入監管文檔供實體及實體關系識別服務進行信息抽取,構建監管知識圖譜;
通過監管知識圖譜,對非結構文檔進行監管。
進一步優化,所述“通過監管知識圖譜,對非結構文檔進行監管”具體包括以下步驟:
通過監管知識圖譜及監管規則庫,對企業或者項目的風險進行評估。
進一步優化,所述監管規則庫為通過平臺預置并后續不斷錄入完善。
進一步優化,所述“通過監管知識圖譜,對非結構文檔進行監管”具體還包括以下步驟:
通過監管知識圖譜對監管問題溯源分析定位根源或者影響因子。
進一步優化,所述步驟“通過監管知識圖譜對監管問題溯源分析定位根源或者影響因子”之后還包括步驟:
根據可視化技術呈現監管問題的影響范圍。
還提供了另一個實施例,一種存儲介質,所述存儲介質內存儲有計算機程序,所述計算機程序被處理器運行時執行以下步驟:
從企業或者項目中獲取監管文檔作為雙向LSTM+RNN實體及實體關系抽取聯合模型訓練的素材,并通過模型訓練輸出實體及實體關系抽取聯合模型;
將訓練得到的實體及實體關系抽取聯合模型封裝為實體及實體關系識別服務;
監管過程中,不斷輸入監管文檔供實體及實體關系識別服務進行信息抽取,構建監管知識圖譜;
通過監管知識圖譜,對非結構文檔進行監管。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建正孚軟件有限公司,未經福建正孚軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111344801.6/2.html,轉載請聲明來源鉆瓜專利網。





