[發明專利]一種基于語義分析的檔案自動開放鑒定方法及系統有效
| 申請號: | 202110542853.8 | 申請日: | 2021-05-19 |
| 公開(公告)號: | CN112989018B | 公開(公告)日: | 2021-08-17 |
| 發明(設計)人: | 王楠;張宇;顧凌峰;常祖賢;銀思琪;劉杰;宋永生 | 申請(專利權)人: | 江蘇聯著實業股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/335;G06F16/38;G06F40/30;G06F40/151;G06K9/62 |
| 代理公司: | 無錫蘇元專利代理事務所(普通合伙) 32471 | 代理人: | 王清偉 |
| 地址: | 210006 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 分析 檔案 自動 開放 鑒定 方法 系統 | ||
1.一種基于語義分析的檔案自動開放鑒定方法,其中,所述方法應用于檔案自動開放鑒定系統,且所述系統與字符識別系統、語義識別系統通信連接,所述方法還包括:
獲得批量集待鑒定檔案信息;
基于所述字符識別系統,將所述批量集待鑒定檔案信息轉換為批量集純文本檔案信息;
將所述批量集純文本檔案信息輸入格式語義庫進行訓練,用標識的特殊格式對輸入信息進行訓練,獲得第一訓練結果和第二訓練結果,其中,所述第一訓練結果為符合所述特殊格式的第一批次純文本檔案信息,所述第二訓練結果為不符合所述特殊格式的第二批次純文本檔案信息,且所述格式語義庫包含于所述語義識別系統;
將所述第二批次純文本檔案信息輸入關鍵詞庫進行訓練,用標識的關鍵詞集合對輸入信息進行訓練,獲得第三訓練結果和第四訓練結果,其中,所述第三訓練結果為包含所述關鍵詞集合的第三批次純文本檔案信息,所述第四訓練結果為不包含所述關鍵詞集合的第四批次純文本檔案信息,且所述關鍵詞庫包含于所述語義識別系統;
將所述第四批次純文本檔案信息輸入語義知識庫進行訓練,用標識的預設語義信息對輸入信息進行訓練,獲得第五訓練結果和第六訓練結果,其中,所述第五訓練結果為符合所述預設語義信息的第五批次純文本檔案信息,所述第六訓練結果為不符合所述預設語義信息的第六批次純文本檔案信息,且所述語義知識庫包含于所述語義識別系統;
將所述第六批次純文本檔案信息發送至人工審核端進行內容語義審核,生成第一審核結果;
根據所述第一審核結果,獲得所述批量集待鑒定檔案信息中的可開放檔案信息;
其中,所述方法還包括:
基于所述第四批次純文本檔案信息,提取第一語句信息;
根據所述第一語句信息,獲得第一成分信息、第二成分信息以及第三成分信息;
對所述第一成分信息、所述第二成分信息以及所述第三成分信息進行遍歷分析,獲得第一分析結果;
對所述第一語句信息進行語義分析,獲得第二分析結果;
對所述第一分析結果和所述第二分析結果進行特征融合,獲得第三分析結果;
獲得語義分析模型,所述語義分析模型基于不可開放語義信息進行構建,且所述語義分析模型與所述語義知識庫通信連接;
將所述第一語句信息輸入所述語義分析模型,獲得第四分析結果;
判斷所述第四分析結果與所述第三分析結果是否保持一致;
若所述第四分析結果與所述第三分析結果沒有保持一致,基于所述第三分析結果,對所述第四分析結果進行修正。
2.如權利要求1所述的方法,其中,所述方法還包括:
若所述第四分析結果與所述第三分析結果沒有保持一致,對所述第四分析結果和所述第三分析結果進行數據損失分析,獲得第一損失數據;
將所述第一損失數據輸入所述語義分析模型,生成第二語義分析模型;
根據所述第二語義分析模型,對所述第一損失數據進行增量學習。
3.如權利要求1所述的方法,其中,所述獲得語義分析模型,還包括:
獲得第一檔案鑒定單位的第一鑒定經驗信息;
基于大數據,獲得所述第一檔案鑒定單位的第一開放鑒定條件信息;
對所述第一鑒定經驗信息和所述第一開放鑒定條件信息進行信息融合,生成所述第一檔案鑒定單位的不可開放語義信息;
基于所述不可開放語義信息,構建所述語義分析模型。
4.如權利要求1所述的方法,其中,所述將所述第一語句信息輸入所述語義分析模型,獲得第四分析結果,還包括:
根據所述不可開放語義信息,生成不可開放語義數據集;
獲得所述第一語句信息的目標卷積特征;所述目標卷積特征為需要訓練獲得的分布特征;
根據所述目標卷積特征,對所述語義分析模型中的所述不可開放語義數據集進行遍歷的卷積運算,獲得第一卷積結果;
根據所述第一卷積結果,獲得所述第四分析結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇聯著實業股份有限公司,未經江蘇聯著實業股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110542853.8/1.html,轉載請聲明來源鉆瓜專利網。





