[發明專利]一種保密檢查的事件審核方法和裝置有效
| 申請號: | 202110497155.0 | 申請日: | 2021-05-07 |
| 公開(公告)號: | CN113139106B | 公開(公告)日: | 2022-03-15 |
| 發明(設計)人: | 王世晞;張亮;劉濤;李嬌嬌 | 申請(專利權)人: | 杭州世平信息科技有限公司 |
| 主分類號: | G06F16/9035 | 分類號: | G06F16/9035;G06F16/907;G06Q10/10 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 房鑫 |
| 地址: | 310012 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 保密 檢查 事件 審核 方法 裝置 | ||
1.一種保密檢查的事件審核方法,其特征在于,包括以下步驟:
-建立事件排序模型;
構建訓練數據集;
提取訓練數據集中每個查詢詞的屬性及其對應事件的屬性;
利用每個查詢詞對應事件的屬性,提取每個事件的相關性特征和相似性特征;
構建并訓練排序模型,得到最優排序函數;
相似性特征包括文本相似特征、時間相似特征以及類型相似特征;
文本相似特征:通過BERT模型得到,BERT模型使用預訓練模型;
時間相似特征:通過時間指標來評估事件相似的可能性,按下式進行計算:
T=f(|ti-tj|)/threshold
其中,ti和tj分別表示兩個事件的時間,f為閾值函數,當|ti-tj|>threshold時,f返回threshold,否則,返回|ti-tj|,即T的取值范圍為[0,1];
類型相似特征根據文檔類型預置不同類別之間的相似度;
排序模型的輸入為一個查詢詞對應的每個事件Ei相關性特征向量組成的矩陣和每個事件相似性特征向量組成的矩陣和分別表示相關性特征權重和相似性特征的權重;max(x)為求最大值的函數;輸出為事件的排序;排序函數表示為:
利用樣本數據對排序函數進行訓練,得到最優權重值和從而得到最優排序函數;
-事件去除冗余重排序;
搜索某個查詢詞得到包含若干個事件的事件集合;
提取每個事件的屬性;
提取事件集合中的每個事件與查詢詞之間的相關性特征向量,以及該事件與排在其前面的事件集合的相似性特征矩陣;
將每個事件的相關性特征向量和相似性特征矩陣代入最優排序函數,得到排序值;
將排序值按照從大到小的順序進行排序,即得到事件的排序;
-對事件進行標記。
2.根據權利要求1所述保密檢查的事件審核方法,其特征在于:訓練數據集包括查詢詞集合Q={q1,...,qn},qi為第i個查詢詞,n為查詢詞的總數;每個查詢詞qi都有對應的一個事件集合Ei={eventi1,...,eventim},m為事件的個數;對每條事件按照是否與對應的查詢詞qi相關進行人工標注,通過這些標注信息生成事件集合Ei排序的標準答案ranki={ranki1,...,rankim}。
3.根據權利要求1所述保密檢查的事件審核方法,其特征在于:
查詢詞的屬性為查詢詞的向量表示;
事件的屬性包括事件文本的向量表示、事件對應文檔的創建時間、修改時間及文件類型。
4.根據權利要求1所述保密檢查的事件審核方法,其特征在于:事件的相關性特征通過BERT模型得到,BERT模型使用預訓練模型并在訓練數據集中,利用人工標注的相關性排序結果進行調優訓練,保留BERT模型最后的回歸層之前的輸出為相關性特征向量。
5.根據權利要求1所述保密檢查的事件審核方法,其特征在于,將每個事件的相關性特征向量xj和相似性特征矩陣sj代入最優排序函數,按照下式得到排序值:
6.根據權利要求1所述保密檢查的事件審核方法,其特征在于,所述對事件進行標記的具體步驟如下:首先對某個事件eventj進行獨立標記,再根據eventj的事件相似特征矩陣sj,找出與eventj相似度大于閾值ε的事件,然后給予這些事件以同樣的標記。
7.一種保密檢查的事件審核裝置,其特征在于,實現如權利要求1所述保密檢查的事件審核方法,包括:
事件排序模型建立模塊,用于構建訓練數據集,并提取訓練數據集中每個查詢詞的屬性及其對應事件的屬性,利用每個查詢詞對應事件的屬性,提取每個事件的相關性特征和相似性特征;構建排序模型并進行訓練,得到最優排序函數;
事件去除冗余重排序模塊,用于搜索某個查詢詞得到包含若干個事件的事件集合,提取每個事件的屬性,提取事件集合中的每個事件與查詢詞之間的相關性特征向量以及該事件與排在其前面的事件集合的相似性特征矩陣,將每個事件的相關性特征向量和相似性特征矩陣代入最優排序函數,得到排序值,將排序值按照從大到小的順序進行排序得到事件的排序;
事件標記模塊,根據事件的相似性特征矩陣,找出相似度大于閾值的事件給予同樣標記。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州世平信息科技有限公司,未經杭州世平信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110497155.0/1.html,轉載請聲明來源鉆瓜專利網。





