[發明專利]一種基于大數據的案件自動處理方法、裝置及終端設備有效
| 申請號: | 202110542723.4 | 申請日: | 2021-05-19 |
| 公開(公告)號: | CN113032544B | 公開(公告)日: | 2021-08-20 |
| 發明(設計)人: | 周金明;陳貴龍 | 申請(專利權)人: | 南京視察者智能科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F40/247 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210014 江蘇省南京市秦淮區永智*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 案件 自動 處理 方法 裝置 終端設備 | ||
1.一種基于大數據的案件自動處理方法,其特征在于,該方法包括如下步驟:
步驟1,獲取所有處理完結的歷史案件,作為待匹配的歷史案件,每個歷史案件包括案件的案件描述和處理結果,對每個案件根據其案件描述和處理結果提取出多個關鍵詞,并通過中文BERT模型計算得到每個關鍵詞的詞向量,把多個關鍵詞的詞向量取均值后得到該案件的中心思想向量;
步驟2,根據處理完結的歷史案件對新案件進行粗排匹配;
對于一個新案件,首先從其案件描述中選取出多個關鍵詞,并添加這多個關鍵詞的近義詞、同義詞共同構成檢索詞集合W{w1,w2,……,wn},n為檢索詞的個數,通過中文BERT模型計算得到每個檢索詞的詞向量,對每個檢索詞的詞向量和所述中心思想向量做標準化處理,即用向量除以其向量的模長,從而保證標準化后向量模長都為1,記新案件檢索詞wi的標準化詞向量為Ai,某個歷史案件中心思想標準化向量為B;
計算新案件與任一歷史案件的粗排相似度,粗排相似度為新案件檢索詞的標準化詞向量與某個歷史案件中心思想標準化向量的內積平均值,即粗排相似度C為:
獲取粗排相似度大于給定閾值的歷史案件,選取粗排相似度值排名前N的歷史案件作為粗排結果;
步驟3,獲取粗排結果后,通過文本相似度匹配算法計算精排相似度,智能匹配到新案件的處理結果;
構建案件描述-案件描述匹配度模型和案件描述-處理方法匹配度模型,并對兩個模型進行訓練,兩個模型的結構相同,均為BERT+二分類框架;
對案件描述-案件描述匹配度模型進行訓練:
對任意兩個歷史案件,若兩個案件的案件描述是同一事實,則認為這兩個案件是可匹配的,否則認為是不可匹配的,從而獲得訓練樣本;
訓練過程為:將兩個歷史案件分別作為文本1和文本2,將這兩個文本的每個字轉換為字向量,輸入BERT模型,將BERT模型最后一層的第一個[CLS]位置輸出的向量,輸入到線性二分類模型,得到具體的取值范圍在0~1之間的匹配分值,當該匹配分值≥α時認為是匹配的,α∈[0.5,0.6],否則認為是不匹配的,通過訓練樣本訓練參數得到案件描述-案件描述匹配度模型Model1;
對案件描述-處理方法匹配度模型進行訓練:
對任意兩個歷史案件,若兩個案件的案件描述和處理方法是匹配的,則認為這兩個案件是匹配的,否則認為是不匹配的,從而獲得訓練樣本;
訓練過程為:將一個案件描述和一個處理方法分別作為文本1和文本2,將這兩個文本的每個字轉換為字向量,輸入BERT模型,將BERT模型最后一層的第一個[CLS]位置輸出的向量,輸入到線性二分類模型,得到具體的取值范圍在0~1之間的匹配分值,當匹配分值≥β時認為是匹配的β∈[0.6,0.7],否則認為是不匹配的,通過訓練樣本訓練參數得到案件描述-處理方法匹配度模型Model2;
訓練得到模型Model1和模型Model2后,對于新案件,依次與粗排結果中每個歷史案件進行匹配度計算:對于一個歷史案件H,將新案件的案件描述與歷史案件H的案件描述拼接輸入Model1得到匹配分值S1,將新案件的案件描述與歷史案件H的處理方法拼接輸入Model2得到匹配分值S2,則歷史案件H與新案件的精排相似度S為:
其中X1,X2分別為匹配分值S1,匹配分值S2的權重,
依次計算新案件與粗排結果中每個歷史案件的精排相似度,選取精排相似度最大的一個歷史案件,以該精排相似度最大的歷史案件的處理方法作為新案件的處理結果。
2.根據權利要求1所述的一種基于大數據的案件自動處理方法,其特征在于,還包括:當步驟1中獲取處理完結的歷史案件或步驟2中獲取新案件時,若案件是文本輸入的形式,則直接獲取文本作為案件描述,若是pdf或圖片的形式,則先通過圖像識別獲取文本作為案件描述。
3.根據權利要求1所述的一種基于大數據的案件自動處理方法,其特征在于,在模型Model2的訓練樣本獲取過程中,還包括:若其他案件的處理方法同樣適用于本案件,則認為本案件的案件描述和該處理方法是匹配的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京視察者智能科技有限公司,未經南京視察者智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110542723.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鐵路減速頂防碴堵塞裝置及其方法
- 下一篇:一種化工物料混合裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





