[發明專利]融入案件輔助句的低頻和易混淆罪名預測方法有效
| 申請號: | 202010017893.6 | 申請日: | 2020-01-08 |
| 公開(公告)號: | CN111260114B | 公開(公告)日: | 2022-06-17 |
| 發明(設計)人: | 余正濤;劉真丞;郭軍軍;黃于欣;相艷 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62;G06N3/04;G06N3/08;G06Q50/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 融入 案件 輔助 低頻 和易 混淆 罪名 預測 方法 | ||
1.融入案件輔助句的低頻和易混淆罪名預測方法,其特征在于:所述融入案件輔助句的低頻和易混淆罪名預測方法的具體步驟如下:
Step1、基于司法領域分析刑事案件數據,構建案件輔助句;
Step2、在Step1的基礎上,提取案件輔助句與案情描述的詞級和字符級多粒度特征,并利用單層的Bi-GRU分別獲取具有上下文語義特征信息的案情描述表征向量和案件輔助句表征向量;
Step3、在Step2的基礎上,計算具有上下文語義特征信息的案件輔助句和案情描述雙向互注意力向量,其結果再結合具有上下文語義特征信息的案情描述表征向量得到案件描述表征,用于把具有上下文語義特征信息的案件輔助句信息和案情描述信息進行耦合,強化案情描述和案件輔助句之間的信息交互;
Step4、把步驟Step2、Step3的輸出進行拼接,并采用雙層的Bi-GRU提取案情描述在時序上的依賴關系;
Step5、把步驟Step3、Step4的輸出進行拼接,并采用最大池化提取案件的關鍵特征,再通過softmax函數以獲取預測結果的概率分布,用于預測罪名;
所述步驟Step3計算具有上下文語義特征信息的案情描述表征向量K和案件輔助句表征向量L的雙向互注意力向量;計算方法如下:
Step3.1、首先計算案情描述與案件輔助句相似矩陣:
Stj=α(K:t,L:j)∈RT×J (1)
其中,Stj表示第t個案情描述詞和第j個案件輔助句詞之間的相似性,K:t表示K的第t列向量,L:j表示L的第j列向量,α表示計算K與L之間相似度的可訓練函數,如公式(2):
其中,是待訓練的權重向量,表示元素依次相乘,(;)表示向量在行上的拼接,k表示K中某一列向量,l表示L中某一列向量;
Step3.2、由相似矩陣計算案情描述到案件輔助句的注意力向量:對St:中列進行softmax歸一化得at,再將at與L中的每一列加權求和得表示案情描述與案件輔助句之間的注意力向量矩陣,如公式(3)、(4)所示:
at=softmax(St:)∈RJ (3)
其中St:表示第t個案情描述詞與案件輔助句詞的相似度,at表示第t個案情描述詞對案件輔助句詞的注意力權重;atj表示第t個案情描述詞對第j個案件輔助句詞的注意力權重;
Step3.3、然后再計算案件輔助句到案情描述的注意力向量:
取相似矩陣Stj中每列的最大值e,再經softmax歸一化后得p,利用p計算案情描述中與案件輔助句比較相關詞的加權求和得然后沿著列方向平鋪T次得到案件輔助句到案情描述的注意力向量矩陣如公式(5):
其中,maxcol表示取Stj中每列的最大值,TiledT表示沿著列方向平鋪T次;
Step3.4、得到案情描述和案件輔助句的雙向互注意力向量和通過Cat函數把案情描述表征向量K、案情描述到案件輔助句的注意力向量和案件輔助句到案情描述的注意力向量拼接后得矩陣M,M中每個列向量表示可以視為案件輔助句感知的案情描述詞表征,如公式(6):
dM=8d (6)
其中M:t表示第t個列向量,與第t個案情描述詞相對應,表示案件輔助句中某一個詞與案情描述的注意力向量,表示案情描述中某一個詞與案件輔助句的注意力向量,其中;表示拼接,表示矩陣相乘,d表示循環神經網絡的輸出維度。
2.根據權利要求1所述的融入案件輔助句的低頻和易混淆罪名預測方法,其特征在于:所述步驟Step1中基于刑事案件公共數據集構建案件輔助句,該案件輔助句具有案件的核心語義信息。
3.根據權利要求1所述的融入案件輔助句的低頻和易混淆罪名預測方法,其特征在于:所述步驟Step2中,分別使用Skip-Gram模型和Chars-CNN獲取案件輔助句和案情描述的詞級和字符級多粒度特征,再引入高速網絡平衡詞向量和字符向量的相對貢獻比,同時利用單層的Bi-GRU分別獲取具有上下文語義特征信息的案情描述表征向量和案件輔助句表征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010017893.6/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





