[發(fā)明專利]融入案件輔助句的低頻和易混淆罪名預(yù)測方法有效
| 申請?zhí)枺?/td> | 202010017893.6 | 申請日: | 2020-01-08 |
| 公開(公告)號: | CN111260114B | 公開(公告)日: | 2022-06-17 |
| 發(fā)明(設(shè)計)人: | 余正濤;劉真丞;郭軍軍;黃于欣;相艷 | 申請(專利權(quán))人: | 昆明理工大學(xué) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62;G06N3/04;G06N3/08;G06Q50/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 融入 案件 輔助 低頻 和易 混淆 罪名 預(yù)測 方法 | ||
1.融入案件輔助句的低頻和易混淆罪名預(yù)測方法,其特征在于:所述融入案件輔助句的低頻和易混淆罪名預(yù)測方法的具體步驟如下:
Step1、基于司法領(lǐng)域分析刑事案件數(shù)據(jù),構(gòu)建案件輔助句;
Step2、在Step1的基礎(chǔ)上,提取案件輔助句與案情描述的詞級和字符級多粒度特征,并利用單層的Bi-GRU分別獲取具有上下文語義特征信息的案情描述表征向量和案件輔助句表征向量;
Step3、在Step2的基礎(chǔ)上,計算具有上下文語義特征信息的案件輔助句和案情描述雙向互注意力向量,其結(jié)果再結(jié)合具有上下文語義特征信息的案情描述表征向量得到案件描述表征,用于把具有上下文語義特征信息的案件輔助句信息和案情描述信息進(jìn)行耦合,強(qiáng)化案情描述和案件輔助句之間的信息交互;
Step4、把步驟Step2、Step3的輸出進(jìn)行拼接,并采用雙層的Bi-GRU提取案情描述在時序上的依賴關(guān)系;
Step5、把步驟Step3、Step4的輸出進(jìn)行拼接,并采用最大池化提取案件的關(guān)鍵特征,再通過softmax函數(shù)以獲取預(yù)測結(jié)果的概率分布,用于預(yù)測罪名;
所述步驟Step3計算具有上下文語義特征信息的案情描述表征向量K和案件輔助句表征向量L的雙向互注意力向量;計算方法如下:
Step3.1、首先計算案情描述與案件輔助句相似矩陣:
Stj=α(K:t,L:j)∈RT×J (1)
其中,Stj表示第t個案情描述詞和第j個案件輔助句詞之間的相似性,K:t表示K的第t列向量,L:j表示L的第j列向量,α表示計算K與L之間相似度的可訓(xùn)練函數(shù),如公式(2):
其中,是待訓(xùn)練的權(quán)重向量,表示元素依次相乘,(;)表示向量在行上的拼接,k表示K中某一列向量,l表示L中某一列向量;
Step3.2、由相似矩陣計算案情描述到案件輔助句的注意力向量:對St:中列進(jìn)行softmax歸一化得at,再將at與L中的每一列加權(quán)求和得表示案情描述與案件輔助句之間的注意力向量矩陣,如公式(3)、(4)所示:
at=softmax(St:)∈RJ (3)
其中St:表示第t個案情描述詞與案件輔助句詞的相似度,at表示第t個案情描述詞對案件輔助句詞的注意力權(quán)重;atj表示第t個案情描述詞對第j個案件輔助句詞的注意力權(quán)重;
Step3.3、然后再計算案件輔助句到案情描述的注意力向量:
取相似矩陣Stj中每列的最大值e,再經(jīng)softmax歸一化后得p,利用p計算案情描述中與案件輔助句比較相關(guān)詞的加權(quán)求和得然后沿著列方向平鋪T次得到案件輔助句到案情描述的注意力向量矩陣如公式(5):
其中,maxcol表示取Stj中每列的最大值,TiledT表示沿著列方向平鋪T次;
Step3.4、得到案情描述和案件輔助句的雙向互注意力向量和通過Cat函數(shù)把案情描述表征向量K、案情描述到案件輔助句的注意力向量和案件輔助句到案情描述的注意力向量拼接后得矩陣M,M中每個列向量表示可以視為案件輔助句感知的案情描述詞表征,如公式(6):
dM=8d (6)
其中M:t表示第t個列向量,與第t個案情描述詞相對應(yīng),表示案件輔助句中某一個詞與案情描述的注意力向量,表示案情描述中某一個詞與案件輔助句的注意力向量,其中;表示拼接,表示矩陣相乘,d表示循環(huán)神經(jīng)網(wǎng)絡(luò)的輸出維度。
2.根據(jù)權(quán)利要求1所述的融入案件輔助句的低頻和易混淆罪名預(yù)測方法,其特征在于:所述步驟Step1中基于刑事案件公共數(shù)據(jù)集構(gòu)建案件輔助句,該案件輔助句具有案件的核心語義信息。
3.根據(jù)權(quán)利要求1所述的融入案件輔助句的低頻和易混淆罪名預(yù)測方法,其特征在于:所述步驟Step2中,分別使用Skip-Gram模型和Chars-CNN獲取案件輔助句和案情描述的詞級和字符級多粒度特征,再引入高速網(wǎng)絡(luò)平衡詞向量和字符向量的相對貢獻(xiàn)比,同時利用單層的Bi-GRU分別獲取具有上下文語義特征信息的案情描述表征向量和案件輔助句表征向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于昆明理工大學(xué),未經(jīng)昆明理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010017893.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運(yùn)輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機(jī)輔助管理
- 一種增強(qiáng)尼龍包容鋼齒輪
- 一種增強(qiáng)尼龍包容鋼齒輪
- 融入式市場系統(tǒng)和方法
- 煤矸石淋濾液消融入滲土柱模擬系統(tǒng)及特征參數(shù)測定方法
- 煤矸石淋濾液消融入滲室內(nèi)土柱模擬裝置
- 將句子權(quán)重融入神經(jīng)機(jī)器翻譯的領(lǐng)域適應(yīng)方法
- 融入依存關(guān)系的神經(jīng)機(jī)器翻譯方法
- 基于虛擬現(xiàn)實及多模態(tài)信息的孤獨(dú)癥輔助干預(yù)系統(tǒng)及方法
- 一種基于生成對抗網(wǎng)絡(luò)的視頻廣告融入系統(tǒng)與方法
- 基于融入空間信息的加權(quán)伽馬混合模型的SAR影像分割方法





