[發明專利]一種自動量刑的方法和系統在審
| 申請號: | 202010074590.8 | 申請日: | 2020-01-22 |
| 公開(公告)號: | CN111274786A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 竇志成 | 申請(專利權)人: | 中國人民大學 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06N3/04;G06N20/00;G06Q10/04;G06Q50/18 |
| 代理公司: | 北京紀凱知識產權代理有限公司 11245 | 代理人: | 孫楠 |
| 地址: | 100872 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動 量刑 方法 系統 | ||
1.一種自動量刑的方法,其特征在于,包括以下步驟:
S1.選定數據庫,提取數據庫中案情描述、量刑情節和人工量刑特征;
S2.獲得所述案情描述、量刑情節和人工量刑特征的層次化向量;
S3.將所述案情描述、量刑情節和人工量刑特征的層次化向量作為輸入基于神經網絡的多層感知器,采用所述多層感知器的輸出預測刑期。
2.如權利要求1所述的自動量刑的方法,其特征在于,所述步驟S1中,還包括從選定的數據庫中提取案件的實際刑期,即由法官確定的刑期,計算所述實際刑期與所述預測刑期的差值,并對所述差值進行打分,所述差值越小,分值越高。
3.如權利要求1所述的自動量刑的方法,其特征在于,所述S1中提取數據庫中案情描述、量刑情節和人工量刑特征包括:將數據庫中提取到的文本進行分詞,形成詞向量,去除曾用詞和停用詞,并采用Skip-gram算法訓練對案情進行描述的所述詞向量。
4.如權利要求1-3任一項所述的自動量刑的方法,其特征在于,所述S1中提取數據庫中案情描述、量刑情節和人工量刑特征包括:將數據庫中提取到的數據將其轉換為量刑時對應的數據區間,并采用所述量刑時對應的數據區間對所述數據庫中的數據。
5.如權利要求1-3任一項所述的自動量刑的方法,其特征在于,所述步驟S2中采用帶注意力機制的Bi-LSTM模型生成句子級案情描述向量,根據句子級案情描述向量,通過Bi-LSTM模型和注意力機制得到段落級量刑情節向量。
6.如權利要求5所述的自動量刑的方法,其特征在于,所述段落級案情描述向量的計算公式為:
vt=Wht+b
其中,S是句子級案情描述向量,ht是第t個位置的隱含層向量,αt是第t個位置句子級案情描述向量的權重,vt是段落級案情描述向量,uw,W,b是隨機初始化參數矩陣。
7.如權利要求1-3任一項所述的自動量刑的方法,其特征在于,所述S2中將量刑情節的文字內容拆分成句子,對于每個句子,采用注意力機制生成句子級量刑情節向量,并基于多個所述句子級量刑情節向量,采用雙向長短時記憶神經網絡得到段落級量刑情節向量。
8.如權利要求7所述的自動量刑的方法,其特征在于,將每個所述句子級量刑情節向量拆分成若干量刑情節,對于每個量刑情節,采用注意力機制生成量刑情節向量,并基于多個所述量刑情節向量,得到句子級量刑情節向量。
9.如權利要求8所述的自動量刑的方法,其特征在于,所述句子級的量刑情節相量的公式為:
score(qt,S)=qtWS
其中S是句子級案情描述向量,qt是第t個量刑情節的量刑情節向量,W是訓練時隨機初始化的參數矩陣,αt是量刑情節權重,T是量刑情節的個數,Qi是句子級案情描述向量的量刑情節,pt是第t個量刑情節對刑期影響程度的離散化表示。
10.一種自動量刑的系統,其特征在于,包括:
特征提取模塊,用于提取數據庫中案情描述、量刑情節和人工量刑特征;
向量獲得模塊,用于獲得所述案情描述、量刑情節和人工量刑特征的層次化向量;
刑期預測模塊,用于將所述案情描述、量刑情節和人工量刑特征的層次化向量作為輸入基于神經網絡的多層感知器,采用所述多層感知器的輸出預測刑期。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民大學,未經中國人民大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010074590.8/1.html,轉載請聲明來源鉆瓜專利網。





