[發明專利]一種自動量刑的方法和系統在審
| 申請號: | 202010074590.8 | 申請日: | 2020-01-22 |
| 公開(公告)號: | CN111274786A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 竇志成 | 申請(專利權)人: | 中國人民大學 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06N3/04;G06N20/00;G06Q10/04;G06Q50/18 |
| 代理公司: | 北京紀凱知識產權代理有限公司 11245 | 代理人: | 孫楠 |
| 地址: | 100872 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動 量刑 方法 系統 | ||
本發明涉及一種自動量刑的方法和系統,包括以下步驟:S1.選定數據庫,提取數據庫中案情描述、量刑情節和人工量刑特征;S2.獲得案情描述、量刑情節和人工量刑特征的層次化向量;S3.將案情描述、量刑情節和人工量刑特征的層次化向量作為輸入基于神經網絡的多層感知器,采用所述多層感知器的輸出預測刑期。其引入量刑情節權重信息,融合量刑情節層次化向量表示和案情描述向量表示及人工構建的量刑特征構建深度神經網絡,從而提升量刑的準確率。
技術領域
本發明是關于一種自動量刑的方法和系統,屬于智能量刑技術領域。
背景技術
近年來,機器學習和深度學習等人工智能技術在信息檢索、文本、圖像和語音處理等領域的取得顯著成果,法律判決等任務的智能化引起了學界的關注。法律任務智能化不僅可以提升司法人員辦案的效率也可以一定程度使司法過程更加透明、公正。
法律判決智能化的兩項重要任務是定罪和量刑。其中自動量刑通過給定案情描述和罪名自動預測犯罪人刑期的一項任務。量刑主要對犯罪人的主刑進行裁量,一些案件還包括附加刑的裁量。我國刑法中主刑的刑罰包括管制、拘役、有期徒刑、無期徒刑和死刑。附加刑的刑罰主要包括罰金和剝奪政治權利等。
目前,智能量刑系統主要三種方法精心自動量刑,其一是采用統計和概率的方法,但此種方法會損失案情描述信息和量刑情節信息。其二是基于人工構建量刑特征的機器學習量刑研究方法,此種方法雖然提升了量刑準確率,但是存在損失案情描述語義信息等問題。第三種是基于案情描述向量表示的深度學習方法定罪預測,其雖具有語義信息、案情描述信息和量刑情節,但量刑情節中明顯有一些內容對于量刑是非常重要的,而另一些則是一般性描述,對于量刑結果沒有什么影響。故該方法將量刑情節無差別的進行深度學習,不僅數據處理量大,而且會弱化重要情節的重要性,導致最終輸出結果偏離正確結果,導致量刑錯誤。
本實施例將引入量刑情節權重信息,融合量刑情節層次化向量表示和案情描述向量表示及人工構建的量刑特征構建深度神經網絡,從而提升量刑的準確率。
發明內容
針對上述現有技術的不足,本發明的目的是提供了一種自動量刑的方法和系統,其引入量刑情節權重信息,融合量刑情節層次化向量表示和案情描述向量表示及人工構建的量刑特征構建深度神經網絡,從而提升量刑的準確率。
為實現上述目的,本發明提供了一種自動量刑的方法,包括以下步驟:S1.選定數據庫,提取數據庫中案情描述、量刑情節和人工量刑特征;S2.獲得案情描述、量刑情節和人工量刑特征的層次化向量;S3.將案情描述、量刑情節和人工量刑特征的層次化向量作為輸入基于神經網絡的多層感知器,采用多層感知器的輸出預測刑期。
進一步,步驟S1中,還包括從選定的數據庫中提取案件的實際刑期,即由法官確定的刑期,計算實際刑期與預測刑期的差值,并對差值進行打分,差值越小,分值越高。
進一步,S1中提取數據庫中案情描述、量刑情節和人工量刑特征包括:將數據庫中提取到的文本進行分詞,形成詞向量,去除曾用詞和停用詞,并采用Skip-gram算法訓練對案情進行描述的詞向量。
進一步,S1中提取數據庫中案情描述、量刑情節和人工量刑特征包括:將數據庫中提取到的數據將其轉換為量刑時對應的數據區間,并采用量刑時對應的數據區間對數據庫中的數據。
進一步,步驟S2中采用帶注意力機制的Bi-LSTM模型生成句子級案情描述向量,根據句子級案情描述向量,通過Bi-LSTM模型和注意力機制得到段落級量刑情節向量。
進一步,段落級案情描述向量的計算公式為:
vt=Wht+b
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民大學,未經中國人民大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010074590.8/2.html,轉載請聲明來源鉆瓜專利網。





