[發明專利]融入案件輔助句的低頻和易混淆罪名預測方法有效
| 申請號: | 202010017893.6 | 申請日: | 2020-01-08 |
| 公開(公告)號: | CN111260114B | 公開(公告)日: | 2022-06-17 |
| 發明(設計)人: | 余正濤;劉真丞;郭軍軍;黃于欣;相艷 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62;G06N3/04;G06N3/08;G06Q50/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 融入 案件 輔助 低頻 和易 混淆 罪名 預測 方法 | ||
本發明涉及融入案件輔助句的低頻和易混淆罪名預測方法,屬于自然語言處理技術領域。本發明包括步驟:首先基于司法領域構建案件輔助句,將案件輔助句擬定為外部知識,作為案情描述和罪名之間的映射。同時基于詞級和字符級計算案情描述與案件輔助句多粒度特征,并借助案件輔助句與案情描述構建雙向互注意力,強化案情描述和案件輔助句之間的信息交互,提取具有案件輔助句指導的案情描述多粒度傾向性特征,依此來提升低頻和易混淆罪名預測準確率。本發明的F1值最大提升13.2%,準確率最大提升4.5%,低頻罪名預測F1值提升4.3%,易混淆罪名預測F1值提升8.2%。
技術領域
本發明涉及融入案件輔助句的低頻和易混淆罪名預測方法,屬于自然語言處理技術領域。
背景技術
罪名預測任務是法律判決任務中一個重要的子任務,在法律領域中發揮著至關重要的作用。現今常見罪名預測準確率比較高,但低頻和易混淆罪名的預測準確率卻不盡人意,主要是因為低頻罪名數據少和易混淆罪名案情描述相似等原因。據統計,截止目前為止我國刑法罪名共有469類,罪名的分布成典型的長尾分布(冪律分布的一種形式)。在我國幾千萬的裁判文書數據中,我們統計大量真實案件數據后發現,比較常見的罪名(如盜竊罪、搶劫罪等)占了大約78%;比較低頻的幾十類罪名(如倒賣文物罪、高利轉貸罪等)只占了不到0.5%,此類低頻罪名中大部分案例數據只有十多條,同時有很大一部分罪名及其案情描述不易區分。因此,提高低頻和易混淆罪名的預測準確率是罪名預測任務的難點和關鍵技術之一。
對于罪名預測任務而言,早在20世紀60年代,Kort等人采用定量方法,通過計算事實元素的數值來預測判斷,Nagel等人利用相關分析對重新分配的案例進行預測。隨著神經網絡模型能提取自然語言更深層次的語義特征,Zhong等人基于神經網絡模型結合多個子任務間的拓撲結構信息提出聯合模型同時完成法律判決預測的多個子任務。Luo等人基于注意力機制的神經網絡模型在罪名預測任務中融入法條信息。此類方法在常見罪名預測取得較好的準確率,但對于低頻和易混淆罪名而言預測準確率較低,因此劉宗林等人提出了融入罪名關鍵詞的法律判決預測多任務學習模型,判決結果包括法條推薦和罪名預,Hu等人提出融入罪名區分屬性預測低頻和易混淆罪名的方法,這些方法都是罪名預測研究的典型代表。
發明內容
本發明提供了融入案件輔助句的低頻和易混淆罪名預測方法,旨在融入案件輔助句提高低頻和易混淆罪名的預測準確率,改善低頻和易混淆罪名預測準確率低這一技術難點。
本發明的技術方案是:融入案件輔助句的低頻和易混淆罪名預測方法,所述融入案件輔助句的低頻和易混淆罪名預測方法的具體步驟如下:
Step1、基于司法領域分析刑事案件數據,構建案件輔助句;
進一步地,所述步驟Step1中基于刑事案件公共數據集構建案件輔助句,該類案件輔助句具有案件的核心語義信息。
為了改進低頻罪名數據量小和易混淆罪名案情描述相似導致其預測準確率低這一問題,基于司法領域構建案件輔助句。借助于案件輔助句擴充低頻罪名的構成元素和易混罪名的有效區分因素。
表1案件輔助句
采用圖1所示的方式分析中國刑事案件數據,以搶劫罪和搶奪罪為例,首先由這兩類罪名的案件性質可知,這兩類罪名均有“故意犯罪行為”和“以非法占有為目的”,以此可區別于其他部分案件(如過失致人死亡罪等);其次通過案情描述對比分析,可知“搶劫罪”搶劫罪的案情描述中包含了“強行推倒”、“刺傷”和“威脅”等暴力手段,與之相反“搶奪罪”的案情描述更傾向于“趁其不備”,未使用暴力手段。因此我們可定義搶劫罪和搶奪罪的有效區分因素為該案件是否“以暴力為手段”。依此共定義了9類具有案件核心語義信息的案件輔助句,案件輔助句的詳細介紹如表1所示。值得一提的是,我們定義案件輔助句時均遵循法律規定和案件判決的客觀事實。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010017893.6/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





