[發明專利]基于鍵值記憶網絡的案件案由分類方法及介質有效
| 申請號: | 202010413889.1 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111651594B | 公開(公告)日: | 2023-06-09 |
| 發明(設計)人: | 黃璇璇;程威宇;沈艷艷 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/126;G06F40/279;G06Q50/18;G06N3/04 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 鍵值 記憶 網絡 案件 案由 分類 方法 介質 | ||
本發明提供了一種基于鍵值記憶網絡的案件案由分類方法及介質,包括:1)數據預處理:從司法文書中提取案情描述文本信息和文書引用的法律條文信息;2)模型構建:建立基于鍵值記憶網絡的案件案由分類模型,包括對引用法條的建模、案件案情描述文本的建模和對鍵值記憶增強神經網絡的建模;3)模型訓練:通過訓練數據對建立的案由分類模型進行優化,得到最優參數;4)模型預測:輸入測試數據集的案件案情描述文本,模型預測案件對應的案由類別。本發明使用鍵值記憶增強神經網絡進行案由分類,能夠借助法律條文的引用信息有效提取案情關鍵信息,提高樣本數量較少的案由的分類準確率,進而提升案由分類的總體準確度。
技術領域
本發明涉及數據處理技術領域,具體地,涉及基于鍵值記憶網絡的案件案由分類方法及介質。尤其地,涉及一種基于鍵值記憶增強神經網絡的案件案由分類方法。
背景技術
案由分類對構建智能法律文書案件評查系統具有重要意義,給專業人員(例如法官和律師)提供方便的參考,提高他們的工作效率。案由分類同時也是立案、審判實務中不可回避的問題,案由確定的準確與否有利于對受理案件進行分類管理,有利于人民法院在審判務實中準確確定案件訴訟爭點和正確使用法律,提高案件司法統計的準確性、科學性。
專利文獻CN110502634A(申請號:201910742625.8)公開了一種案由的判定和抓取方法及其系統,判定方法包括以下步驟:獲取待判定的案件描述文本數據;對文本數據進行分詞處理和去噪處理;從經過分詞處理和去噪處理的文本數據中進行關鍵字提取,所述關鍵字用以表征主要事實說明;將提取到的關鍵字數據帶入案由分類器,生成對案情的判定結果,所述案由分類器通過訓練案例網絡庫學習語料獲得;所述抓取方法包括以下步驟:利用網絡爬蟲在案例網絡庫網站進行搜索爬取,抓取其中的案例信息數據;對獲取到的案例信息數據通過正則表達式進行結構化數據清洗。但該方法案由的判定和抓取準確度偏低。
發明內容
針對現有技術中的缺陷,本發明的目的是提供一種基于鍵值記憶網絡的案件案由分類方法及介質。
根據本發明提供的一種基于鍵值記憶網絡的案件案由分類方法,包括如下步驟:
數據預處理步驟:從司法文書中提取案情描述文本信息和文書引用的法律條文信息;
模型構建步驟:建立基于鍵值記憶網絡的案件案由分類模型,包括對引用法條的建模、案件案情描述文本的建模和對鍵值記憶增強神經網絡的建模;
模型訓練步驟:通過訓練數據對建立的案由分類模型進行優化,得到最優參數。
模型預測步驟:輸入測試數據集的案件案情描述文本,模型預測案件對應的案由類別。
優選地,所述從司法文書中提取案情描述文本信息和文書引用的法律條文信息包括:
司法文書中包含對案件案情的描述和法院機構判定案件引用的法條;
所述法條與案由具有數據相關性,相同案由的案件引用相同或相關的法條,法條是判定案件性質的依據,也是案由分類的依據。將文書中引用的法條使用正則表達式從文書中提取出來得到引用的所有法條的編號,以及從文書文本中按照規則提取案情描述文本段落得到案情描述文本信息,對文本進行分詞,用詞向量表示。
優選地,所述模型構建步驟具體包括:
對引用法條表示向量的建模;
對案情描述文本表示向量的建模;
對鍵值記憶增強神經網絡的建模。
優選地,對引用法條表示向量的建模,具體包括:
將文書引用的所有法條編號使用獨熱編碼進行編碼,法條編碼乘以隨機初始化的參數矩陣,得到引用法條表示向量。
優選地,所述對案情描述文本表示向量建模,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010413889.1/2.html,轉載請聲明來源鉆瓜專利網。





