[發明專利]一種基于法條關系的法條推薦方法在審
| 申請號: | 202011036946.5 | 申請日: | 2020-09-27 |
| 公開(公告)號: | CN112148867A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 李傳藝;葛季棟;馮奕;黃云云;周筱羽;駱斌 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06K9/62;G06N3/04;G06N3/08;G06Q10/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 法條 關系 推薦 方法 | ||
1.一種基于法條關系的法條推薦方法,其特征在于包含以下步驟:
步驟(1)從中國裁判文書網收集裁判文書,構建訓練語料;
步驟(2)訓練語料預處理;
步驟(3)用戶輸入預處理;
步驟(4)訓練基于法條關系的,并以罪名預測任務為輔助任務進行聯合學習的序列生成模型;
步驟(5)提取推薦法條集;
步驟(6)輸出推薦法條列表。
2.根據權利要求1所述的一種基于法條關系的法條推薦方法,其特征在于步驟(1)中從中國裁判文書網收集裁判文書,構建訓練語料。
3.根據權利要求1所述的一種基于法條關系的法條推薦方法,其特征在于步驟(2)中對訓練語料進行預處理,具體子步驟包括:
步驟(2.1)從裁判文書中抽取出案件事實、引用法條列表和指控罪名;
步驟(2.2)對案件事實進行中文分詞,獲取詞匯集并記錄每個詞匯出現的頻次;
步驟(2.3)去除低頻詞語,構造該任務訓練語料的詞典;
步驟(2.4)合并所有案件的控告罪名,構造針對該任務訓練語料的控告罪名集合,形成罪名預測任務的輸出空間;
步驟(2.5)合并所有案件引用的法條,構造針對該任務訓練語料的引用法條集合,形成法條推薦任務的輸出空間。
4.根據權利要求1所述的一種基于法條關系的法條推薦方法,其特征在于步驟(3)中對用戶輸入的案件事實進行預處理,具體子步驟包括:
步驟(3.1)對用戶輸入的案件事實進行中文分詞;
步驟(3.2)將各詞匯根據詞典轉化為獨熱向量表示。
5.根據權利要求1所述的一種基于法條關系的法條推薦方法,其特征在于步驟(4)中訓練本發明設計的一個基于法條關系,并以罪名預測任務為輔助任務同時進行學習,從而更好地實現法條推薦任務的聯合生成模型。將預處理后的訓練語料劃分為訓練集、驗證集和測試集,使用訓練集進行聯合生成模型的學習;使用驗證集在訓練過程中對模型進行初步評估,便于觀察模型的訓練情況;使用測試集進行聯合生成模型最終泛化能力的評估。訓練目標是最大化罪名預測和法條推薦這兩個任務的預測效果。重復訓練過程,得到最優的法條推薦的生成模型。具體子步驟包括:
步驟(4.1)將數據集劃分為訓練集、驗證集和測試集;
步驟(4.2)訓練聯合生成模型。
6.根據權利要求1所述的一種基于法條關系的法條推薦方法,其特征在于步驟(5)中根據上一步驟訓練好的聯合生成模型,基于用戶輸入的案件事實,完成對案件控告罪名的預測,并依次輸出模型預測的推薦法條集。具體子步驟包括:
步驟(5.1)以預處理好的案件事實為輸入,基于聯合生成模型中的編碼器部分,通過自注意力機制捕捉案件事實中隱含的語義信息,將其編碼為記憶單元,該記憶單元一方面用于控告預測,另一方面用于法條推薦;
步驟(5.2)根據上述得到的記憶單元,通過聯合生成模型中的解碼器部分,以上一個時間步輸出的法條為輸入,初始輸入為“START”標簽,依次輸出當前時間步預測得到的法條。當解碼器輸出“END”標簽時,表示預測結束。
7.根據權利要求1所述的一種基于法條關系的法條推薦方法,其特征在于步驟(6)輸出推薦法條集。法條推薦的效果采用準確率、召回率、F1值進行評估。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011036946.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于VR技術的工程監理系統
- 下一篇:一種裁判文書的文本信息脫敏方法





