[發明專利]一種基于法條共現的法條推薦方法在審
| 申請號: | 202011036948.4 | 申請日: | 2020-09-27 |
| 公開(公告)號: | CN112148868A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 李傳藝;葛季棟;黃云云;馮奕;周筱羽;駱斌 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/35;G06F40/216;G06F40/289;G06K9/62;G06N3/08;G06Q50/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 法條 推薦 方法 | ||
1.一種基于法條共現的法條推薦方法,其特征在于包含以下步驟:
步驟(1)從中國裁判文書網上收集裁判文書,構建訓練語料;
步驟(2)裁判文書預處理;
步驟(3)用戶輸入預處理;
步驟(4)預測案由;
步驟(5)生成候選推薦法條集;
步驟(6)生成最終推薦法條集;
步驟(7)輸出推薦法條列表。
2.根據權利要求1所述的一種基于法條共現的法條推薦方法,其特征在于步驟(1)中從中國裁判文書網上收集裁判文書,構建訓練語料。
3.根據權利要求1所述的一種基于法條共現的法條推薦方法,其特征在于步驟(2)中對裁判文書進行預處理,具體子步驟包括:
步驟(2.1)通過正則表達式匹配提取裁判文書中的關鍵信息,同時將語料中的原始裁判文書轉化為XML形式進行存儲;
步驟(2.2)從各裁判文書的XML文件中獲取案件基本情況、案由及各案件引用的法律法條,構建案由分類任務及法條分類任務的輸出空間;
步驟(2.3)將案件基本情況段落進行中文分詞,轉化成由詞匯組成的列表,同時得到所有詞匯的集合;
步驟(2.4)去除案件基本情況中對最終預測作用不大的停用詞;
步驟(2.5)統計每個詞匯的詞頻和逆文檔頻率,利用TF-IDF將案件基本情況表示為向量形式;
步驟(2.6)利用奇異值分解對數據進行降維。
4.根據權利要求1所述的一種基于法條共現的法條推薦方法,其特征在于步驟(3)中對用戶輸入的案件基本情況進行預處理,具體子步驟與上一步基本一致,包括:
步驟(3.1)中文分詞;
步驟(3.2)去除停用詞;
步驟(3.3)利用TF-IDF將各詞匯轉化為向量表示;
步驟(3.4)利用奇異值分解對數據進行降維。
5.根據權利要求1所述的一種基于法條共現的法條推薦方法,其特征在于步驟(4)中根據案件基本情況預測案由。具體子步驟包括:
步驟(4.1)訓練基于人工神經網絡的案由分類模型。輸入為已處理好的案件基本情況向量,輸出為對應的案由,訓練目標是最小化預測值和準確值之間的交叉熵損失。基于訓練語料不斷對人工神經網絡的參數進行優化,從而獲得最優的案由分類模型;
步驟(4.2)使用上述訓練好的模型對用戶輸入的案件進行案由預測。
6.根據權利要求1所述的一種基于法條共現的法條推薦方法,其特征在于步驟(5)中根據上一步驟中得到的案由,生成候選推薦法條集。具體子步驟包括:
步驟(5.1)根據不同類別的案由各訓練一個基于人工神經網絡的法條分類模型。輸入是預處理好的案件基本情況的TF-IDF向量,輸出為與該案由相匹配的所有法條的概率分布,如果有n則法條與該案由相關,該案由的法條分類器輸出維度就是n;訓練目標是最小化預測值和準確值之間的交叉熵損失。基于訓練語料不斷對人工神經網絡的參數進行優化,從而獲得每個案由對應的最優法條分類模型;
步驟(5.2)根據上一步驟得到的案由,將案件基本情況的TF-IDF向量輸入到對應的訓練好的法條分類模型中,選擇概率較高的k1則法條構成候選推薦法條集。
7.根據權利要求1所述的一種基于法條共現的法條推薦方法,其特征在于步驟(6)中基于法條間的共現關系分析對上一步獲得的k1條法條進行重排序,選擇前k2條構成最終推薦法條集。
8.根據權利要求1所述的一種基于法條共現的法條推薦方法,其特征在于步驟(7)輸出推薦法條集。法條推薦的效果采用準確率、召回率、F1值進行評估。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011036948.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種裁判文書的文本信息脫敏方法
- 下一篇:一種運動營養組合物及其制備方法





