[發明專利]基于詞向量模型的法條推薦方法有效
| 申請號: | 201811170180.2 | 申請日: | 2018-09-26 |
| 公開(公告)號: | CN109446416B | 公開(公告)日: | 2021-09-28 |
| 發明(設計)人: | 葛季棟;李傳藝;王子安;馮奕;雷妙妙;周筱羽;駱斌 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/216;G06F40/289;G06F40/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 向量 模型 法條 推薦 方法 | ||
1.基于詞向量模型的法條推薦方法,其特征是通過詞向量的計算獲取案情相似的裁判文書并通過協同過濾方法進行推薦,它以已經成文的裁判文書集和目標文書的案件基本情況為輸入,以推薦系統推薦的法條為輸出結果;該方法通過詞向量計算文書之間的詞移動距離(Word Mover’s Distance)來度量文書之間的相似程度;該方法具體包含以下步驟:
步驟(1)獲取初始數據集:獲取已經成文的裁判文書集的案件基本情況集合A1={a1,a2,...,aN}和引用的法條集合F1={f1,f2,...,fN};
步驟(2)對數據集文本分詞:根據集合A1,獲得分詞后的案件基本情況集合A2={a′1,a′2,...,a′N};
步驟(3)清理數據集:根據集合A2,獲得清理后的案件基本情況集合A3={a″1,a″2,...,a″N};
步驟(4)拆分數據集:將集合A3和F1拆分為訓練集A3,t、F1,t和驗證集A3,v、F1,v;
步驟(5)設置詞向量模型參數并訓練:設置窗口大小、詞最小出現頻數、詞向量長度,根據訓練集A3,t,獲得詞向量模型M;
步驟(6)計算基于詞向量模型的訓練集和驗證集:根據詞向量模型M,計算集合A3,t、A3,v中每個詞向量a″i的詞頻,獲得詞頻集合P3,t、P3,v,并將詞替換為詞向量形式,獲得訓練集A4,t和驗證集A4,v;
步驟(7)計算驗證集的相似文書集:根據驗證集中的每個詞向量a″′i和訓練集中的每個詞向量a″′j,獲得和a″′i的相似文書集A5,i;
步驟(8)計算驗證集的推薦法條集:根據集合A5,i、F1,t和協同過濾推薦策略,推薦法條fi′,獲得推薦法條集合F2,v;
步驟(9)計算推薦策略的最優參數:根據集合F1,v和F2,v,獲得最優的推薦策略參數;
步驟(10)對目標裁判文書分詞:對目標文書的案件基本情況ag進行分詞,獲得分詞后的案件基本情況a′g;
步驟(11)清理數據:根據a′g,獲得清理后的案件基本情況a″g;
步驟(12)計算基于詞向量模型的目標文書數據:根據詞向量模型M,計算a″g的詞頻,獲得詞頻pg,并將詞替換為詞向量形式的a″′g;
步驟(13)計算目標文書的相似文書集:根據a″′g和訓練集中的詞向量a″′j,獲得和a″′g的相似文書集A5,g;
步驟(14)計算目標文書的推薦法條集:根據集合A5,g、F1,t和協同過濾推薦策略,推薦法條f′g。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811170180.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種應用推薦、獲取方法及設備
- 下一篇:一種智能化檢索方法和裝置





