[發明專利]一種類案推薦方法、系統及裝置在審
| 申請號: | 201811591283.6 | 申請日: | 2018-12-20 |
| 公開(公告)號: | CN109783640A | 公開(公告)日: | 2019-05-21 |
| 發明(設計)人: | 方清 | 申請(專利權)人: | 廣州恒巨信息科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F17/27 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 胡輝;何文聰 |
| 地址: | 510630 廣東省廣州市天河*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 最終相似度 標簽 語料庫 權重 系統及裝置 相似度 排序 裁判 標簽模型 提取特征 語義 精準度 應用 | ||
1.一種類案推薦方法,其特征在于,包括以下步驟:
獲取裁判文書,并對裁判文書進行處理得到案例語料庫;
計算新案例與案例語料庫中每個案例的相似度;
根據新案例提取特征標簽,并計算得到標簽權重總值;
根據新案例與案例語料庫中每個案例的相似度和標簽權重總值,計算得到最終相似度;
根據最終相似度進行排序,得到類案推薦列表。
2.根據權利要求1所述的一種類案推薦方法,其特征在于:所述的獲取裁判文書,并對裁判文書進行處理得到案例語料庫,這一步驟具體包括:
獲取裁判文書,并從裁判文書中提取得到各案例的訴訟案情信息;
對訴訟案情信息進行分詞處理,得到案例文件語料;
調用doc2vec模型對案例文件語料進行訓練,得到詞向量、softmax參數和文檔向量,形成得到案例語料庫。
3.根據權利要求1所述的一種類案推薦方法,其特征在于:所述的計算新案例與案例語料庫中每個案例的相似度,這一步驟具體包括:
根據案例語料庫的詞向量和softmax參數,計算得出新案例的文檔向量;
計算新案例的文檔向量與案例語料庫中每個案例的文檔向量之間的計算歐式距離,得到新案例與案例語料庫中每個案例的相似度。
4.根據權利要求1所述的一種類案推薦方法,其特征在于:所述的根據新案例提取特征標簽,并計算得到標簽權重總值,這一步驟具體包括:
根據新案例的訴訟案情信息提取特征標簽,并對其標準格式化,得到新案例的標簽值;
根據預設的權重定義規則和新案例的標簽值,對新案例的標簽權重因子進行設定;
根據新案例的標簽值和標簽權重因子,計算得到標簽權重總值。
5.根據權利要求1所述的一種類案推薦方法,其特征在于:所述的最終相似度的計算公式為:
Wt=0.5*W1+(1-0.5)*(1/(1+lnW2));
其中,Wt表示最終相似度,W1表示相似度,W2表示標簽權重總值。
6.一種類案推薦系統,其特征在于,包括:
案例語料庫生成單元,用于獲取裁判文書,并對裁判文書進行處理得到案例語料庫;
相似度計算單元,用于計算新案例與案例語料庫中每個案例的相似度;
標簽單元,用于根據新案例提取特征標簽,并計算得到標簽權重總值;
最終相似度計算單元,用于根據新案例與案例語料庫中每個案例的相似度和標簽權重總值,計算得到最終相似度;
列表生成單元,用于根據最終相似度進行排序,得到類案推薦列表。
7.根據權利要求6所述的一種類案推薦系統,其特征在于:所述的案例語料庫生成單元具體包括:
獲取單元,用于獲取裁判文書,并從裁判文書中提取得到各案例的訴訟案情信息;
分詞單元,用于對訴訟案情信息進行分詞處理,得到案例文件語料;
訓練單元,用于調用doc2vec模型對案例文件語料進行訓練,得到詞向量、softmax參數和文檔向量,形成得到案例語料庫。
8.根據權利要求6所述的一種類案推薦系統,其特征在于:所述的相似度計算單元具體包括:
文檔向量計算單元,用于根據案例語料庫的詞向量和softmax參數,計算得出新案例的文檔向量;
歐式距離計算單元,用于計算新案例的文檔向量與案例語料庫中每個案例的文檔向量之間的計算歐式距離,得到新案例與案例語料庫中每個案例的相似度。
9.根據權利要求6所述的一種類案推薦系統,其特征在于:所述的標簽單元具體包括:
標準化單元,用于根據新案例的訴訟案情信息提取特征標簽,并對其標準格式化,得到新案例的標簽值;
標簽權重因子設定單元,用于根據預設的權重定義規則和新案例的標簽值,對新案例的標簽權重因子進行設定;
標簽權重總值計算單元,用于根據新案例的標簽值和標簽權重因子,計算得到標簽權重總值。
10.一種類案推薦裝置,其特征在于,包括:
至少一個處理器;
至少一個存儲器,用于存儲至少一個程序;
當所述至少一個程序被所述至少一個處理器執行,使得所述至少一個處理器實現如權利要求1-5任一項所述一種類案推薦方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州恒巨信息科技有限公司,未經廣州恒巨信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811591283.6/1.html,轉載請聲明來源鉆瓜專利網。





