[發(fā)明專利]一種基于法律知識(shí)圖譜的裁判文書相似性判斷方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202010004494.6 | 申請(qǐng)日: | 2020-01-03 |
| 公開(公告)號(hào): | CN110795926B | 公開(公告)日: | 2020-04-07 |
| 發(fā)明(設(shè)計(jì))人: | 翁洋;王竹;李鑫;其他發(fā)明人請(qǐng)求不公開姓名 | 申請(qǐng)(專利權(quán))人: | 四川大學(xué);成都星云律例科技有限責(zé)任公司 |
| 主分類號(hào): | G06F40/194 | 分類號(hào): | G06F40/194;G06F16/36 |
| 代理公司: | 成都行之專利代理事務(wù)所(普通合伙) 51220 | 代理人: | 熊曦 |
| 地址: | 610000 四川*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 法律知識(shí) 圖譜 裁判 文書 相似性 判斷 方法 系統(tǒng) | ||
1.一種基于法律知識(shí)圖譜的裁判文書相似性判斷方法,其特征在于,所述方法包括:
步驟1:獲得裁判文書A和裁判文書B;
步驟2:分別構(gòu)建裁判文書A的案由對(duì)應(yīng)的法律知識(shí)圖譜A'和裁判文書B的案由對(duì)應(yīng)的法律知識(shí)圖譜B';
步驟3:分別將法律知識(shí)圖譜A'轉(zhuǎn)換為向量A'',將法律知識(shí)圖譜B'轉(zhuǎn)換為向量B'',
步驟4:比較向量A''和向量B'',得到裁判文書A和裁判文書B的相似性判斷結(jié)果;
所述步驟2還包括:采集樣本數(shù)據(jù),樣本數(shù)據(jù)包括若干個(gè)裁判文書,將樣本數(shù)據(jù)中所有裁判文書對(duì)應(yīng)的法律知識(shí)圖譜中的三元組均進(jìn)行泛化,將案由的人物角色定義為原告、被告和第三方;
統(tǒng)計(jì)樣本數(shù)據(jù)中所有的實(shí)體個(gè)數(shù)與關(guān)系個(gè)數(shù),并將統(tǒng)計(jì)個(gè)數(shù)列入新建的實(shí)體字典和關(guān)系字典,id編號(hào)以0為開頭,實(shí)際個(gè)數(shù)為結(jié)尾;實(shí)體字典和關(guān)系字典格式均為兩列,以id編號(hào)一一對(duì)應(yīng)實(shí)體或關(guān)系進(jìn)行存儲(chǔ),分別建立第一數(shù)據(jù)集和第二數(shù)據(jù)集;
將法律知識(shí)圖譜中的三元組(h、r、t)用第一數(shù)據(jù)集和第二數(shù)據(jù)集中的編號(hào)一一替換,并以(h、t、r)結(jié)構(gòu)保存至第三數(shù)據(jù)集;
將第三數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測試集;
利用訓(xùn)練集訓(xùn)練知識(shí)嵌入算法,利用驗(yàn)證集驗(yàn)證知識(shí)嵌入算法,利用測試集測試知識(shí)嵌入算法。
2.根據(jù)權(quán)利要求1所述的一種基于法律知識(shí)圖譜的裁判文書相似性判斷方法,其特征在于,所述步驟3采用知識(shí)嵌入算法將法律知識(shí)圖譜代表的三元組用向量表示。
3.根據(jù)權(quán)利要求2所述的一種基于法律知識(shí)圖譜的裁判文書相似性判斷方法,其特征在于,知識(shí)嵌入算法包括:TransE算法、TransH算法、TransR算法、TransG算法、DistMult算法和HoLE算法。
4.根據(jù)權(quán)利要求1所述的一種基于法律知識(shí)圖譜的裁判文書相似性判斷方法,其特征在于,所述步驟3還包括利用訓(xùn)練集訓(xùn)練知識(shí)嵌入算法,利用驗(yàn)證集驗(yàn)證知識(shí)嵌入算法,利用測試集測試知識(shí)嵌入算法。
5.根據(jù)權(quán)利要求4所述的一種基于法律知識(shí)圖譜的裁判文書相似性判斷方法,其特征在于,法律知識(shí)圖譜包括若干組三元組(h、r、t),h代表頭實(shí)體,r代表關(guān)系,t代表尾實(shí)體。
6.根據(jù)權(quán)利要求1所述的一種基于法律知識(shí)圖譜的裁判文書相似性判斷方法,其特征在于,基于通過測試的知識(shí)嵌入算法,通過設(shè)置相關(guān)維度參數(shù),得到樣本數(shù)據(jù)中每個(gè)實(shí)體和關(guān)系的向量表示。
7.根據(jù)權(quán)利要求6所述的一種基于法律知識(shí)圖譜的裁判文書相似性判斷方法,其特征在于,將每篇裁判文書的法律知識(shí)圖譜中的每個(gè)三元組中的實(shí)體和關(guān)系均采用通過測試的知識(shí)嵌入算法轉(zhuǎn)換為相應(yīng)的向量并求平均值,得到裁判文書的法律知識(shí)圖譜的多維向量表示。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川大學(xué);成都星云律例科技有限責(zé)任公司,未經(jīng)四川大學(xué);成都星云律例科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010004494.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 多媒體法律知識(shí)庫交易平臺(tái)系統(tǒng)和方法
- 法律知識(shí)的檢索方法及裝置
- 一種基于機(jī)器學(xué)習(xí)的法律知識(shí)圖譜構(gòu)建方法、裝置、系統(tǒng)和介質(zhì)
- 一種基于強(qiáng)化學(xué)習(xí)的法律認(rèn)知方法、裝置和介質(zhì)
- 數(shù)據(jù)處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 基于知識(shí)圖譜的法條檢索方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì)
- 一種在線法律咨詢自動(dòng)回復(fù)的生成方法與設(shè)備
- 一種基于法律知識(shí)圖譜的裁判文書相似性判斷方法及系統(tǒng)
- 基于知識(shí)圖譜的法律推薦方法、裝置和電子設(shè)備
- 一種法律知識(shí)圖譜構(gòu)建系統(tǒng)及方法
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識(shí)圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識(shí)圖譜的構(gòu)建方法、裝置、知識(shí)圖譜系統(tǒng)及設(shè)備
- 一種基于知識(shí)圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于創(chuàng)建知識(shí)圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法





