[發明專利]一種基于法律知識圖譜的裁判文書相似性判斷方法及系統有效
| 申請號: | 202010004494.6 | 申請日: | 2020-01-03 |
| 公開(公告)號: | CN110795926B | 公開(公告)日: | 2020-04-07 |
| 發明(設計)人: | 翁洋;王竹;李鑫;其他發明人請求不公開姓名 | 申請(專利權)人: | 四川大學;成都星云律例科技有限責任公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F16/36 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 熊曦 |
| 地址: | 610000 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 法律知識 圖譜 裁判 文書 相似性 判斷 方法 系統 | ||
本發明公開了一種基于法律知識圖譜的裁判文書相似性判斷方法及系統,所述方法包括:獲得裁判文書A和裁判文書B;分別構建裁判文書A的案由對應的法律知識圖譜A'和裁判文書B的案由對應的法律知識圖譜B';分別將法律知識圖譜A'轉換為向量A'',將法律知識圖譜B'轉換為向量B'';比較向量A''和向量B'',得到裁判文書A和裁判文書B之間的相似性判斷結果;本發明方法和系統通過知識嵌入算法將原有的法律知識圖譜由不易計算的圖狀結構轉換為數學向量表示,支撐裁判文書基于語義相似性的兩兩對比,便于更加準確和高效地判斷裁判文書之間相似性。
技術領域
本發明涉及自然語言處理領域,具體地,涉及一種基于法律知識圖譜的裁判文書相似性判斷方法及系統。
背景技術
近年來,知識圖譜應用是大數據時代的一個標志。知識圖譜本質上是語義網絡,是一種基于圖的數據結構,由節點(Point)和邊(Edge)組成。知識圖譜的每個節點表示現實世界中存在的“實體”,每條邊為實體與實體之間的“關系”。知識圖譜是關系的最有效表示方式。知識圖譜的核心要點在于通過搜集一系列大數量級的結構化數據或非結構化數據,基于領域專業性知識對數據進行分析建模,并通過機器計算從中找出規律——通常是該領域的規律,最后機器可以識別該規律并學習,生成相關數據的計算規則。
目前構建知識圖譜的方法有很多,通常是以爬蟲爬取、日志搜索(query log)或基于Bootstrapping的多類別協同模式學習等方式構建,這類方法當前主要應用于優化現有的搜索引擎。全世界的所有數據,高達80%是非結構化數據,而大多數現有技術無法識別和分析這些數據。
在法律領域,裁判文書為非結構化數據,現有技術無法直接通過裁判文書對應的法律知識圖譜來判斷裁判文書之間的相似性。
發明內容
現有技術無法將TransE、TransH、TransR、TransG、DistMult、HoLE等知識嵌入方法應用于司法人工智能知識圖譜,本發明方法和系統通過知識嵌入辦法可以將原有的法律知識圖譜由不易計算的圖狀結構轉換為數學向量表示,支撐裁判文書間基于語義相似性的兩兩對比,便于更加準確和高效地判斷裁判文書之間的相似性。
為實現上述發明目的,本發明一方面提供了一種基于法律知識圖譜的裁判文書相似性判斷方法,所述方法包括:
步驟1:獲得裁判文書A和裁判文書B;
步驟2:分別構建裁判文書A的案由對應的法律知識圖譜A'和裁判文書B的案由對應的法律知識圖譜B';
步驟3:分別將法律知識圖譜A'轉換為向量A'',將法律知識圖譜B'轉換為向量B'',
步驟4:計算向量A''和向量B''的余弦相似度,得到裁判文書A和裁判文書B的相似性判斷結果。
其中,從整體上看,本發明的技術方案為:首先構建了基于案情事實的法律知識圖譜,然后采用知識嵌入方法(TransE、TransH、TransR、TransG、DistMult、HoLE等)將法律知識圖譜代表的三元組(實體1、關系、實體2)用向量表示,并計算得到每篇裁判文書基于案情事實的法律知識圖譜的向量表示,支撐裁判文書兩兩相似性對比,以解決裁判文書間基于語義相似性的對比問題。
其中,在本發明中,構建裁判文書的案由對應的法律知識圖譜可以有多種方式,目前構建知識圖譜的方法有很多,通常是以爬蟲爬取、日志搜索(query log)或基于Bootstrapping的多類別協同模式學習等方式構建,也可以采用公開專利文獻CN201710339258.8 中的方式進行構建。
優選的,所述步驟3采用知識嵌入算法將法律知識圖譜代表的三元組用向量表示。
優選的,知識嵌入算法包括但不限于:TransE算法、TransH算法、TransR算法、TransG算法、DistMult算法和HoLE算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學;成都星云律例科技有限責任公司,未經四川大學;成都星云律例科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010004494.6/2.html,轉載請聲明來源鉆瓜專利網。





