[發明專利]一種基于多頭注意力的法律案例相似度計算方法及系統有效
| 申請號: | 202010733019.2 | 申請日: | 2020-07-27 |
| 公開(公告)號: | CN111858940B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 程戈;張冬良;肖冬梅 | 申請(專利權)人: | 湘潭大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/36;G06F40/295;G06Q50/18 |
| 代理公司: | 北京卓恒知識產權代理事務所(特殊普通合伙) 11394 | 代理人: | 徐樓 |
| 地址: | 411105 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多頭 注意力 法律 案例 相似 計算方法 系統 | ||
1.一種基于多頭注意力的法律案例相似度計算方法,其特征在于,該方法包括:
1)?將待計算相似度的兩個案例的案情描述輸入案例法律關系識別模型,分別抽取兩個案例中的法律關系形成的三元組,所述三元組中包含頭實體、關系和尾實體,并依據所述三元組構建案情知識圖譜;所述案例法律關系識別模型的構建方法包括以下步驟:
1a)?確定對計算案例相似度具有影響或影響較大的實體和關系,構建案例法律關系識別模型訓練數據集;
1b)?構建所述實體識別模塊,所述實體識別模塊采用基于BiLSTM-CRF的實體識別網絡構建;
1c)?構建所述關系抽取模塊,所述關系抽取模塊采用基于BERT的關系抽取網絡構建;
2)?通過多頭注意力機制將所述案情知識圖譜轉化為向量化表示,包括以下步驟:
2a)?初始化所述三元組的頭實體、關系和尾實體的向量化表示;
2b)?將所述三元組的實體和關系的向量化表示聯結起來,使用投影矩陣計算所述三元組的特征向量;
2c)?使用leakyReLU計算所述三元組的注意力值;
2d)?使用softmax函數計算出具有相同頭實體的三元組的相對注意力值;
2e)?通過所述三元組的相對注意力值和所述特征向量計算所述實體新的向量化表示;
2f)?使用多頭注意力機制封裝復雜的法律關系并再次更新所述實體的向量化表示;
3)將所述案情的向量化表示輸入深度案情感知模型,獲取兩個案例的相似度;所述深度案情感知模型為已訓練好的模型,所述深度案情感知模型構建方法具體為:
3a)?獲取一定量的基于某案由案例的相似案例對,所述相似案例對為正例,隨機替換部分相似案例對中的一個案例形成負例,構建相似案例數據集;
3b)?分別將所述相似案例數據集中的案例對輸入所述案例法律關系識別模型,分別構建案情知識圖譜,并使用所述多頭注意力機制分別獲得每個案例的案情知識圖譜的向量化表示;
3c)?分別將所述相似案例對的實體和關系的向量化表示聯結起來,構建深度案情感知網絡,使用所述案例的向量化表示訓練所述網絡得到所述深度案情感知模型。
2.根據權利要求1所述的基于多頭注意力的法律案例相似度計算方法,其特征在于,所述案例法律關系識別模型包括:用于識別所述案情描述中實體的實體識別模塊和用于識別所述案情描述中所述實體之間關系的關系抽取模塊;在對結構化文本和類結構化文本的所述案情描述進行識別時,所述實體識別模塊采用基于規則的實體識別方式識別出實體。
3.根據權利要求1或2所述的基于多頭注意力的法律案例相似度計算方法,其特征在于,所述案情描述,包括存在于起訴書、上訴書、判決文書中的案情描述和記載了案例案情信息的非正式法律文本中的案情描述。
4.一種應用權利要求1-3中任一項所述基于多頭注意力的法律案例相似度計算方法的基于多頭注意力的法律案例相似度計算系統,其特征在于,該系統包括:
案情知識圖譜構建模塊,所述案情知識圖譜構建模塊用于將待計算相似度的兩個案例的案情描述輸入所述案例法律關系識別模型,進而分別抽取兩個案例中的法律關系形成的三元組,并依據所述三元組構建案情知識圖譜,所述三元組中包含頭實體、關系和尾實體;
與所述案情知識圖譜構建模塊信號連接的案情知識圖譜表征模塊,所述案情知識圖譜表征模塊用于通過多頭注意力機制將所述案情知識圖譜轉化為向量化表示;
與所述案情知識圖譜表征模塊信號連接的深度案情感知網絡模塊,所述深度案情感知網絡模塊用于將所述向量化表示輸入所述深度案情感知模型,得到兩個案例的相似度。
5.根據權利要求4所述的基于多頭注意力的法律案例相似度計算系統,其特征在于,所述案例法律關系識別模型包括:
用于識別所述案情描述中實體的實體識別模塊;
與所述實體識別模塊信號連接,用于識別所述實體之間關系的關系抽取模塊;
所述關系抽取模塊通過找到包含兩個所述實體的句子,從所述句子中抽取出兩個所述實體之間的關系,兩個所述實體包括頭實體、尾實體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湘潭大學,未經湘潭大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010733019.2/1.html,轉載請聲明來源鉆瓜專利網。





