[發明專利]一種基于案情三元組信息的類案檢索方法及系統有效
| 申請號: | 202010548781.3 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111459973B | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 王竹;李鑫;翁洋;其他發明人請求不公開姓名 | 申請(專利權)人: | 四川大學;成都數之聯科技有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06F16/2455;G06Q50/18 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 張超 |
| 地址: | 610000 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 案情 三元 信息 檢索 方法 系統 | ||
本發明公開了一種基于案情三元組信息的類案檢索方法及系統:標注案情樣本庫中的案情樣本得到標注樣本庫;將標注樣本庫輸入模型進行訓練得到三元組集合,三元組集合中的三元組包括案情實體和案情實體對應的要素;設置抽取案情的三元組評分模型;類案檢索時,將待檢索的案件的信息輸入訓練后的模型得到對應三元組集合;利用三元組評分模型對案情數據庫中案情的三元組集合評分,將評分最高的一個或多個三元組集合對應的案情作為類案檢索結果。本發明一種基于案情三元組信息的類案檢索方法及系統,利用法律領域預訓練語言模型和排序算法構造類案檢索關鍵衡量標準,從法律專業的角度實現類案精準檢索。
技術領域
本發明涉及自然語言處理技術,具體涉及一種基于案情三元組信息的類案檢索方法及系統。
背景技術
目前類案檢索主要使用的是關鍵字技術和tf-idf技術。由于案情事實部分篇幅較長,當前技術是篇章級別的(數個句子構成)段落語義匹配,并非是句子級別的語義匹配;同時同一個實體種類、同一個案情爭議點的描述方式多樣。基于以上原因現有方法不能提取出案情的有效信息,類案檢索的準確率和召回率都不理想。
發明內容
本發明所要解決的技術問題是現有技術中的類案檢索準確率和召回率都不理想,目的在于提供一種基于案情三元組信息的類案檢索方法及系統,解決上述問題。
本發明通過下述技術方案實現:
一種基于案情三元組信息的類案檢索方法,包括以下步驟:
S1:從案情數據庫中選出案情樣本得到案情樣本庫,標注案情樣本庫中的案情樣本得到標注樣本庫,標注的內容包括案情實體和案情實體對應的要素;
S2:將標注樣本庫輸入模型進行訓練,得到案情實體識別模型和案情要素識別模型;
S3:利用案情實體識別模型識別案情數據庫中案情的案情實體;利用案情要素識別模型識別案情數據庫中案情的要素;根據案情數據庫中案情的案情實體和案情實體對應的要素得到每一篇案情的三元組集合;三元組集合中三元組的元素包括案情實體和案情實體對應的要素;
S4:存儲案情數據庫中的案情和案情對應三元組集合,并設置抽取案情的三元組評分模型;
S5:類案檢索時,將待檢索案情輸入訓練后的模型得到待檢索案情的三元組集合;利用三元組評分模型對案情數據庫中案情的三元組集合和待檢索案情的三元組集合的匹配程度評分;將案情數據庫中評分符合預設要求的三元組集合對應的案情作為類案檢索結果。
本發明應用時,首先標注樣本,標注后的樣本用于訓練模型,標注的主要內容包括案情實體和要素,其中要素對應于案情實體。本發明中的案情實體是指法律案情中的實體,比如被告,婚生子女,財產等;要素是指影響結果的要素。將這些數據對應起來有利于后續模型的學習訓練。通過學習這些數據,可以得到三元組集合,這個三元組集合是類案檢索的依據。同時三元組集合還對應有評分模型,用于優選三元組集合。類案檢索時,通過同樣的操作提取待檢索的案情的信息,并經過相同的規則處理得到待檢索案情三元組集合,將其與案情數據庫中的三元組集合比對實現類案檢索。
進一步的,三元組集合中的三元組均設置有權重值;
根據三元組代表的要素在案情樣本中的重要程度設置三元組的權重值。
進一步的,根據權重值設置三元組評分模型。
進一步的,模型采用正則和條件隨機場抽取實體;采用法律領域的預訓練模型和排序算法實現多標簽分類;三元組要素由基于特定規則的實體和多標簽組合得到。
本發明應用時,特定規則是指實體和標簽是匹配對應關系,例如:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學;成都數之聯科技有限公司,未經四川大學;成都數之聯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010548781.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:攝像光學鏡頭
- 下一篇:基于海鷹翼輝操作系統的安全編譯方法及裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





