[發明專利]類案語義檢索方法、系統、電子設備及存儲介質在審
| 申請號: | 202211706981.2 | 申請日: | 2022-12-29 |
| 公開(公告)號: | CN116361414A | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 劉皓哲;張翔;左俊杰;劉皙 | 申請(專利權)人: | 思創數碼科技股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/335;G06F18/22;G06F18/214;G06F40/30;G06F40/295;G06F40/216;G06N3/0455;G06N3/047;G06N3/08;G06Q50/18 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 何世磊 |
| 地址: | 330000 江西*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 案語 檢索 方法 系統 電子設備 存儲 介質 | ||
本發明提供了一種類案語義檢索方法、系統、電子設備及存儲介質,屬于數據處理的技術領域。所述方法包括:構造多表示語義相似度模型;構建案件命名實體識別模型以抽取待檢索案件的關鍵信息;根據待檢索案件的案由類型選取目標預檢索策略,并將案件要素輸入所目標預檢索策略,以使從案件庫中篩選出候選案例集;將案件事實及候選案例集通過多表示語義相似度模型進行語義表示,得到相似度得分Top?K的K個相似案例;根據K個相似案例與預設閾值的比對結果以使從K個相似案例中推送出目標相似案例。通過本申請,可以提升類案檢索的匹配度實現推送案例準確度的提高,解決現有司法領域檢索方式過于簡單存在推送案例不精確及推送數量過多的問題。
技術領域
本發明屬于數據處理的技術領域,具體地涉及一種類案語義檢索方法、系統、電子設備及存儲介質。
背景技術
在案件審理過程中,法官為更加準確高效的對當前案件進行裁決處理,會期望檢索了解以往相關案件的案件處理情況,如法院的裁決意見傾向。或者在案件審判后監察過程中,監察官為防止出現“同案不同判”,也期望檢索了解以往相關案例的案件處理情況,并進行比對監察。然而,傳統方式僅支持用戶基于規定的案由和罪名進行文書索引,并籠統的將每個相關案件的裁決文書反饋給用戶;這種方式需要人工逐個翻查裁決文書,難以快速了解相關案件的案件處理情況,使得裁決信息檢索分析效率降低。隨著人工智能理論和技術日益成熟,通過人工智能技術實現類案檢索已成為貼近法官需求的一項重要需求,諸如智慧法庭概念的出現,促進人工智能在證據收集、案例分析、法律文件閱讀與分析中的應用,實現法院審判體系和審判能力智能化。
類案檢索作為一種輔助工具,目的為法官手頭正在處理的案件尋找相似甚至相同的案件,使相同或相似案件的判決結果能夠有較小偏差;或者目的為監察官尋找相同或類似案件,使得監察相同或相似案件的判決結果是否存在“同案不同判”的情況。法律案件記錄雖多為電子文書,但與普通文本相比,法律案例文本具有其特殊性,其文本涉及法律專業的很多用語。現有技術的文本語義相似度計算方法若簡單引入到法律案例文本語義相似度算法中,往往存在推送案例不精確,并未做到“同案”,甚至不是“同類”;以及推送案件數量過高仍需人工篩選,并未真正節約法官及監察官時間,導致無法切實解決法官及監察官所需。
因此,如何提升類案檢索的匹配度以提高推送案例的準確度,顯得尤為重要。
發明內容
為了解決上述技術問題,本發明提供了一種類案語義檢索方法、系統、電子設備及存儲介質,可以提升類案檢索的匹配度,達到提高推送案例的準確度的目的。
第一方面,本發明提供一種類案語義檢索方法,包括:
構造多表示語義相似度模型;
構建案件命名實體識別模型以抽取待檢索案件的關鍵信息,其中,所述關鍵信息包括案件要素及案件事實;
根據所述待檢索案件的案由類型選取目標預檢索策略,并將所述案件要素輸入所述目標預檢索策略,以使從案件庫中篩選出候選案例集;
將所述案件事實及所述候選案例集通過所述多表示語義相似度模型進行語義表示,得到相似度得分Top?K的K個相似案例;
根據所述K個相似案例與預設閾值的比對結果以使從所述K個相似案例中推送出目標相似案例。
較佳地,所述構造多表示語義相似度模型的步驟具體包括:
采用句子對的對比與句子間對比兩種學習任務構造多任務融合網絡模型;
通過文本增廣方式及人工標注方式生成監督數據,其中,所述文本增廣方式包括隨機拋棄、引入噪聲、相似詞替換;
將所述監督數據采用大規模數據自監督訓練及小規模數據監督微調的協同監督學習方法訓練所述多任務融合網絡模型,損失函數采用對比學習損失,負例的選取為批次內負樣本,并通過余弦相似度算法計算每一批次內訓練數據的相似度以過濾簡單樣本,得到多表示語義相似度模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思創數碼科技股份有限公司,未經思創數碼科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211706981.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:車輛前照燈模塊
- 下一篇:瞬態光譜ns量級脈沖光延時同步控制觸發系統





