[發明專利]一種基于逆向最優運輸模型的可解釋司法案例匹配方法及系統在審
| 申請號: | 202210448566.5 | 申請日: | 2022-04-27 |
| 公開(公告)號: | CN114818648A | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 徐君;俞蔚捷;孫忠祥;董振華;陳旭;許洪騰;文繼榮 | 申請(專利權)人: | 中國人民大學 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F40/274;G06F40/30;G06F40/117;G06N3/08 |
| 代理公司: | 北京中創陽光知識產權代理有限責任公司 11003 | 代理人: | 尹振啟 |
| 地址: | 100872 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 逆向 最優 運輸 模型 可解釋 司法 案例 匹配 方法 系統 | ||
1.一種基于逆向最優運輸模型的可解釋司法案例匹配方法,其特征在于:由三個模塊構成:
司法要素提取模塊針對輸入的案例對,以兩個案例(X,Y)、案例中每個句子司法要素標簽rX,rY和人工標注的句子對齊標簽作為模塊輸入,采用逆向最優運輸過程,模型根據學習案例句子之間的“運輸代價”,輸出案例中所有句子的司法要素標簽預測其中分別表示案例X和Y中匹配的司法要素和不匹配的司法要素,
候選解釋生成模塊以所述司法要素提取模塊提取的兩個案例的司法要素作為輸入,以模型預測的候選解釋作為輸出,其中i表示候選解釋的數量,候選解釋生成模塊輸出分別作為標簽0的解釋和標簽1的解釋;
匹配模塊以所述司法要素提取模塊預測的以及所述候選解釋生成模塊生成的候選解釋作為輸入,將視為查詢,候選解釋作為文檔,分別計算與匹配得分,輸出得分較高的解釋以及該解釋對應的匹配標簽,若的得分較高,模型輸出結果為兩個案例匹配,以及作為案例匹配理由的候選解釋若的得分較高,模型輸出結果為兩個案例不匹配,以及作為案例不匹配理由的候選理由即為輸出案例匹配與否的預測以及與該預測對應的候選解釋作為最終解釋。
2.如權利要求1所述的一種基于逆向最優運輸模型的可解釋司法案例匹配方法,其特征在于:所述最優運輸過程首先對于司法案例匹配的場景中,對于任意兩個案例μ、ν分別視為一個均勻分布,即其中1D表示D維全1的向量,兩個案例之間的最優運輸方案為:
其中表示任意聯合分布,其中的句子滿足邊緣分布為μ和ν;為代價矩陣,c(xm,yn)表示兩個句子之間的差異;
之后,采用逆向最優運輸試圖從中學習魯棒性更強的代價矩陣C:給定最優運輸方案,即人工標注,求解代價矩陣,即案例中句子的差異情況:
s.t.A*(C)=argminAEn(μ,v)<A,C>+γ<A,logA>其中KL表示句子對齊標簽和運輸方案A*之間的KL散度,最終建模C為兩個子矩陣的線性組合:
C=Cs+∈Cr
其中Cs是兩個案例句子級別的語義相似度矩陣,使用神經網絡計算句子向量相似度;Cr是兩個案例句子級別的要素相似度矩陣,使用神經網絡對案例中的句子進行分類,區分司法要素和非司法要素,再比較兩個句子是否屬于同類司法要素;∈是平衡系數;
在訓練過程中,司法要素提取模塊學習代價矩陣C中的參數;在測試過程,司法要素提取模塊根據C進行正向最優運輸,根據最優運輸方案確定案例中句子的對齊情況,并提取司法要素標簽預測
3.如權利要求2所述的一種基于逆向最優運輸模型的可解釋司法案例匹配方法,其特征在于:所述司法要素提取模塊,作為最小化模型預測的和人工標注的句子級別對齊程度之間的損失以及在構建Cr時模型對每個句子司法要素分類預測和人工標注之間的損失的損失函數可以寫成:
其中,是模型在構建代價矩陣C時預測案例中每個句子司法要素標簽與真實標簽之間的交叉熵損失:
其中δ(r,k)=1如果r=k否則為0;是模型逆向最優運輸損失,優化代價矩陣C和對應的最優運輸方案矩陣:
4.如權利要求3所述的一種基于逆向最優運輸模型的可解釋司法案例匹配方法,其特征在于:所述候選解釋生成模塊最小化模型生成的和人工標注的自然語言解釋之間的差異,損失函數是微調預訓練語言模型的損失:
5.如權利要求4所述的一種基于逆向最優運輸模型的可解釋司法案例匹配方法,其特征在于:所述匹配模塊最小化模型預測的和人工標注的案例匹配標簽之間的差異損失函數可以寫成:
其中是模型對于案例匹配關系的預測與真實標簽之間的交叉熵損失:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民大學,未經中國人民大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210448566.5/1.html,轉載請聲明來源鉆瓜專利網。





