[發(fā)明專利]一種基于逆向最優(yōu)運輸模型的可解釋司法案例匹配方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202210448566.5 | 申請日: | 2022-04-27 |
| 公開(公告)號: | CN114818648A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計)人: | 徐君;俞蔚捷;孫忠祥;董振華;陳旭;許洪騰;文繼榮 | 申請(專利權(quán))人: | 中國人民大學 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F40/274;G06F40/30;G06F40/117;G06N3/08 |
| 代理公司: | 北京中創(chuàng)陽光知識產(chǎn)權(quán)代理有限責任公司 11003 | 代理人: | 尹振啟 |
| 地址: | 100872 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 逆向 最優(yōu) 運輸 模型 可解釋 司法 案例 匹配 方法 系統(tǒng) | ||
本發(fā)明實現(xiàn)了一種基于逆向最優(yōu)運輸模型的可解釋司法案例匹配方法。方法由三個模塊構(gòu)成:司法要素提取模塊針對輸入的案例對,以兩個案例、案例中每個句子司法要素標簽和人工標注的句子對齊標簽作為模塊輸入,輸出案例中所有句子的司法要素標簽預測;候選解釋生成模塊以所述司法要素提取模塊提取的兩個案例的司法要素作為輸入,以模型預測的候選解釋作為輸出;匹配模塊以司法要素提取模塊預測的結(jié)果以及所述候選解釋生成模塊生成的候選解釋作為輸入,輸出案例匹配與否的預測已經(jīng)與該預測對應的候選解釋作為最終解釋。該方法實現(xiàn)了預測提供兩個方面的解釋并提升模型預測的準確率的技術(shù)效果。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種基于逆向最優(yōu)運輸模型的可解釋司法案例匹配方法。
背景技術(shù)
現(xiàn)有的司法案例匹配模型主要可以分為三類:基于專家知識的模型;基于引用網(wǎng)絡的模型;基于文本語義的模型。
基于專家知識的模型是傳統(tǒng)的案例匹配方法,該方法高度依賴模型設(shè)計者在司法領(lǐng)域的先驗知識。例如,[1]提出在事故賠償領(lǐng)域,一個案例可被拆解成若干要素,諸如支持索賠人、支持應訴人和中立因素等,一個案例可表示成這些要素的集合。于是,案例的匹配可以視為要素之間的匹配。
基于引用網(wǎng)絡的模型多應用于英美法系國家,這類模型構(gòu)建了一個先例引用網(wǎng)絡(Precedent Citation Network),其中網(wǎng)絡中的節(jié)點是法律案例,有向邊表示源案例被目標案例引用的情況,即目標案例所使用的源案例的引用。[2]提出使用先例引用集之間的Jaccard相似度指數(shù)來推斷兩個法律案件的相似性。
基于文本語義的模型聚焦案例文本的內(nèi)容,使用案例之間語義相似性來度量其匹配程度。得益于深度神經(jīng)網(wǎng)絡的蓬勃發(fā)展,基于文本語義的模型取得了超越前兩類模型的性能表現(xiàn)。例如,[3]提出講司法案例切分成多個段落,使用大規(guī)模預訓練語言模型編碼每個文本段落,再使用最大池化和循環(huán)神經(jīng)網(wǎng)絡建模兩個案例中每個段落對的語義相似性,最后使用注意力機制輸出案例正例的匹配得分。
現(xiàn)有的基于三元組深度哈希學習的相似司法案例匹配方法是通過獲取待匹配的司法案例文書,將待匹配的司法案例文書輸入到預訓練的特征提取模型中,得到待匹配司法案例文書的特征表示向量,之后將待匹配司法案例文書的特征表示向量,同時輸入到預訓練的三元組深度哈希學習模型中,得到待匹配司法案例文書的哈希碼,最后基于待匹配司法案例文書的哈希碼與已知司法案例文書的哈希碼,計算司法案例文書的相似度的。
現(xiàn)有的案例匹配模型在匹配精度上取得了較為優(yōu)異的表現(xiàn),但是這些模型難以為其匹配預測提供解釋。造成這一現(xiàn)象的原因有三:其一,司法案例文檔內(nèi)容復雜,其中僅有部分反映司法要素的句子與匹配結(jié)果和匹配解釋相關(guān),現(xiàn)有模型并沒有在句子層面區(qū)分司法要素和噪聲;其二,案例中的司法要素可以分成支持匹配、支持不匹配兩類,模型最終預測的解釋應當權(quán)衡這兩類司法要素,而現(xiàn)有模型并沒有做出區(qū)分;其三,司法案例文檔篇幅冗長,關(guān)于司法要素的標注存在稀疏、有偏等問題,直接擬合法要素的標簽學習的模型容易陷入局部最優(yōu),限制模型的泛化性。
發(fā)明內(nèi)容
為此,本發(fā)明首先提出一種基于逆向最優(yōu)運輸模型的可解釋司法案例匹配方法,由三個模塊構(gòu)成:
司法要素提取模塊針對輸入的案例對,以兩個案例(X,Y)、案例中每個句子司法要素標簽rX,rY和人工標注的句子對齊標簽作為模塊輸入,采用逆向最優(yōu)運輸過程,模型根據(jù)學習案例句子之間的“運輸代價”,輸出案例中所有句子的司法要素標簽預測其中分別表示案例X和Y中匹配的司法要素和不匹配的司法要素,
候選解釋生成模塊以所述司法要素提取模塊提取的兩個案例的司法要素作為輸入,以模型預測的候選解釋作為輸出,其中i表示候選解釋的數(shù)量,候選解釋生成模塊輸出分別作為標簽0的解釋和標簽1的解釋;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民大學,未經(jīng)中國人民大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210448566.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





