[發(fā)明專利]基于鍵值記憶網(wǎng)絡的案件案由分類方法及介質有效
| 申請?zhí)枺?/td> | 202010413889.1 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111651594B | 公開(公告)日: | 2023-06-09 |
| 發(fā)明(設計)人: | 黃璇璇;程威宇;沈艷艷 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/126;G06F40/279;G06Q50/18;G06N3/04 |
| 代理公司: | 上海漢聲知識產(chǎn)權代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 鍵值 記憶 網(wǎng)絡 案件 案由 分類 方法 介質 | ||
1.一種基于鍵值記憶網(wǎng)絡的案件案由分類方法,其特征在于,包括如下步驟:
數(shù)據(jù)預處理步驟:從司法文書中提取案情描述文本信息和文書引用的法律條文信息;
模型構建步驟:建立基于鍵值記憶網(wǎng)絡的案件案由分類模型,包括對引用法條的建模、案件案情描述文本的建模和對鍵值記憶增強神經(jīng)網(wǎng)絡的建模;
模型訓練步驟:通過訓練數(shù)據(jù)對建立的案由分類模型進行優(yōu)化,得到最優(yōu)參數(shù);
模型預測步驟:輸入測試數(shù)據(jù)集的案件案情描述文本,模型預測案件對應的案由類別;
所述模型構建步驟具體包括:
對引用法條表示向量的建模;
對案情描述文本表示向量的建模;
對鍵值記憶增強神經(jīng)網(wǎng)絡的建模;
所述對鍵值記憶增強神經(jīng)網(wǎng)絡的建模,具體包括:
每個案件的引用法條表示向量用來控制對案情描述記憶模塊的讀寫操作,訓練數(shù)據(jù)集中每個案件的引用法條表示向量與鍵記憶模塊計算相似度,得到這個案件的引用法條表示向量與每個案由相關的法條表示向量的相關性權重,法條上越相關,案件的案情描述就越相關,這個相關性權重去指導該案件案情描述文本的寫入和讀出,所述相關性權重既是讀權重也是寫權重;
鍵值記憶增強神經(jīng)網(wǎng)絡同時輸入案件案情描述文本表示向量,根據(jù)寫權重將這個案情描述文本表示向量寫入具體的案情描述記憶模塊的卡槽中,更新案情描述記憶模塊;
根據(jù)讀權重讀出案情描述記憶模塊中的向量表示,得到一個基于法條表示記憶增強的案情描述文本的表示向量;
獲得的基于法條表示記憶增強的案情描述文本的表示向量和原本編碼器得到的文本表示向量進行串聯(lián),輸入進一個案件案由分類器;
原本編碼器得到的文本表示向量指:使用特定神經(jīng)網(wǎng)絡模型作為編碼器獲得的案情描述文本表示向量;
案件案由分類器由一個softmax全連接網(wǎng)絡構成,最后得到特定案件在不同案由上的概率分布。
2.如權利要求1所述的基于鍵值記憶網(wǎng)絡的案件案由分類方法,其特征在于,所述從司法文書中提取案情描述文本信息和文書引用的法律條文信息包括:
司法文書中包含對案件案情的描述和法院機構判定案件引用的法條;
所述法條與案由具有數(shù)據(jù)相關性,相同案由的案件引用相同或相關的法條,法條是判定案件性質的依據(jù),也是案由分類的依據(jù);將文書中引用的法條使用正則表達式從文書中提取出來得到引用的所有法條的編號,以及從文書文本中按照規(guī)則提取案情描述文本段落得到案情描述文本信息,對文本進行分詞,用詞向量表示。
3.如權利要求1所述的基于鍵值記憶網(wǎng)絡的案件案由分類方法,其特征在于,對引用法條表示向量的建模,具體包括:
將文書引用的所有法條編號使用獨熱編碼進行編碼,法條編碼乘以隨機初始化的參數(shù)矩陣,得到引用法條表示向量。
4.如權利要求1所述的基于鍵值記憶網(wǎng)絡的案件案由分類方法,其特征在于,所述對案情描述文本表示向量建模,具體包括:
使用特定神經(jīng)網(wǎng)絡模型作為編碼器獲得案情描述文本表示向量,作為鍵值記憶增強神經(jīng)網(wǎng)絡輸入;
鍵記憶模塊隨機初始化,訓練得出不同案由的案件案情對應的法條表達,即法條在案由層面上的表示向量,法條相關的案情描述的鍵;
對應不同法條的案件案情描述文本表示向量通過寫操作寫入案情描述記憶模塊。
5.如權利要求1所述基于鍵值記憶網(wǎng)絡的案件案由分類方法,其特征在于,所述根據(jù)寫權重將這個案情描述文本表示向量寫入案情描述記憶模塊中,更新案情描述記憶模塊,具體包括:
寫入操作時根據(jù)特定案件的引用法條表示向量計算寫入時的清除向量和增加向量,清除向量和增加向量是由該案件的案情描述文本表示向量通過兩個不同的全連接網(wǎng)絡得到;
最后更新案情描述記憶模塊需要同時考慮獲得的相關性權重,清除向量與相關性權重相乘得到最終這個案件在每個案情描述記憶模塊卡槽上的清除程度,增加向量和相關性權重相乘是清除后的每個卡槽應該增加的表示向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經(jīng)上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010413889.1/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡和網(wǎng)絡終端
- 網(wǎng)絡DNA
- 網(wǎng)絡地址自適應系統(tǒng)和方法及應用系統(tǒng)和方法
- 網(wǎng)絡系統(tǒng)及網(wǎng)絡至網(wǎng)絡橋接器
- 一種電力線網(wǎng)絡中根節(jié)點網(wǎng)絡協(xié)調方法和系統(tǒng)
- 一種多網(wǎng)絡定位方法、存儲介質及移動終端
- 網(wǎng)絡裝置、網(wǎng)絡系統(tǒng)、網(wǎng)絡方法以及網(wǎng)絡程序
- 從重復網(wǎng)絡地址自動恢復的方法、網(wǎng)絡設備及其存儲介質
- 神經(jīng)網(wǎng)絡的訓練方法、裝置及存儲介質
- 網(wǎng)絡管理方法和裝置





