[發明專利]基于深度神經網絡的司法審理首問題生成方法、裝置、介質有效
| 申請號: | 202011367044.X | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112329464B | 公開(公告)日: | 2023-08-04 |
| 發明(設計)人: | 吳飛;況琨;錢天馳 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/216;G06N3/049;G06N3/08;G06N3/0464 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 傅朝棟;張法高 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 神經網絡 司法 審理 問題 生成 方法 裝置 介質 | ||
本發明提供了一種基于深度神經網絡的司法審理首問題生成方法、裝置、介質。所述方法包括:1)獲取法律文書,包括原告訴稱文本和庭審記錄問題,提取審理過程中的首問題和爭議焦點,并構建訓練樣本;2)結合注意力機制和LSTM(長短時記憶模型)搭建序列到序列模型,分別完成司法審理首問題生成和爭議焦點生成任務;3)搭建多任務學習框架,利用爭議焦點生成任務作為首問題生成任務的輔助任務,更好地完成首問題生成。本發明將深度神經網絡和多任務學習技術應用于司法審理首問題的生成,從而幫助提升法庭審理工作的效率。相比一般的自然語言的生成算法,本發明利用多任務學習框架,有效保留了爭議焦點與首問題間的共享特征,提升了首問題的生成效果。
技術領域
本發明涉及自然語言處理領域,尤其涉及一種基于深度神經網絡的司法審判首問題生成技術。
背景技術
目前自然語言處理主要包括自然語言的認知,理解和生成等部分。通過這些部分,自然語言處理技術可以幫助人們快速地對大量的文本數據進行理解并據此提取生成有效信息。這一點能夠很好地在法律領域發揮作用。在庭審法律文書的處理中,有一個非常關鍵的工作是首問題(leading?question)的獲取。首問題所指的就是法官所提出的第一個質詢性問題,也將在很大程度上將決定后續質詢性問題的方向。法官通常在決定首問題上會花費可觀的時間和精力,來確保首問題之后的后續質詢性問題可以準確地圍繞案由核心展開。除了首問題之外,另一個非常重要的庭審文書處理工作是爭議焦點的獲取。爭議焦點所指的就是在案由中最關鍵的核心信息。在民事案件的審理中,爭議焦點主要通過分析原告與被告提供的信息所獲取。這也是法官在做出判決時非常重要的一個信息依據。因此如果能夠利用自然語言處理技術獲取首問題和爭議焦點便可以為法院節省可觀的時間和精力從而加快案情審理的速度。
在自然語言處理領域,常常通過基于長短時記憶模型(LSTM)的循環神經網絡(RNN)建立序列到序列模型,從而完成對自然語言的生成。近年來,注意力機制也被引入了序列到序列模型從而產生了序列到序列結合注意力模型,從而更進一步提升了自然語言生成的表現。然而,自然語言處理領域很常見的一個問題就是學習效果不佳。該發明所采用的多任務學習可以通過輔助任務的學習來提升學習效果。
發明內容
本發明的目的是克服現有技術的不足,提供一種基于深度神經網絡的司法審判首問題生成方法。
本發明的發明構思是:獲取法律文書,包括原告訴稱文本和庭審記錄問題,提取審理過程中的首問題和爭議焦點,并構建訓練樣本;對已建立的訓練樣本進行訓練,針對首問題生成和爭議焦點生成,利用LSTM搭建序列到序列結合注意力機制模型;基于序列到序列結合注意力機制模型,進行多任務學習,利用輔助任務爭議焦點的生成,為主要任務首問題生成提供更多信息,從而提升首問題生成的效果。
為實現上述發明目的,本發明具體采用的技術方案如下:
一種基于深度神經網絡的司法審理首問題生成方法,其包括如下步驟:
S1:獲取法律文書,包括原告訴稱文本和庭審記錄文本,提取審理過程中的首問題(1eading?question)和爭議焦點,并構建成訓練樣本;
S2:針對首問題生成任務和爭議焦點生成任務,利用LSTM搭建序列到序列結合注意力機制模型;
S3:基于序列到序列結合注意力機制模型,搭建多任務學習框架,利用爭議焦點生成作為輔助任務,幫助完成首問題生成任務。
作為優選,所述S1的具體步驟如下:
S101:利用正則表達式從司法判決書中抽取原告訴稱文本,利用jieba分詞將原告訴稱文本分割成詞語構成的序列{x1,x2,...,xM},其中xi為原告訴稱文本詞語序列的第i個詞語,M為原告訴稱文本詞語序列長度,i∈[1,M];
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011367044.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種接口可收納型電腦主機箱
- 下一篇:一種靜音超低水位魚缸過濾器





