[發(fā)明專利]基于深度神經(jīng)網(wǎng)絡(luò)的司法審理首問題生成方法、裝置、介質(zhì)有效
| 申請?zhí)枺?/td> | 202011367044.X | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112329464B | 公開(公告)日: | 2023-08-04 |
| 發(fā)明(設(shè)計)人: | 吳飛;況琨;錢天馳 | 申請(專利權(quán))人: | 浙江大學(xué) |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/216;G06N3/049;G06N3/08;G06N3/0464 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 傅朝棟;張法高 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 神經(jīng)網(wǎng)絡(luò) 司法 審理 問題 生成 方法 裝置 介質(zhì) | ||
1.一種基于深度神經(jīng)網(wǎng)絡(luò)的司法審理首問題生成方法,其特征在于,包括如下步驟:
S1:獲取法律文書,包括原告訴稱文本和庭審記錄文本,提取審理過程中的首問題和爭議焦點,并構(gòu)建成訓(xùn)練樣本,其具體步驟如下:
S101:利用正則表達(dá)式從司法判決書中抽取原告訴稱文本,利用jieba分詞將原告訴稱文本分割成詞語構(gòu)成的序列{x1,x2,...,xM},其中xi為原告訴稱文本詞語序列的第i個詞語,M為原告訴稱文本詞語序列長度,i∈[1,M];
S102:利用正則表達(dá)式從司法庭審文本中抽取首問題文本,利用jieba分詞將首問題文本分割成詞語構(gòu)成的序列{y1,y2,...,yN},其中yj為首問題文本詞語序列的第j個詞語,N為首問題文本詞語序列長度,j∈[1,N];
S103:將庭審記錄文本利用jieba分詞分割為詞語構(gòu)成的序列{x′1,x′2,...,x′P},其中x′k為庭審記錄文本詞語序列的第k個詞語,P為庭審記錄文本詞語序列長度,k∈[1,P];抽取庭審記錄文本中的爭議焦點文本,利用jieba分詞將其分割為詞語構(gòu)成的序列{y′1,y′2,...,y′Q},其中y′f為爭議焦點文本詞語序列中第f個詞語,Q為爭議焦點文本詞語序列中序列長度,f∈[1,Q];
S104:將S101~S103中獲得的詞語序列構(gòu)建為訓(xùn)練樣本;
S2:針對首問題生成任務(wù)和爭議焦點生成任務(wù),利用LSTM搭建序列到序列結(jié)合注意力機制模型,其具體步驟如下:
S201:利用長短時記憶模型LSTM搭建一個兩層的bidirectional?LSTM編碼器,用于對原告訴稱文本詞語序列進(jìn)行編碼,得到文本向量{h1,h2,...,hM},其中通過bidirectionalLSTM編碼器更新得到的文本表征向量為其中表示正向的隱藏狀態(tài),表示逆向的隱藏狀態(tài);再根據(jù)更新得到的文本表征向量,計算得到上下文向量其中為第l層隱藏層的權(quán)重,l∈[1,M];
S202:利用LSTM搭建一個單層的單向LSTM-RNN解碼器,并根據(jù)上下文向量和所有之前預(yù)測所得的詞語{y1,...,yt-1}來預(yù)測第t步的詞yt:
其中,p(y)表示生成詞序列y的概率,y=(y1,…,yt),為第t步的上下文向量,l∈[1,N];
S203:基于利用LSTM所搭建的編碼器和解碼器,使用序列到序列結(jié)合注意力機制模型將原告訴稱文本詞語序列{x1,x2,…,xM}映射到詞匯空間:
其中st為解碼器狀態(tài),為上下文向量,V,V′,b和b′是待學(xué)習(xí)的參數(shù);
最后預(yù)測的詞的概率分布為P(w)=Pvocab(w),Pvocab(w)表示詞w在詞匯空間Pvocab中出現(xiàn)的概率;
S204:針對序列到序列結(jié)合注意力機制模型,設(shè)定訓(xùn)練樣本的損失函數(shù)為:
其中P(wt)為首問題文本詞語序列中第t個詞語的概率;
S3:基于序列到序列結(jié)合注意力機制模型,搭建多任務(wù)學(xué)習(xí)框架,利用爭議焦點生成作為輔助任務(wù),幫助完成首問題生成任務(wù)。
2.如權(quán)利要求1中所述的基于深度神經(jīng)網(wǎng)絡(luò)的司法審理首問題生成方法,其特征在于,所述的步驟S201中,計算上下文向量時,所采用的隱藏層權(quán)重的生成機制為:
其中,hl為文本向量,sj為解碼器狀態(tài),其中v,Wh,Ws,battn是待學(xué)習(xí)的參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011367044.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種接口可收納型電腦主機箱
- 下一篇:一種靜音超低水位魚缸過濾器
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





