[發(fā)明專利]一種基于多維度語義聯(lián)合建模的多用戶案例檢索系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010747457.4 | 申請日: | 2020-07-30 |
| 公開(公告)號: | CN111625626B | 公開(公告)日: | 2020-12-18 |
| 發(fā)明(設(shè)計(jì))人: | 劉廣峰;魯思帆 | 申請(專利權(quán))人: | 杭州識度科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/31;G06N3/04;G06Q50/18 |
| 代理公司: | 杭州華知專利事務(wù)所(普通合伙) 33235 | 代理人: | 束曉前 |
| 地址: | 310000 浙江省杭州市余杭*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多維 語義 聯(lián)合 建模 多用戶 案例 檢索系統(tǒng) | ||
1.一種基于多維度語義聯(lián)合建模的多用戶案例檢索系統(tǒng),其特征在于,包括:
知識構(gòu)建模塊:對現(xiàn)有的裁判文書進(jìn)行信息提取,搭建裁判文書庫,并根據(jù)裁判文書庫生成裁判文書畫像庫和與案人員畫像庫;
要素識別模塊:利用要素特征提取模型對用戶提供的文本進(jìn)行要素特征的抽取,利用用戶特征提取模型提取咨詢用戶的用戶人物特征;
匹配查詢模塊:根據(jù)要素特征在知識構(gòu)建模塊生成的裁判文書畫像庫進(jìn)行查詢并匹配,根據(jù)用戶人物特征在知識構(gòu)建模塊生成的與案人員畫像庫進(jìn)行查詢并匹配;
所述匹配查詢模塊實(shí)現(xiàn)功能的步驟如下所示:
S1:要素識別排序,對咨詢用戶輸入的文本中提取的要素進(jìn)行畫像匹配,在裁判文書畫像庫中獲取要素識別排序前列的若干篇裁判文書,計(jì)算裁判文書畫像相似度sim_label;
S2:根據(jù)咨詢用戶的用戶畫像,計(jì)算用戶與現(xiàn)有裁判文書與案人員畫像庫中的畫像之間的相似度sim_person;
S3:根據(jù)要素特征提取模型提取出來的裁判文書標(biāo)簽和人物畫像標(biāo)簽,使用ElasticSearch數(shù)據(jù)庫,通過聯(lián)合計(jì)算公式計(jì)算其與裁判文書庫內(nèi)的所有文書的相似度sim_score,并根據(jù)sim_score降序返回對應(yīng)的若干篇裁判文書;
S4:將相似度sim_score中得分排名前列的若干篇裁判文書返回給用戶;
所述聯(lián)合計(jì)算公式具體為:
。
2.根據(jù)權(quán)利要求1所述的基于多維度語義聯(lián)合建模的多用戶案例檢索系統(tǒng),其特征在于,所述裁判文書庫的構(gòu)建過程為:
S1:基于現(xiàn)有裁判文書,對裁判文書進(jìn)行結(jié)構(gòu)化分層操作;
S2:基于現(xiàn)有裁判文書的領(lǐng)域,對裁判文書進(jìn)行標(biāo)注;
S3:基于上述信息建立裁判文書庫。
3.根據(jù)權(quán)利要求1所述的基于多維度語義聯(lián)合建模的多用戶案例檢索系統(tǒng),其特征在于,所述裁判文書畫像庫的構(gòu)建過程為:
S1:基于上述的裁判文書庫,預(yù)先設(shè)計(jì)出裁判文書畫像模型;
S2:基于裁判文書畫像模型,對結(jié)構(gòu)化后的裁判文書的各層信息進(jìn)行提取;
S3:根據(jù)提取完成的裁判文書畫像,構(gòu)建裁判文書畫像庫。
4.根據(jù)權(quán)利要求1所述的基于多維度語義聯(lián)合建模的多用戶案例檢索系統(tǒng),其特征在于,所述與案人員畫像庫的構(gòu)建過程為:
S1:基于現(xiàn)有的用戶人物特征,預(yù)先設(shè)計(jì)出與案人員畫像模型;
S2:基于用戶畫像模型,對裁判文書中的與案人員進(jìn)行畫像信息提取;
S3:基于上述信息初步建立與案人員畫像庫。
5.根據(jù)權(quán)利要求3所述的基于多維度語義聯(lián)合建模的多用戶案例檢索系統(tǒng),其特征在于,所述裁判文書畫像的提取過程具體為:
S1:針對裁判文書庫中的語料,由法律相關(guān)專業(yè)人員對裁判文書庫中的部分語料進(jìn)行要素標(biāo)注,并生成層級化要素標(biāo)注集;
S2:針對裁判文書中原被告信息,提取裁判文書涉案人物信息,構(gòu)建涉案人物畫像,生成裁判文書涉案人物畫像數(shù)據(jù)庫;
S3:針對裁判文書要素標(biāo)注集,與裁判文書涉案人物畫像數(shù)據(jù)庫已有的標(biāo)注數(shù)據(jù),使用BERT對語料進(jìn)行詞嵌入訓(xùn)練,使用基于注意力機(jī)制的雙向LSTM模型,生成詞權(quán)重矩陣,基于詞權(quán)重矩陣訓(xùn)練出裁判文書要素特征提取模型;
S4:針對裁判文書要素標(biāo)注集,與裁判文書涉案人物畫像數(shù)據(jù)庫,使用裁判文書要素特征提取模型,將整個(gè)數(shù)據(jù)庫中的語料進(jìn)行要素特征提取,根據(jù)不同的要素生成裁判文書畫像,進(jìn)而生成裁判文書畫像庫。
6.根據(jù)權(quán)利要求4所述的基于多維度語義聯(lián)合建模的多用戶案例檢索系統(tǒng),其特征在于,所述要素識別模塊實(shí)現(xiàn)功能的步驟為:
S1:對用戶的輸入文本進(jìn)行數(shù)據(jù)預(yù)處理,具體為將輸入文本切分為以單個(gè)字組成的列表;
S2:針對數(shù)據(jù)預(yù)處理的結(jié)果,使用訓(xùn)練好的要素特征提取模型BERT+BiLSTM+Attention進(jìn)行要素識別,得到各種要素的識別結(jié)果集;
S3:最后在要素的識別結(jié)果集中,將閾值高于篩選值的要素確定為輸入文本所提取的要素;
S4:根據(jù)與案人員畫像的信息結(jié)構(gòu),進(jìn)行咨詢用戶的用戶人物特征的抽取。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州識度科技有限公司,未經(jīng)杭州識度科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010747457.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 多維、多元生命水及其用途
- 一種多維地址域名解析的方法和裝置以及系統(tǒng)
- 創(chuàng)建多維操作系統(tǒng)的方法和裝置
- 一種對多維地址數(shù)據(jù)進(jìn)行解析的方法和裝置以及系統(tǒng)
- 一種分組的交付和路由選擇的方法和裝置以及系統(tǒng)
- 多維碼處理方法、發(fā)送端、接收端和系統(tǒng)
- 多維度信息展示方法及裝置
- 一種屏幕可視化方法、裝置、電子設(shè)備及介質(zhì)
- 多維數(shù)據(jù)集的生成方法及裝置、計(jì)算機(jī)可讀存儲介質(zhì)
- 多維時(shí)空譜數(shù)據(jù)融合方法、裝置、電子設(shè)備和存儲介質(zhì)
- 面向語義Web服務(wù)程序設(shè)計(jì)的語義數(shù)據(jù)表示和處理方法
- 一種基于語義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語義匹配方法和系統(tǒng)
- 遠(yuǎn)程語義識別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲介質(zhì)
- 一種基于語義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級語義表征和語義計(jì)算的信號語義識別方法
- 語義分類方法及裝置、存儲介質(zhì)及電子設(shè)備
- 中繼網(wǎng)絡(luò)中的聯(lián)合方法、系統(tǒng)、中繼站及移動臺
- 中繼網(wǎng)絡(luò)中的聯(lián)合方法、系統(tǒng)、中繼站及移動臺
- 便攜信息終端、以及便攜信息終端的控制方法
- 電法與地震同步聯(lián)合反演方法及系統(tǒng)
- 銀行聯(lián)合放款的放款方法、裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 一種基于自主學(xué)習(xí)群搜索算法的聯(lián)合調(diào)度方法及系統(tǒng)
- 一種基于多目標(biāo)種群群搜索算法的聯(lián)合調(diào)度方法及系統(tǒng)
- 聯(lián)合貸款中的罰息與利息結(jié)算方法、裝置、介質(zhì)和設(shè)備
- 一種基坑支護(hù)用H型鋼構(gòu)件
- 用于云環(huán)境的語義元聯(lián)合代理





