[發(fā)明專利]基于知識圖譜的生成式問題推薦方法、設(shè)備、介質(zhì)及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202211161774.3 | 申請日: | 2022-09-23 |
| 公開(公告)號: | CN116150315A | 公開(公告)日: | 2023-05-23 |
| 發(fā)明(設(shè)計)人: | 雋兆波;陳瑩;何健軍;代翔;李春豹;丁洪麗 | 申請(專利權(quán))人: | 中國電子科技集團(tuán)公司第十研究所 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F16/35;G06F16/36;G06F40/295;G06N3/045;G06N3/0442;G06N7/01 |
| 代理公司: | 成都九鼎天元知識產(chǎn)權(quán)代理有限公司 51214 | 代理人: | 周浩杰 |
| 地址: | 610000 四川*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 知識 圖譜 生成 問題 推薦 方法 設(shè)備 介質(zhì) 系統(tǒng) | ||
本發(fā)明公開一種基于知識圖譜的生成式問題推薦方法、設(shè)備、介質(zhì)及系統(tǒng),屬于自然語言處理分析領(lǐng)域領(lǐng)域,包括步驟:S1,數(shù)據(jù)準(zhǔn)備;S2,構(gòu)建實(shí)體輔助Elasticsearch數(shù)據(jù)庫;S3,基于Bert?BILSTM?CRF模型提取問題中實(shí)體;S4,基于NeZha+UniLM模型進(jìn)行問題生成;S5,根據(jù)生成問題進(jìn)行問題推薦。本發(fā)明解決推薦數(shù)據(jù)稀疏、關(guān)聯(lián)性弱、多樣性少的技術(shù)問題,可以提升用戶問答體驗(yàn),輔助獲取更多隱藏信息,實(shí)現(xiàn)根據(jù)用戶提問問題生成相關(guān)問題進(jìn)行準(zhǔn)確推薦。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理分析領(lǐng)域,更為具體的,涉及一種基于知識圖譜的生成式問題推薦方法、設(shè)備、介質(zhì)及系統(tǒng)。
背景技術(shù)
在文本語言處理分析中,用戶積累了大量的結(jié)構(gòu)化文本數(shù)據(jù),為了更好的挖掘其中的關(guān)聯(lián)關(guān)系,往往以知識圖譜的形式對其進(jìn)行存儲,知識圖譜將結(jié)構(gòu)化文本通過網(wǎng)狀形式進(jìn)行關(guān)聯(lián),可以更加深刻的挖掘各個實(shí)體之間的關(guān)聯(lián)關(guān)系,從而進(jìn)行相關(guān)實(shí)體的多跳查詢、知識推理。問答作為知識獲取的方式之一,基于知識圖譜的問答應(yīng)用也愈加廣發(fā),在用戶進(jìn)行日常問答中,需要對用戶提問問題進(jìn)行分析,并做出個性化的相關(guān)問題推薦,如何提取用戶問題關(guān)鍵信息并做出精確問題推薦,輔助用戶獲取更多關(guān)鍵信息、提升問答體驗(yàn)具有重要的研究意義。
目前傳統(tǒng)的推薦系統(tǒng)基于用戶歷史行為,通過構(gòu)建問題歷史庫以及問答對庫,從中匹配和用戶提問問題相似的問題進(jìn)行推薦。在實(shí)際應(yīng)用中,用戶問題一般具有一定的泛化性,且數(shù)據(jù)庫具有不完備性,該方法存在推薦數(shù)據(jù)稀疏、關(guān)聯(lián)性弱、多樣性少等問題,這樣就導(dǎo)致推薦問題不準(zhǔn)確,難以滿足用戶需求,實(shí)際推薦問題和用戶提問問題相關(guān)性較弱。因此需要根據(jù)用戶實(shí)際問題,建立精確、相關(guān)性強(qiáng)、多樣性足的問題推薦系統(tǒng)。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于知識圖譜的生成式問題推薦方法、設(shè)備、介質(zhì)及系統(tǒng),解決推薦數(shù)據(jù)稀疏、關(guān)聯(lián)性弱、多樣性少的技術(shù)問題,可以提升用戶問答體驗(yàn),輔助獲取更多隱藏信息,實(shí)現(xiàn)根據(jù)用戶提問問題生成相關(guān)問題進(jìn)行準(zhǔn)確推薦。
本發(fā)明的目的是通過以下方案實(shí)現(xiàn)的:
一種基于知識圖譜的生成式問題推薦方法,包括以下步驟:
S1,數(shù)據(jù)準(zhǔn)備;
S2,構(gòu)建實(shí)體輔助Elasticsearch數(shù)據(jù)庫;
S3,基于Bert-BILSTM-CRF模型提取問題中實(shí)體;
S4,基于NeZha+UniLM模型進(jìn)行問題生成;
S5,根據(jù)生成問題進(jìn)行問題推薦。
進(jìn)一步地,在步驟S1中,包括子步驟:根據(jù)已有的知識圖譜數(shù)據(jù)庫,按需求構(gòu)建實(shí)體識別模型以及問題生成模型所需訓(xùn)練語料。
進(jìn)一步地,在步驟S2中,包括子步驟:以實(shí)體全稱、簡稱、別名構(gòu)建圖譜實(shí)體的Elasticsearch數(shù)據(jù)庫,基于Es檢索獲取問題中實(shí)體對應(yīng)圖譜庫中實(shí)體全稱,再去獲取對應(yīng)三元組。
進(jìn)一步地,在步驟S3中,包括子步驟:針對用戶提問問題,基于Bert-BILSTM-CRF模型進(jìn)行命名實(shí)體識別,根據(jù)獲取的問題實(shí)體進(jìn)行Es檢索,獲取Elasticsearch數(shù)據(jù)庫中對應(yīng)實(shí)體全稱,由對應(yīng)實(shí)體全稱至圖譜數(shù)據(jù)庫中進(jìn)行相關(guān)三元組檢索。
進(jìn)一步地,在步驟S4中,包括子步驟:將三元組按順序連接作為篇章,尾實(shí)體作為答案,即生成符合答案為尾實(shí)體的相關(guān)問題;在模型結(jié)構(gòu)上,采用NeZha+UniLM模型;在模型輸入上,對于單跳問題獲取的三元組(entity1,relation,entity2),將頭實(shí)體、關(guān)系、尾實(shí)體(entity1+relation+entity2)順序拼接作為篇章,尾實(shí)體(entity2)作為答案,其形式表示為:
[CLS]entity1?relation?entity2[SEP]entity2[SEP];
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國電子科技集團(tuán)公司第十研究所,未經(jīng)中國電子科技集團(tuán)公司第十研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211161774.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計算方法





