[發(fā)明專利]基于query分析的圖譜優(yōu)化方法、裝置、設(shè)備及介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110688454.2 | 申請(qǐng)日: | 2021-06-22 |
| 公開(公告)號(hào): | CN113254671B | 公開(公告)日: | 2021-09-28 |
| 發(fā)明(設(shè)計(jì))人: | 陳宇 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G06F16/36 | 分類號(hào): | G06F16/36;G06F16/28;G06F16/35;G06F40/295;G06N3/04;G06N5/02 |
| 代理公司: | 深圳市精英專利事務(wù)所 44242 | 代理人: | 李翔宇 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 query 分析 圖譜 優(yōu)化 方法 裝置 設(shè)備 介質(zhì) | ||
本發(fā)明涉及人工智能領(lǐng)域,提供一種基于query分析的圖譜優(yōu)化方法、裝置、設(shè)備及介質(zhì),能夠通過query分析,抽取到用戶關(guān)注的實(shí)體及關(guān)系,形成用戶關(guān)注領(lǐng)域的知識(shí),有效解決了回答不清楚、不準(zhǔn)確等的問題,同時(shí),結(jié)合query分析及搜索引擎,將與用戶關(guān)注點(diǎn)強(qiáng)相關(guān)的實(shí)體及關(guān)系更新至知識(shí)圖譜,使構(gòu)建的圖譜更加具有針對(duì)性,進(jìn)而實(shí)現(xiàn)了對(duì)知識(shí)圖譜的優(yōu)化更新,擴(kuò)充及豐富了知識(shí)圖譜的規(guī)模。本發(fā)明還涉及區(qū)塊鏈技術(shù),目標(biāo)圖譜可以存儲(chǔ)于區(qū)塊鏈節(jié)點(diǎn)上。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種基于query分析的圖譜優(yōu)化方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù)
現(xiàn)有技術(shù)中普遍采用的用于構(gòu)建知識(shí)圖譜的數(shù)據(jù)源主要是結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),比如金融產(chǎn)品的知識(shí)圖譜,數(shù)據(jù)來源一方面是相關(guān)公司歷史金融產(chǎn)品數(shù)據(jù)庫,另一方面是一些金融專業(yè)網(wǎng)站公布的半結(jié)構(gòu)化網(wǎng)頁數(shù)據(jù)。這些數(shù)據(jù)的優(yōu)點(diǎn)是比較規(guī)整,方便轉(zhuǎn)換成知識(shí)圖譜。但是,也存在一定的缺陷,具體如下:
1.數(shù)據(jù)量有限;很多公司的積累數(shù)據(jù)庫是不夠的,甚至有些數(shù)據(jù)并沒有存儲(chǔ)到數(shù)據(jù)庫中,因此無法支持完整的知識(shí)圖譜構(gòu)建;
2.一些數(shù)據(jù)庫由于權(quán)限問題無法獲取。
因此,傳統(tǒng)方式構(gòu)建的知識(shí)圖譜不夠完整,知識(shí)的覆蓋面較小。
另外,采用現(xiàn)有技術(shù)構(gòu)建的知識(shí)圖譜與用戶需求的關(guān)聯(lián)度較小,當(dāng)現(xiàn)有技術(shù)構(gòu)建的知識(shí)圖譜被用于用戶搜索等交互場(chǎng)景時(shí),由于答案反饋主要基于的是數(shù)據(jù)庫數(shù)據(jù)和知識(shí)圖譜數(shù)據(jù),因此,將可能導(dǎo)致下面問題的產(chǎn)生:
1.由于知識(shí)圖譜中的數(shù)據(jù)不夠完整,因此回答不詳細(xì);
2.由于知識(shí)圖譜中的數(shù)據(jù)與用戶的關(guān)聯(lián)度較低,因此匹配的答案不準(zhǔn)確。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種基于query分析的圖譜優(yōu)化方法、裝置、設(shè)備及介質(zhì),能夠通過query分析,抽取到用戶關(guān)注的實(shí)體及關(guān)系,形成用戶關(guān)注領(lǐng)域的知識(shí),有效解決了回答不清楚、不準(zhǔn)確等的問題,同時(shí),結(jié)合query分析及搜索引擎,將與用戶關(guān)注點(diǎn)強(qiáng)相關(guān)的實(shí)體及關(guān)系更新至知識(shí)圖譜,使構(gòu)建的圖譜更加具有針對(duì)性,進(jìn)而實(shí)現(xiàn)了對(duì)知識(shí)圖譜的優(yōu)化更新,擴(kuò)充及豐富了知識(shí)圖譜的規(guī)模。
第一方面,本發(fā)明實(shí)施例提供了一種基于query分析的圖譜優(yōu)化方法,其包括:
獲取預(yù)設(shè)時(shí)長內(nèi)產(chǎn)生的query日志;
從所述query日志中獲取瀏覽信息,并根據(jù)所述瀏覽信息確定待優(yōu)化query;
調(diào)用指定搜索引擎,并利用所述指定搜索引擎查詢所述待優(yōu)化query,得到至少一個(gè)非結(jié)構(gòu)化文本;
利用改進(jìn)的BiLSTM模型對(duì)所述至少一個(gè)非結(jié)構(gòu)化文本進(jìn)行實(shí)體及關(guān)系抽取,得到候選實(shí)體及候選關(guān)系;
從所述至少一個(gè)非結(jié)構(gòu)化文本中獲取抽取失敗的文本,利用改進(jìn)的基于ERNIE的實(shí)體關(guān)系聯(lián)合抽取模型對(duì)所述抽取失敗的文本進(jìn)行補(bǔ)充抽取,并將抽取到的數(shù)據(jù)補(bǔ)充至所述候選實(shí)體及所述候選關(guān)系;
調(diào)用初始知識(shí)圖譜,并利用所述初始知識(shí)圖譜對(duì)所述候選實(shí)體及所述候選關(guān)系進(jìn)行清洗,得到目標(biāo)實(shí)體及目標(biāo)關(guān)系;
將所述目標(biāo)實(shí)體及所述目標(biāo)關(guān)系更新至所述初始知識(shí)圖譜,得到目標(biāo)圖譜。
根據(jù)本發(fā)明優(yōu)選實(shí)施例,所述根據(jù)所述瀏覽信息確定待優(yōu)化query包括:
從所述瀏覽信息中捕獲停留時(shí)長大于或者等于配置時(shí)長,且沒有點(diǎn)擊操作的頁面,將捕獲到的頁面所對(duì)應(yīng)的query確定為所述待優(yōu)化query;及/或
從所述瀏覽信息中讀取用戶的消極反饋記錄,并獲取與所述消極反饋記錄對(duì)應(yīng)的query作為所述待優(yōu)化query。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110688454.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種大容量老化測(cè)試箱
- 下一篇:多級(jí)變速器及車輛
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識(shí)圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識(shí)圖譜的構(gòu)建方法、裝置、知識(shí)圖譜系統(tǒng)及設(shè)備
- 一種基于知識(shí)圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于創(chuàng)建知識(shí)圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法





