[發(fā)明專利]一種知識(shí)圖譜的擴(kuò)展方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 202010884220.0 | 申請(qǐng)日: | 2020-08-28 |
| 公開(公告)號(hào): | CN112100324B | 公開(公告)日: | 2023-05-05 |
| 發(fā)明(設(shè)計(jì))人: | 陳開冉;黎展;謝智權(quán) | 申請(qǐng)(專利權(quán))人: | 廣州探跡科技有限公司 |
| 主分類號(hào): | G06F16/33 | 分類號(hào): | G06F16/33;G06F16/36;G06F40/211;G06F40/295 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 顏希文;郝傳鑫 |
| 地址: | 511400 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 知識(shí) 圖譜 擴(kuò)展 方法 裝置 存儲(chǔ) 介質(zhì) 計(jì)算 設(shè)備 | ||
1.一種知識(shí)圖譜的擴(kuò)展方法,其特征在于,包括:
獲取外部文本信息;
將所述外部文本切分為段落;
將所述段落切分為句子;
獲取所述句子的(S、O、B、T)四元組屬性;
將所述句子的(S、O、B、T)四元組屬性合并為句子圖;
將所述句子圖合并為段落圖;
通過所述段落圖,生成事件列表;
將所述事件列表里的事件實(shí)體和核心數(shù)據(jù)庫實(shí)體進(jìn)行實(shí)體嵌入編碼后,進(jìn)行所述事件實(shí)體與所述核心數(shù)據(jù)庫實(shí)體的相似度排序;
若所述事件實(shí)體與所述核心數(shù)據(jù)庫實(shí)體的最大相似度大于預(yù)設(shè)第一閾值,則將所述事件實(shí)體插入所述核心數(shù)據(jù)庫;
若所述事件實(shí)體與所述核心數(shù)據(jù)庫實(shí)體的最大相似度小于預(yù)設(shè)第一閾值,則選取與所述事件實(shí)體相似度最高的指定個(gè)數(shù)的候選核心數(shù)據(jù)庫實(shí)體;
依次根據(jù)所述候選核心數(shù)據(jù)庫實(shí)體對(duì)所述事件實(shí)體進(jìn)行屬性補(bǔ)全;
進(jìn)行屬性補(bǔ)全后的所述事件實(shí)體與所述候選核心數(shù)據(jù)庫實(shí)體的相似度排序;
若屬性補(bǔ)全后的所述事件實(shí)體與所述候選核心數(shù)據(jù)庫實(shí)體的最大相似度大于預(yù)設(shè)第一閾值,則將屬性補(bǔ)全后的所述事件實(shí)體插入所述核心數(shù)據(jù)庫;
若屬性補(bǔ)全后的所述事件實(shí)體與所述候選核心數(shù)據(jù)庫實(shí)體的最大相似度小于預(yù)設(shè)第一閾值,則將屬性補(bǔ)全后的所述事件實(shí)體放入潛意識(shí)模塊。
2.如權(quán)利要求1所述的一種知識(shí)圖譜的擴(kuò)展方法,其特征在于,在所述事件實(shí)體進(jìn)行屬性補(bǔ)全之前,還包括:
將所述事件實(shí)體與指定知識(shí)庫進(jìn)行實(shí)體鏈接,獲取所述事件實(shí)體與所述指定知識(shí)庫實(shí)體的相似度;其中,所述指定知識(shí)庫包括潛意識(shí)模塊和外部知識(shí)庫;
確定所述事件實(shí)體與所述指定知識(shí)庫實(shí)體的相似度大于預(yù)設(shè)第二閾值。
3.如權(quán)利要求1所述的一種知識(shí)圖譜的擴(kuò)展方法,其特征在于,采用貪心策略,根據(jù)所述候選核心數(shù)據(jù)庫實(shí)體對(duì)所述事件實(shí)體進(jìn)行屬性補(bǔ)全;
其中,所述貪心策略包括:若補(bǔ)全某屬性,能提高所述事件實(shí)體與候選實(shí)體的最大相似度,則進(jìn)行所述事件實(shí)體的屬性補(bǔ)全。
4.如權(quán)利要求2所述的一種知識(shí)圖譜的擴(kuò)展方法,其特征在于,所述外部知識(shí)庫包括:WiKi或Babel或ZhishiMe。
5.如權(quán)利要求1所述的一種知識(shí)圖譜的擴(kuò)展方法,其特征在于,將所述句子的(S、O、B、T)四元組屬性合并為句子圖包括:
對(duì)于含有代詞的句子圖,將所述代詞與對(duì)應(yīng)的上下文其他句子放入Bert模型;
計(jì)算所述代詞與對(duì)應(yīng)的上下文其他句子的候選實(shí)體的相關(guān)度得分;
使用所述相關(guān)度得分最高的所述候選實(shí)體替換所述代詞對(duì)應(yīng)的實(shí)體。
6.一種知識(shí)圖譜擴(kuò)展裝置,其特征在于,包括:
外部信息獲取模塊,用于獲取外部文本信息;
事件列表生成模塊,用于將所述外部文本切分為段落;將所述段落切分為句子;獲取所述句子的(S、O、B、T)四元組屬性;將所述句子的(S、O、B、T)四元組屬性合并為句子圖;將所述句子圖合并為段落圖;通過所述段落圖,生成所述事件列表;
新知識(shí)校驗(yàn)?zāi)K,用于將所述事件列表里的事件實(shí)體和核心數(shù)據(jù)庫實(shí)體進(jìn)行實(shí)體嵌入編碼后,進(jìn)行所述事件實(shí)體與所述核心數(shù)據(jù)庫實(shí)體的相似度排序,判斷所述事件實(shí)體與所述核心數(shù)據(jù)庫實(shí)體的最大相似度是否大于預(yù)設(shè)第一閾值,如果是,觸發(fā)新知識(shí)擴(kuò)展模塊,否則,觸發(fā)屬性補(bǔ)全模塊;
所述新知識(shí)擴(kuò)展模塊,用于將所述事件實(shí)體插入所述核心數(shù)據(jù)庫;
所述屬性補(bǔ)全模塊,用于選取與所述事件實(shí)體相似度最高的指定個(gè)數(shù)的候選核心數(shù)據(jù)庫實(shí)體;依次根據(jù)所述候選核心數(shù)據(jù)庫實(shí)體對(duì)所述事件實(shí)體進(jìn)行屬性補(bǔ)全;進(jìn)行屬性補(bǔ)全后的所述事件實(shí)體與所述候選核心數(shù)據(jù)庫實(shí)體的相似度排序;若屬性補(bǔ)全后的所述事件實(shí)體與所述候選核心數(shù)據(jù)庫實(shí)體的最大相似度大于預(yù)設(shè)第一閾值,則將屬性補(bǔ)全后的所述事件實(shí)體插入所述核心數(shù)據(jù)庫;若屬性補(bǔ)全后的所述事件實(shí)體與所述候選核心數(shù)據(jù)庫實(shí)體的最大相似度小于預(yù)設(shè)第一閾值,則將屬性補(bǔ)全后的所述事件實(shí)體放入潛意識(shí)模塊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州探跡科技有限公司,未經(jīng)廣州探跡科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010884220.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識(shí)圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識(shí)圖譜的構(gòu)建方法、裝置、知識(shí)圖譜系統(tǒng)及設(shè)備
- 一種基于知識(shí)圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于創(chuàng)建知識(shí)圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





