[發(fā)明專(zhuān)利]基于多語(yǔ)義學(xué)習(xí)的知識(shí)圖譜補(bǔ)全方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110059002.8 | 申請(qǐng)日: | 2021-01-17 |
| 公開(kāi)(公告)號(hào): | CN112667824A | 公開(kāi)(公告)日: | 2021-04-16 |
| 發(fā)明(設(shè)計(jì))人: | 尹寶才;王家普;胡永利;孫艷豐;王博岳 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類(lèi)號(hào): | G06F16/36 | 分類(lèi)號(hào): | G06F16/36;G06F16/28;G06K9/62;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語(yǔ)義 學(xué)習(xí) 知識(shí) 圖譜 方法 | ||
本發(fā)明公開(kāi)了基于多語(yǔ)義學(xué)習(xí)的知識(shí)圖譜補(bǔ)全方法,將實(shí)體e1和r分別先通過(guò)多個(gè)轉(zhuǎn)換矩陣學(xué)習(xí)到多個(gè)隱藏的語(yǔ)義表示。在前面的知識(shí)圖嵌入捕捉實(shí)體和關(guān)系多個(gè)隱藏語(yǔ)義的步驟中,得到對(duì)同一實(shí)體或關(guān)系的多個(gè)特征嵌入。利用深度殘差注意力網(wǎng)絡(luò)優(yōu)化實(shí)體和關(guān)系的嵌入。引入去噪網(wǎng)絡(luò)優(yōu)化實(shí)體嵌入和關(guān)系嵌入。接下來(lái)先簡(jiǎn)述去噪網(wǎng)絡(luò)的結(jié)構(gòu)。引入多步融合的過(guò)程來(lái)充分融合實(shí)體和關(guān)系;本發(fā)明提出來(lái)的深度殘差注意力網(wǎng)絡(luò),能有效減少引入多個(gè)隱藏語(yǔ)義帶來(lái)大量噪聲的問(wèn)題。同時(shí)去噪網(wǎng)絡(luò)和多步融合網(wǎng)絡(luò)能充分融合實(shí)體和關(guān)系,來(lái)得到最符合的預(yù)測(cè)結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明適用于知識(shí)領(lǐng)域知識(shí)圖譜補(bǔ)全技術(shù),尤其涉及一種基于多語(yǔ)義學(xué)習(xí)的知識(shí)圖譜補(bǔ)全方法。
背景技術(shù)
知識(shí)圖作為人類(lèi)知識(shí)的集合,已經(jīng)成為人工智能(AI)和自然語(yǔ)言處理(NLP)應(yīng)用的重要資源,如問(wèn)題回答、網(wǎng)絡(luò)搜索和語(yǔ)義分析等。知識(shí)表示,特別是知識(shí)嵌入,是知識(shí)利用的基礎(chǔ)步驟。知識(shí)圖譜的嵌入是為了學(xué)習(xí)一種連續(xù)的映射,將一個(gè)結(jié)構(gòu)化的知識(shí)圖譜的實(shí)體和關(guān)系嵌入到一個(gè)向量空間中。知識(shí)圖譜嵌入有多種應(yīng)用,如關(guān)系提取、問(wèn)題回答、規(guī)范化、推薦系統(tǒng)、對(duì)話系統(tǒng)等。
知識(shí)圖譜是事實(shí)的結(jié)構(gòu)化的表示,其在知識(shí)圖可以表示成三元組的集合(h,r,t),其中r表示頭實(shí)體h和尾實(shí)體t之間的關(guān)系。大多數(shù)知識(shí)圖譜,如Freebase[1],WordNet[2],YAGO[3]等,已經(jīng)包含數(shù)百萬(wàn)甚至數(shù)十億的三元組,但仍遠(yuǎn)未完成,因?yàn)樾屡d出現(xiàn)的新知識(shí)。因此,該問(wèn)題產(chǎn)生了知識(shí)庫(kù)完成、實(shí)體識(shí)別和鏈接預(yù)測(cè)等任務(wù)。
知識(shí)圖譜補(bǔ)全(Knowledge Graph Completion,KGC)任務(wù)旨在減少知識(shí)圖譜中的知識(shí)缺失,提高知識(shí)圖譜中知識(shí)的完備程度。因此,若能將知識(shí)圖譜中的這些知識(shí)補(bǔ)全,對(duì)于提升搜索引擎的語(yǔ)義搜索精度、完善知識(shí)問(wèn)答和智能推薦系統(tǒng)的服務(wù)質(zhì)量具有重要的價(jià)值。近年來(lái),各種不同的知識(shí)圖譜補(bǔ)全方法被提出,這些方法大致分為以下三類(lèi),即基于距離的模型,基于語(yǔ)義匹配的模型和基于卷積神經(jīng)網(wǎng)絡(luò)的模型。
(1)基于距離的模型
這些方法的主要思想是先將實(shí)體和關(guān)系映射到同一空間,之后將關(guān)系視為從頭實(shí)體到尾實(shí)體的轉(zhuǎn)換。
TransH在2014年提出,該方法將實(shí)體映射到特定關(guān)系的超平面上,來(lái)滿足不同關(guān)系下的實(shí)體表示,再進(jìn)行轉(zhuǎn)換操作。TransR于2016年提出,該方法針對(duì)每個(gè)關(guān)系學(xué)習(xí)一個(gè)映射矩陣,然后把實(shí)體映射到特定關(guān)系空間中。
(2)基于語(yǔ)義匹配的模型
基于語(yǔ)義匹配的模型提出更復(fù)雜的操作,尋找實(shí)體和關(guān)系之間的語(yǔ)義聯(lián)系。
DistMult在2014年提出,該方法使用使用加權(quán)元素點(diǎn)積來(lái)定義分?jǐn)?shù)函數(shù)。打分函數(shù)定義為fr(h,t)=∑hkrktk。ComplEx在2016年提出,ComplEx是DistMult的一個(gè)改進(jìn)版本,它利用復(fù)數(shù)嵌入和Hermitian點(diǎn)積來(lái)解決反對(duì)稱(chēng)問(wèn)題,而它在反對(duì)稱(chēng)關(guān)系上的性能比TransE或DistMult差。ATTH在2020年提出,該方法利用雙曲線嵌入方法來(lái)捕獲層次和邏輯模式。打分函數(shù)可以被定義為:其中Q(h,r)是雙曲注意力機(jī)制。
(3)基于卷積神經(jīng)網(wǎng)絡(luò)的模型
基于卷積的模型,該模型提出利用卷積來(lái)提升模型的表達(dá)能力,CNN的多層結(jié)構(gòu)具有表達(dá)能力強(qiáng)、參數(shù)效率高的優(yōu)點(diǎn)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110059002.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類(lèi)方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





