[發(fā)明專利]一種基于圖神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)食品實體對齊方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110604291.5 | 申請日: | 2021-05-31 |
| 公開(公告)號: | CN113342809B | 公開(公告)日: | 2023-08-15 |
| 發(fā)明(設(shè)計)人: | 左敏;薛明慧;張青川;顏文婧 | 申請(專利權(quán))人: | 北京工商大學(xué) |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/28;G06F16/951;G06N3/048;G06N3/082 |
| 代理公司: | 北京科迪生專利代理有限責(zé)任公司 11251 | 代理人: | 金怡 |
| 地址: | 100048*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 神經(jīng)網(wǎng)絡(luò) 互聯(lián)網(wǎng) 食品 實體 對齊 方法 系統(tǒng) | ||
本發(fā)明涉及一種基于圖神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)食品實體對齊方法及系統(tǒng),其方法包括:步驟S1:將待對齊的兩個知識圖譜KG1和KG2中三元組進(jìn)行分離,得到關(guān)系三元組和屬性三元組;步驟S2:更新關(guān)系三元組;步驟S3:獲取實體結(jié)構(gòu)特征向量和關(guān)系特征向量;步驟S4:獲取實體特征向量;步驟S5:構(gòu)建實體關(guān)系對齊模型,計算實體特征向量間的距離,實現(xiàn)實體的對齊,計算關(guān)系特征向量間的距離,實現(xiàn)關(guān)系的對齊。本發(fā)明提出的方法,通過對知識圖譜的圖結(jié)構(gòu)進(jìn)行補全和修剪,減少知識圖譜間圖的異構(gòu)性的影響,同時在實體種子有限的情況下,提高了實體種子利用效率和實體對齊正確率。
技術(shù)領(lǐng)域
本發(fā)明涉及知識圖譜和神經(jīng)網(wǎng)絡(luò)領(lǐng)域,具體涉及一種基于圖神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)食品實體對齊方法及系統(tǒng)。
背景技術(shù)
知識圖譜作為機器閱讀、機器翻譯、推薦系統(tǒng)等自然語言處理任務(wù)的基礎(chǔ),不同研究領(lǐng)域建立不同的知識圖譜,創(chuàng)建知識圖譜時目的不同,側(cè)重點不同,導(dǎo)致不同知識圖譜會包含許多互補信息。將這些知識圖譜中互補的信息整合在一起,會提高知識的利用效率,但同一實體在不同的知識圖譜中可能會有不同的表現(xiàn)形式,這時需要實體對齊去解決這個問題。
近年來主要使用基于嵌入的方法對齊不同知識圖譜中的實體,基于嵌入的實體對齊方法包括基于TransE的實體對齊和基于圖神經(jīng)網(wǎng)絡(luò)的實體對齊。基于TransE的方法是根據(jù)實體和關(guān)系在空間中的平移不變性得到實體和關(guān)系的嵌入表示,使用已有的實體對齊種子將不同知識圖譜中的實體和關(guān)系對應(yīng)到一個向量空間。基于TransE的實體對齊方法可以保留知識圖譜的結(jié)構(gòu),但需要大量的實體種子,在現(xiàn)實中難以得到。
基于圖神經(jīng)網(wǎng)絡(luò)的實體對齊是使用圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)知識圖譜中的圖結(jié)構(gòu),根據(jù)圖的結(jié)構(gòu)特征增強實體和其鄰居的信息表示,可以使用實體對齊種子傳播信息到整個圖。目前,基于圖神經(jīng)網(wǎng)絡(luò)的實體對齊方法有關(guān)系圖卷積網(wǎng)絡(luò)(R-GCN),其對多關(guān)系圖建模,為每種關(guān)系分配權(quán)重得到實體間關(guān)系的權(quán)重矩陣;高速門圖卷積(HGCN-JE)使用少量的實體對齊種子學(xué)習(xí)得到實體表示,并將實體表示近似當(dāng)作關(guān)系表示,通過近似關(guān)系表示訓(xùn)練模型。但是不同的知識圖譜由于其側(cè)重點不同,其圖結(jié)構(gòu)也不同,以上方法忽視了圖結(jié)構(gòu)的異構(gòu)型;同時知識圖譜中存在實體的屬性信息,在實體對齊時也沒有使用這部分信息。
綜上所述,目前基于嵌入的實體對齊方法在很大程度上依賴對齊種子,但現(xiàn)實中實體對種子數(shù)量有限,同時忽略了不同知識圖譜中圖結(jié)構(gòu)的異構(gòu)性;另外屬性信息和關(guān)系信息一樣會對實體對齊效果產(chǎn)生影響,學(xué)習(xí)實體嵌入時沒有用到實體的屬性信息。這些問題都會影響實體對齊的效果。因此,如何處理不同知識圖譜中圖結(jié)構(gòu)的異構(gòu)性,在實體種子對數(shù)量少的情況下,提高不同知識圖譜中實體對齊的正確率成為一個亟待解決的問題。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,本發(fā)明提供一種基于圖神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)食品實體對齊方法及系統(tǒng)。
本發(fā)明技術(shù)解決方案為:一種基于圖神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)食品實體對齊方法,包括:
步驟S1:通過網(wǎng)絡(luò)爬蟲獲取食品信息,抽取其中三元組,構(gòu)建待對齊的兩個知識圖譜KG1和KG2,將所述KG1和KG2中三元組進(jìn)行分離,得到關(guān)系三元組和屬性三元組;
步驟S2:對所述關(guān)系三元組推理得到規(guī)則,在KG1和KG2間轉(zhuǎn)移所述規(guī)則,構(gòu)建新的關(guān)系三元組,更新所述關(guān)系三元組,得到更新后的關(guān)系三元組;
步驟S3:根據(jù)所述更新后的關(guān)系三元組,以及自注意力機制和跨注意力機制,計算得到兩個帶自注意力機制權(quán)重和跨注意力機制權(quán)重的鄰接矩陣;并根據(jù)bert預(yù)訓(xùn)練字向量,查詢向量表得到所述三元組中的實體字向量;將兩個所述鄰接矩陣和所述實體字向量輸入圖神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到實體結(jié)構(gòu)特征向量和關(guān)系特征向量;
步驟S4:對所述屬性三元組中的實體輸入前向神經(jīng)網(wǎng)絡(luò)訓(xùn)練,得到實體屬性特征向量;融合所述實體結(jié)構(gòu)特征向量和實體屬性特征向量,得到實體特征向量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工商大學(xué),未經(jīng)北京工商大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110604291.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 基于網(wǎng)絡(luò)電視的互聯(lián)網(wǎng)業(yè)務(wù)處理方法和系統(tǒng)
- 互聯(lián)網(wǎng)業(yè)務(wù)接入網(wǎng)關(guān)的實現(xiàn)方法和系統(tǒng)
- 一種互聯(lián)網(wǎng)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動攝像終端進(jìn)行異地圖像拍攝的系統(tǒng)
- 一種網(wǎng)絡(luò)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 利用區(qū)塊鏈保護(hù)用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 互聯(lián)網(wǎng)廣告裝置及方法
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品





