[發(fā)明專利]一種基于多種實(shí)體上下文的實(shí)體對齊方法有效
| 申請?zhí)枺?/td> | 202110346496.8 | 申請日: | 2021-03-31 |
| 公開(公告)號: | CN112988917B | 公開(公告)日: | 2022-11-18 |
| 發(fā)明(設(shè)計(jì))人: | 吳天星;李林;漆桂林 | 申請(專利權(quán))人: | 東南大學(xué) |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/36;G06F40/216;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 南京眾聯(lián)專利代理有限公司 32206 | 代理人: | 張?zhí)煺?/td> |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多種 實(shí)體 上下文 對齊 方法 | ||
本專利公開了一種基于多種實(shí)體上下文的實(shí)體對齊方法,主要處理因?yàn)閷?shí)體結(jié)構(gòu)異構(gòu)性、實(shí)體屬性異構(gòu)性以及實(shí)體文本描述異構(gòu)性引起的實(shí)體對齊困難問題。對于實(shí)體結(jié)構(gòu)異構(gòu)性問題,本專利使用TransE和RDF2Vec方法分別處理一跳和多跳結(jié)構(gòu)信息,獲取實(shí)體結(jié)構(gòu)編碼。對于實(shí)體屬性異構(gòu)性,本專利使用圖卷積網(wǎng)絡(luò)技術(shù)和圖注意力機(jī)制,對每個(gè)實(shí)體按其屬性的重要性提取其屬性、屬性值的信息,并映射到低維稠密的向量空間中。對于實(shí)體文本描述異構(gòu)性,本專利使用預(yù)訓(xùn)練語言模型BERT獲取文本語義信息,基于種子對齊實(shí)體信息進(jìn)行模型的訓(xùn)練和學(xué)習(xí),將實(shí)體的文本信息映射到低維稠密的向量空間。最后,本專利使用拼接技術(shù)和多視角技術(shù)對多種實(shí)體上下文進(jìn)行聯(lián)合對齊學(xué)習(xí)。
技術(shù)領(lǐng)域
本專利屬于實(shí)體對齊領(lǐng)域,涉及一種基于多種實(shí)體上下文的實(shí)體對齊方法。
背景技術(shù)
近年來,知識圖譜作為一種結(jié)構(gòu)化的知識形式已經(jīng)引起了學(xué)術(shù)界和工業(yè)界的極大關(guān)注。知識圖譜(Knowledge Graph)的概念由Google于2012年正式提出,其目的是將大規(guī)模知識整合在一起,分析用戶查詢背后的語義信息,返回更準(zhǔn)確和結(jié)構(gòu)化的信息,更大可能地滿足用戶的查詢需求。盡管谷歌公司最初提出知識圖譜是為了增強(qiáng)搜索結(jié)果,改善用戶體驗(yàn),但目前知識圖譜已經(jīng)逐漸演變?yōu)橐环N通用的技術(shù),很多機(jī)構(gòu)都開始構(gòu)建自己的知識圖譜,例如微軟公司的ConceptNet,卡內(nèi)基梅隆大學(xué)的NELL,東南大學(xué)的Zhishi.me等等,這些知識圖譜被廣泛應(yīng)用于許多基于知識的應(yīng)用中。由于知識圖譜可以由任何機(jī)構(gòu)和個(gè)人自由構(gòu)建,其背后的數(shù)據(jù)寬泛且質(zhì)量參差不齊,導(dǎo)致了它們之間的多樣性和異構(gòu)性。例如,對于相交的領(lǐng)域(甚至相同的領(lǐng)域),在現(xiàn)實(shí)世界中經(jīng)常有多個(gè)不同的實(shí)體指代同一事物。實(shí)體對齊的目標(biāo)就是將不同的知識圖融合為一個(gè)統(tǒng)一,一致且簡潔的知識圖譜,并為使用不同知識圖譜的應(yīng)用程序之間的交互建立互操作性。
本專利提出的基于多種實(shí)體上下文的實(shí)體對齊方法,主要用于處理因?yàn)閷?shí)體結(jié)構(gòu)異構(gòu)性、實(shí)體屬性異構(gòu)性以及實(shí)體文本描述異構(gòu)性等引起的實(shí)體對齊困難問題。對于實(shí)體結(jié)構(gòu)異構(gòu)性問題,本專利使用TransE和RDF2Vec方法分別學(xué)習(xí)實(shí)體的一跳和多跳結(jié)構(gòu)信息,將實(shí)體從多維稀疏的實(shí)體空間映射到低維稠密的向量空間。對于實(shí)體屬性異構(gòu)性,本專利使用圖卷積網(wǎng)絡(luò)技術(shù)和圖注意力機(jī)制,對每個(gè)實(shí)體按其屬性的重要性提取其所有屬性、屬性值的信息,并映射到低維稠密的向量空間中。對于實(shí)體文本描述異構(gòu)性,本專利使用當(dāng)前最流行的BERT學(xué)習(xí)文本的語法結(jié)構(gòu)信息和語義信息,基于種子對齊實(shí)體信息進(jìn)行模型的訓(xùn)練和學(xué)習(xí),將實(shí)體的文本信息映射到低維稠密的向量空間。最后,本專利使用拼接技術(shù)和多視角技術(shù)對多種實(shí)體上下文進(jìn)行聯(lián)合對齊學(xué)習(xí)。
相比較已有的實(shí)體對齊方法,本方法考慮了實(shí)體的多種上下文,并提出了兩種聯(lián)合對齊學(xué)習(xí)模型,只需要少量的人工標(biāo)注對齊實(shí)體,即可自動(dòng)化的完成知識圖譜實(shí)體對齊。
專利內(nèi)容
技術(shù)問題:本專利提供了一種基于多種實(shí)體上下文的實(shí)體對齊方法,只需要人工標(biāo)注少量的種子對齊實(shí)體,即可自動(dòng)化的完成知識圖譜實(shí)體對齊。
技術(shù)方案:本專利公開了一種基于多種實(shí)體上下文的實(shí)體對齊方法,主要用于處理因?yàn)閷?shí)體結(jié)構(gòu)異構(gòu)性、實(shí)體屬性異構(gòu)性以及實(shí)體文本描述異構(gòu)性等引起的實(shí)體對齊困難問題。對于實(shí)體結(jié)構(gòu)異構(gòu)性問題,本專利使用TransE和RDF2Vec方法分別學(xué)習(xí)實(shí)體的一跳和多跳結(jié)構(gòu)信息,將實(shí)體從多維稀疏的實(shí)體空間映射到低維稠密的向量空間。對于實(shí)體屬性異構(gòu)性,本專利使用圖卷積網(wǎng)絡(luò)技術(shù)和注意力機(jī)制,對每個(gè)實(shí)體按其屬性的重要性提取出綜合其所有屬性、屬性值的信息,并映射到低維稠密的向量空間中。對于實(shí)體文本描述異構(gòu)性,本專利使用當(dāng)前最流行的BERT學(xué)習(xí)文本的語法結(jié)構(gòu)信息和語義信息,基于種子對齊實(shí)體信息進(jìn)行模型的訓(xùn)練和學(xué)習(xí),將實(shí)體的文本信息映射到低維稠密的向量空間。最后,本專利使用拼接技術(shù)和多視角技術(shù)對多種實(shí)體上下文的向量使用聯(lián)合對齊學(xué)習(xí)。
本專利提出的基于多種實(shí)體上下文的實(shí)體對齊方法,包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學(xué),未經(jīng)東南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110346496.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)實(shí)體監(jiān)控方法及裝置
- 一種實(shí)體鏈接方法及裝置
- 一種基于深度學(xué)習(xí)的實(shí)體鏈接方法
- 實(shí)體發(fā)現(xiàn)方法及裝置
- 一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種實(shí)體關(guān)系識別方法、裝置及設(shè)備
- 尾實(shí)體鏈接方法、裝置、服務(wù)器及存儲介質(zhì)
- 基于實(shí)體對齊的屬性融合方法、裝置、設(shè)備及存儲介質(zhì)
- 一種實(shí)體召回方法及相關(guān)裝置
- 實(shí)體表征模型的訓(xùn)練和表征方法、電子設(shè)備和存儲介質(zhì)
- 自動(dòng)創(chuàng)建上下文信息提供配置的系統(tǒng)
- 用于管理上下文的方法、系統(tǒng)和裝置
- 一種基于本體的上下文感知應(yīng)用平臺框架模型
- 一種基于上下文感知的智能家居系統(tǒng)
- 實(shí)現(xiàn)上下文感知業(yè)務(wù)應(yīng)用的方法和相關(guān)裝置
- 一種多推理引擎融合上下文感知系統(tǒng)及其工作方法
- 多個(gè)并發(fā)上下文虛擬演進(jìn)型會(huì)話管理(虛擬ESM)
- 一種基于異質(zhì)上下文感知的推薦方法
- 一種可提高上下文質(zhì)量的本體建模方法及裝置
- 微服務(wù)全局上下文控制方法及系統(tǒng)





