[發明專利]復雜尾實體拆分鏈接方法、裝置、電子設備和存儲介質有效
| 申請號: | 202010188487.6 | 申請日: | 2020-03-17 |
| 公開(公告)號: | CN111414439B | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 何瑩;陳志剛;李直旭;張大雷 | 申請(專利權)人: | 科大訊飛(蘇州)科技有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 215021 江蘇省蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 復雜 實體 拆分 鏈接 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例提供一種復雜尾實體拆分鏈接方法和裝置,其中方法包括:確定復雜尾三元組中的復雜尾關系和復雜尾實體;將復雜尾關系和復雜尾實體輸入至實體拆分鏈接模型,得到實體拆分鏈接模型輸出的多個簡單實體的鏈接結果;其中,實體拆分鏈接模型用于將復雜尾實體拆分為多個簡單實體,并基于復雜尾關系在知識圖譜中對應的標簽集,分別對多個簡單實體進行鏈接。本發明實施例提供的復雜尾實體拆分鏈接方法和裝置,通過將復雜尾實體拆分為多個簡單實體,并基于復雜尾關系在知識圖譜中對應的標簽集,分別對多個簡單實體進行鏈接,實現復雜尾實體的拆分,且擴充了簡單實體的語義信息,提高了簡單實體鏈接的準確性。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種復雜尾實體拆分鏈接方法、裝置、電子設備和存儲介質。
背景技術
隨著人工智能技術的迅猛發展,知識圖譜作為人工智能技術發展和應用的關鍵技術之一,被廣泛應用于智能搜索、智能問答、個性化推薦等領域。知識圖譜將知識組織成三元組形式,以描述現實世界中各個實體及實體間的關系。然而,現有的通用知識圖譜中存在大量的復雜尾三元組,即三元組中的尾實體由多個簡單實體組成,且這些簡單實體均未被鏈接到知識圖譜中。因此,需要將復雜尾實體進行拆分,再將拆分后的實體鏈接到知識圖譜中。
現有的基于Infobox的實體鏈接方法,僅解決三元組尾實體是簡單實體的鏈接問題,且通常將人工標注的特征輸入到傳統機器學習模型中以獲得結果,能夠獲取的信息較少,導致鏈接的準確性較低。因此,基于Infobox的實體鏈接方法,無法有效解決信息繁冗、數據情況復雜的通用知識圖譜中復雜尾實體的拆分鏈接問題。
發明內容
本發明實施例提供一種復雜尾實體拆分鏈接方法、裝置、電子設備和存儲介質,用以解決現有的鏈接方法無法對復雜尾實體進行拆分鏈接,鏈接準確性低的問題。
第一方面,本發明實施例提供一種復雜尾實體拆分鏈接方法,包括:
確定復雜尾三元組中的復雜尾關系和復雜尾實體;
將所述復雜尾關系和復雜尾實體輸入至實體拆分鏈接模型,得到所述實體拆分鏈接模型輸出的多個簡單實體的鏈接結果;
其中,所述實體拆分鏈接模型是基于樣本復雜尾三元組中的樣本復雜尾關系、樣本復雜尾實體、所述樣本復雜尾實體中每一樣本簡單實體的樣本鏈接結果,以及知識圖譜訓練得到的;
所述實體拆分鏈接模型用于將所述復雜尾實體拆分為多個簡單實體,并基于所述復雜尾關系在所述知識圖譜中對應的標簽集,分別對所述多個簡單實體進行鏈接。
可選地,所述將所述復雜尾關系和復雜尾實體輸入至實體拆分鏈接模型,得到所述實體拆分鏈接模型輸出的多個簡單實體的鏈接結果,具體包括:
將所述復雜尾實體輸入至所述實體拆分鏈接模型的實體拆分層,得到所述實體拆分層輸出的多個簡單實體;
將所述復雜尾關系和任一簡單實體輸入至所述實體拆分鏈接模型的實體鏈接層,得到所述實體鏈接層輸出的所述任一簡單實體的鏈接結果。
可選地,所述將所述復雜尾實體輸入至所述實體拆分層,得到所述實體拆分層輸出的多個簡單實體,具體包括:
將所述復雜尾實體輸入至所述實體拆分層的特征提取層,得到所述特征提取層輸出的所述復雜尾實體中每個字的上下文特征;
將每個字的上下文特征,以及所述復雜尾關系輸入至所述實體拆分層的關系轉置層,得到所述關系轉置層輸出的每個字的字表示向量;
將每一字的字表示向量輸入至所述實體拆分層的實體輸出層,得到所述實體輸出層輸出的多個簡單實體。
可選地,所述將每個字的上下文特征,以及所述關系輸入至所述實體拆分層的關系轉置層,得到所述關系轉置層輸出的每個字的字表示向量,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛(蘇州)科技有限公司,未經科大訊飛(蘇州)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010188487.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種膜式熱滲透發電和液體除濕集成系統
- 下一篇:業務處理方法及裝置





