[發(fā)明專利]一種基于主題關鍵詞過濾的知識圖譜補全方法在審
| 申請?zhí)枺?/td> | 201910245584.1 | 申請日: | 2019-03-28 |
| 公開(公告)號: | CN109977234A | 公開(公告)日: | 2019-07-05 |
| 發(fā)明(設計)人: | 印桂生;張載熙;王紅濱 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 哈爾濱市松花江專利商標事務所 23109 | 代理人: | 劉冰 |
| 地址: | 150001 黑龍江*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 主題關鍵詞 圖譜 過濾 描述文本 冗余 注意力機制 反應實體 描述信息 評分函數 文本過濾 文本內容 語義空間 語義聯(lián)系 噪音信息 可用性 語義 三元組 集合 | ||
一種基于主題關鍵詞過濾的知識圖譜補全方法,屬于知識圖譜領域。現有知識圖譜補全方法的實體描述的文本內容復雜冗余,導致不能對某一特定的補全任務有針對性地進行補全的問題。一種基于主題關鍵詞過濾的知識圖譜補全方法,針對實體的描述信息復雜、冗余的問題,集合注意力機制。提出了主題關鍵詞評分函數,對實體的描述進行評價提高了實體描述文本的可用性,解決描述文本存在大量噪音信息的問題。為了進一步反應實體描述與三元組的語義聯(lián)系,通過主題語義空間模型提高實體描述的語義針對性。本發(fā)明通過文本過濾方法能夠有針對性地完成特定補全任務。
技術領域
本發(fā)明涉及一種知識圖譜補全方法,特別涉及基于實體描述中的主題關鍵詞對實體描述文本過濾的知識圖譜補全方法。
背景技術
知識圖譜技術在智能問答和搜索領域應用廣泛。目前,通過知識圖譜技術構建的知識庫的雖然規(guī)模宏大,但是其完整程度仍然不高。圖譜中大部分的實體沒有出生地信息、也沒有國籍信息,對于一半的實體所包含的關系數量不超過5個,因而有必要對知識圖譜進行補全。知識圖譜圖譜的方法可以分為兩類:一類是非翻譯型補全方法,另一類是翻譯型補全方法。相較于非翻譯型方法,采用翻譯模型的算法涉及的計算參數少,算法復雜度低。目前的研究者已經考慮采用多源信息融合的方式對知識圖譜補全。實際上,知識庫中不僅包含由大量的實體和關系構成的三元組,還包含了大量的關于三元組中的實體的描述文本信息。已有的知識圖譜方法已經考慮采用將翻譯模型和實體的描述信息結合的方式對知識圖譜進行補全。然而實體的描述來源廣泛,大部分的文本內容抽取自百科和網頁,文本的內容復雜冗余,并不能有針對性地對某一特定的補全任務進行補全。本發(fā)明就是在這樣的背景下提出的。目前,對于知識圖譜補全任務,無論國內還是國外,都在積極的研究,學者們提出了多種模型方法和相應的算法,它們針對不同的網絡模型和具體的實際問題,各有特點。本發(fā)明在前人的模型和觀點上提出了基于主題關鍵詞過濾的知識圖譜補全方法。
發(fā)明內容
本發(fā)明的目的是為了解決現有知識圖譜補全方法的實體描述的文本內容復雜冗余,導致不能對某一特定的補全任務有針對性地進行補全的問題,而提出一種基于主題關鍵詞過濾的知識圖譜補全方法。
一種基于主題關鍵詞過濾的知識圖譜補全方法,所述的方法通過以下步驟實現:
步驟1:設定知識圖譜G=(E,R,T);其中,E表示知識圖譜實體集合,R表示知識圖譜中關系集合,T表示待補全的三元組集合,
步驟2:將知識圖譜G中不完整的三元組元素構成的集合設定為補全任務集合H,H中的元素分為(h,r,?)和(h,?,t)兩種形式;其中,頭實體h∈E,關系r∈R,尾實體t∈E;
步驟3:使用詞向量工具對待補全的三元組集合T中的h和r進行訓練,針對(h,r,?)任務得到h′和r′,針對(h,?,t)任務得到h′和t′;
步驟4:使用詞向量工具對三元組集合T中實體的實體描述進行處理,得到主題計算詞向量矩陣,包括:頭實體描述的詞向量矩陣De和尾實體描述的詞向量矩陣Dt;
步驟5:通過NMF模型分別對頭實體h和尾實體t的實體描述進行處理,獲取頭實體和尾實體的主題向量sh和st;
步驟6:利用步驟5獲取的主題向量sh和st來計算主題語義空間s(sh,st):
其中,向量s為主題語義空間的法向量;
步驟7:獲取主題計算詞向量矩陣De和Dt的注意力分數,再根據注意力分數選取主題詞;并對詞向量矩陣De和Dt進行注意力分數的賦值;其中,獲取注意力分數的公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910245584.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種成語知識圖譜構建方法及裝置
- 下一篇:一種觸發(fā)詞的確定方法和裝置





