[發明專利]一種基于元學習的領域知識圖譜補全方法有效
| 申請號: | 201911385727.5 | 申請日: | 2019-12-27 |
| 公開(公告)號: | CN111046193B | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 葉寧;張浩哲;徐康;王娟;黃海平;程晶晶;王汝傳;陳瑩;徐超;查猛 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06K9/62 |
| 代理公司: | 南京正聯知識產權代理有限公司 32243 | 代理人: | 張玉紅 |
| 地址: | 210023 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 學習 領域 知識 圖譜 方法 | ||
本發明的目的是提供了一種基于元學習的領域知識圖譜補全方法,提供一種知識圖譜補全方式,僅依靠領域知識圖譜中的少量樣本實現實體補全和新知識的快速部署,從而提高領域知識圖譜補全的效率。克服了小樣本領域知識圖譜難以自動處理、人工處理成本高的問題,通過元學習方法實現了在小樣本領域中有效的三元組向量表示的獲得方法。訓練的元關系向量對于任務的改變具有敏感性,其訓練過程相對普通的表示學習過程只增加了一個參數,在面對新領域知識時可以達到快速部署的效果,提高了計算效率。可擴展性強,可以適應表示學習中的多種損失函數,可以隨效率和精度要求靈活更改損失函數。
技術領域
本發明涉及人工智能中的知識圖譜領域,尤其涉及一種基于元學習的領域知識圖譜補全方法。
背景技術
知識庫是人類知識組成的結構化的知識系統,Google于2012年將其搜索引擎中使用的知識庫命名為知識圖譜。目前海內外均以“知識圖譜”泛指各種知識庫。作為人工認知智能的重要基礎技術,知識圖譜被普遍應用于智能檢索、知識問答、數據整合、輔助決策等領域。現有的知識圖譜普遍存在數據稀疏,完備性不足的問題,大量實體間的隱含關系還未被發現,需要通過知識圖譜補全方法進行完善和補充。在知識圖譜補全等任務中主要采用表示學習技術,利用機器學習算法將知識圖譜中實體和關系映射到低維的向量空間,得到知識的分布式表示。在低維空間中,實體和關系的稠密向量表示解決了數據稀疏的問題,同時可以進行的高效語義計算,通過算法實現知識圖譜中的實體和關系補全。現有的表示學習模型依賴豐富的訓練樣本以達到良好的效果。
按照內容涵蓋的范圍,知識圖譜可以分為通用知識圖譜和領域知識圖譜兩種。領域知識圖譜具有知識內容范圍有限,專業性強的特點,這也意味著在領域知識圖譜的補全任務中往往需要專家知識和人工標注,導致樣本數量有限、自動化程度低、成本高等問題。
發明內容
針對現有技術的不足,本發明的目的是提供了一種基于元學習的領域知識圖譜補全方法,由于現有的領域知識圖譜樣本數量少,樣本依賴人工標注,難以自動形成有效的知識三元組分布式表示,利用元學習方法,提供一種知識圖譜補全方式,僅依靠領域知識圖譜中的少量樣本實現實體補全和新知識的快速部署,從而提高領域知識圖譜補全的效率。
本發明提供一種基于元學習的領域知識圖譜補全方法,所述方法步驟如下:
步驟1:在通用知識圖譜中提取領域相關范圍內的實體關系三元組,定義為補全任務的元訓練集DTrain;
步驟2:將待補全的小樣本領域知識圖譜中的三元組定義為補全任務的元測試集DTest;
步驟3:對DTrain和DTest中所有三元組進行初始化處理,得到向量表示的三元組(h,r,t),其中h為頭實體向量,r為關系向量,t為尾實體向量,(h,r,t)∈G,G為三元組樣本集,h,t∈E,E為實體集,r∈R,R為關系集;
步驟4:對步驟1得到的元訓練集DTrain,將所有具有同一關系的三元組加入同一集合,定義為該關系對應的關系任務Tr,Tr∈T,T為所有關系任務構成的任務池;
步驟5:在任務池T中隨機抽取一項任務Tr,取出NS個三元組樣本作為該任務的支持集Sr,剩下的NQ個樣本作為該任務的詢問集Qr,其中NSNQ;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911385727.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種起毛機構
- 下一篇:家庭衣物洗護設備除味性能測試方法





