[發明專利]一種基于知識圖譜的認知語言詞典補全方法在審
| 申請號: | 202210274667.5 | 申請日: | 2022-03-18 |
| 公開(公告)號: | CN114691885A | 公開(公告)日: | 2022-07-01 |
| 發明(設計)人: | 楊旭華;金鑫;張宇辰;葉蕾;陳昊楠;朱慷亮 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 杭州天正專利事務所有限公司 33201 | 代理人: | 舒良 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 認知 語言 詞典 方法 | ||
一種基于知識圖譜的認知語言詞典補全方法,首先根據認知語言詞典原始結構信息計算出認知語言詞典中實體的重要性,接著根據實體間的關系信息,生成高質量的負三元組集合,再計算出三元組中實體在關系所處的超平面上的投影向量,最后聯合實體的重要性、高質量負三元組,以及認知語言詞典嵌入模型計算出認知語言詞典實體嵌入向量和關系嵌入向量;通過計算頭實體、關系和尾實體在殘缺三元組中距離評分,得到認知語言詞典補全結果。本發明考慮了認知語言詞典的實體重要性以及負三元組信息,準確性較高,補全效果好。
技術領域
本發明涉及知識圖譜領域,特別是指一種基于知識圖譜的認知語言詞典補全方法。
背景技術
伴隨著網絡與大數據技術的飛速發展,網絡上的各項信息服務也迅猛發展,認知語言詞典包含了人們日常能接觸的詞條信息,能夠滿足人們對日常詞匯查詢的需求。
認知語言詞典的補全是指通過知識圖譜補全的手段,對認知語言詞典已知的內部語義信息進行提取,去預測殘缺的實體或關系信息。基于知識圖譜的認知語言詞典補全方法是基于認知語言詞典結構特性,以及實體或關系之間的語義信息,給出缺失實體的概率排名,根據條件選取排名最高的實體作為三元組補全的結果。由于認知語言詞典數據的數據復雜而龐大,認知語言詞典補全算法的準確度就顯得十分重要。由于認知語言詞典補全過程中,實體重要性和負三元組信息起到了重要的補充作用,所以在補全過程同時考慮實體重要性和負三元組信息就顯得十分重要。
發明內容
為了克服現有的一些對認知語言詞典補全方法對實體或關系預測的準確度低,更全面的獲取認知語言詞典的結構信息,本發明提出了一種基于知識圖譜的認知語言詞典補全方法。
本發明解決其技術問題所采用的具體步驟是:
一種基于知識圖譜的認知語言詞典補全方法,包括如下步驟:
步驟1:具有N個實體和M種關系的以知識圖譜表示的認知語言詞典表示為G=(E,R,T),其中E={e1,…,ei,...,eN}表示認知語言詞典中單詞實體集合,ei為第i個單詞實體,R={r1,r2,...,rM}表示關系的集合;T∈E×R×E表示認知語言詞典中所有的三元組(h,r,t)集合,其中h∈E表示三元組的頭實體,t∈E表示三元組的尾實體,r∈R表示三元組中連接h和t的關系;
步驟2:任意選取一個實體ei,計算實體的度相關性:
其中,In(ei)表示實體ei的所有入度之和,遍歷認知語言詞典的所有實體,得到所有實體的度相關性;
步驟3:任意選取一個三元組,計算該三元組中頭實體和尾實體的重要性:
其中,Eimp(ei)表示實體ei的重要性,ei表示該三元組的頭實體或者尾實體,d為阻尼系數,ej為與ei相連的實體,Γ(ei)表示與ei相連的實體集合,遍歷認知語言詞典中所有的三元組,計算相應三元組中頭實體和尾實體的重要性;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210274667.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于輻照貨物吊箱自動換層的方法及裝置
- 下一篇:一種紅土鎳礦的冶煉工藝





