[發(fā)明專利]一種基于知識圖譜的認知語言詞典補全方法在審
| 申請?zhí)枺?/td> | 202210274667.5 | 申請日: | 2022-03-18 |
| 公開(公告)號: | CN114691885A | 公開(公告)日: | 2022-07-01 |
| 發(fā)明(設(shè)計)人: | 楊旭華;金鑫;張宇辰;葉蕾;陳昊楠;朱慷亮 | 申請(專利權(quán))人: | 浙江工業(yè)大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 杭州天正專利事務(wù)所有限公司 33201 | 代理人: | 舒良 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 知識 圖譜 認知 語言 詞典 方法 | ||
1.一種基于知識圖譜的認知語言詞典補全方法,包括如下步驟:
步驟1:具有N個實體和M種關(guān)系的以知識圖譜表示的認知語言詞典表示為G=(E,R,T),其中E={e1,…,ei,...,eN}表示認知語言詞典中單詞實體集合,ei為第i個單詞實體,R={r1,r2,...,rM}表示關(guān)系的集合;T∈E×R×E表示認知語言詞典中所有的三元組(h,r,t)集合,其中h∈E表示三元組的頭實體,t∈E表示三元組的尾實體,r∈R表示三元組中連接h和t的關(guān)系;
步驟2:任意選取一個實體ei,計算實體的度相關(guān)性:
其中,In(ei)表示實體ei的所有入度之和,遍歷認知語言詞典的所有實體,得到所有實體的度相關(guān)性;
步驟3:任意選取一個三元組,計算該三元組中頭實體和尾實體的重要性:
其中,Eimp(ei)表示實體ei的重要性,ei表示該三元組的頭實體或者尾實體,d為阻尼系數(shù),ej為與ei相連的實體,Γ(ei)表示與ei相連的實體集合,遍歷認知語言詞典中所有的三元組,計算相應(yīng)三元組中頭實體和尾實體的重要性;
步驟4:對認知語言詞典中所有相同類型關(guān)系所連接的所有頭實體和尾實體打上與其類型相同的標簽;任意選取一個正三元組(h,r,t),頭實體以tph/(tph+hpt)的概率被替換為標簽不同的其它實體,尾實體以hpt/(tph+hpt)的概率被替換為標簽不同的其它實體來構(gòu)建負三元組(h′,r,t′),其中tph為一個頭實體的平均尾實體數(shù),hpt是一個尾實體的平均頭實體數(shù),h′和t′分別表示負三元組中的頭實體和尾實體;遍歷以知識圖譜表示的認知語言詞典中正三元組集合S中所有的三元組,重復執(zhí)行步驟4,得到替換實體后的負三元組集合S′;
步驟5:認知語言詞典的實體和關(guān)系將要分別映射為d維實體嵌入向量和關(guān)系嵌入向量,其中第i個實體嵌入向量表示為第i個關(guān)系嵌入向量表示為βri={βri1,βri2,...,βrid};所有實體嵌入向量構(gòu)成了實體嵌入向量集合表示為所有關(guān)系嵌入向量構(gòu)成的關(guān)系嵌入向量集合表示為Rv={βr1,βr2,...,βrM};從區(qū)間隨機抽取d維數(shù)據(jù)填充Ev和Rv作為初始實體嵌入向量集合和初始關(guān)系嵌入向量集合;
步驟6:任選一個三元組Ti,計算該三元組中實體的投影向量
其中,wi表示關(guān)系βri所處的超平面上的法向量,是頭實體嵌入向量或者尾實體嵌入向量,遍歷認知語言詞典中所有三元組,得到所有三元組中的頭實體和尾實體的投影向量;
步驟7:計算評分函數(shù):
其中,γ表示邊界值,dis(h⊥+r,t⊥)為以L2范數(shù)計算的頭實體的投影向量h⊥與關(guān)系r嵌入向量之和與尾實體的投影向量t⊥之間的距離,dis(h⊥′+r,t⊥′)為負三元組中頭實體的投影向量h′⊥與關(guān)系r嵌入向量之和與尾實體的投影向量t′⊥之間的距離;
步驟8:利用隨機梯度下降方法優(yōu)化評分函數(shù),將實體嵌入向量集合更新為關(guān)系嵌入向量集合更新為
步驟9:重復執(zhí)行步驟6~步驟8,當于指定的最小損失值后,結(jié)束計算,得到最后的實體嵌入向量集合和關(guān)系嵌入向量集合
步驟10:從認知語言詞典任意選取殘缺實體的三元組(hi,ri,?),其中?表示待補全的實體,遍歷實體集合,計算dis(hi+ri,tj),j≠i,其中tj表示實體集合中的任意實體;選取數(shù)值最小的dis對應(yīng)的實體tv作為當前三元組補全結(jié)果,得到補全的三元組(hi1,ri,tv);
步驟11:遍歷認知語言詞典中所有的殘缺三元組,重復執(zhí)行步驟10,得到補全完整的認知語言詞典。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學,未經(jīng)浙江工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210274667.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種用于輻照貨物吊箱自動換層的方法及裝置
- 下一篇:一種紅土鎳礦的冶煉工藝
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法
- 一種認知無線網(wǎng)絡(luò)系統(tǒng)和認知網(wǎng)元設(shè)備
- 認知無線電網(wǎng)絡(luò)中小區(qū)邊界用戶的頻譜共享方法
- 基于頻譜襯墊和填充的認知OFDM網(wǎng)絡(luò)資源分配方法
- 認知障礙數(shù)據(jù)處理方法以及處理系統(tǒng)
- 一種認知無線電頻譜共享方法、設(shè)備和系統(tǒng)
- 認知無線電系統(tǒng)的頻譜共享方法及管理終端
- 一種具有仿反饋調(diào)整機制的脫機手寫體漢字認知方法
- 一種基于人件服務(wù)的態(tài)勢認知計算架構(gòu)
- 一種認知評估的信息化方法、系統(tǒng)及可讀存儲介質(zhì)
- 一種認知負荷評價方法、裝置、系統(tǒng)及存儲介質(zhì)





