[發明專利]一種文本增強的網絡表示學習方法有效
| 申請號: | 201810336473.7 | 申請日: | 2018-04-13 |
| 公開(公告)號: | CN108536844B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 楊博;楊爽 | 申請(專利權)人: | 吉林大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/901 |
| 代理公司: | 北京君泊知識產權代理有限公司 11496 | 代理人: | 王程遠 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 增強 網絡 表示 學習方法 | ||
1.一種文本增強的網絡表示學習方法,其特征在于,包括:
1)、建立基于網絡拓撲結構的無向圖,所述無向圖包括多個節點的集合、多條邊的集合、以及和節點相關的文本信息集合;
2)、根據網絡拓撲結構的無向圖,對每對節點之間進行多階相似性建模,得到最終的相似度矩陣,對相似度矩陣進行非負矩陣分解,得到第一目標函數,構建網絡結構模型;
3)、根據網絡節點的文本信息,將網絡節點的文本信息表示為文檔-詞項矩陣,基于非負矩陣分解的文本聚類方法,將文本-詞項矩陣分解成兩個非負的矩陣,得到第二目標函數,構建文本信息模型;
4)、根據文本簇的表示矩陣,獲取第三目標函數,并根據第三目標函數將網絡結構模型和文本信息模型統一在完整框架下,得到最終的節點表示矩陣,以使得節點表示包含有用信息。
2.根據權利要求1所述的文本增強的網絡表示學習方法,其特征在于,所述步驟1)包括:
設G=(V,E,T)表示無向圖,其中V表示n個節點的集合,E表示e條邊的集合,T表示和節點相關的文本信息集合。
3.根據權利要求2所述的文本增強的網絡表示學習方法,其特征在于,所述步驟2包括對每對節點之間進行一階和二階相似性建模,具體包括以下步驟:
2.1、一階相似性建模:
給定鄰接矩陣A,對于任意一對節點,如果該對節點之間存在一條邊Aij0,則該對節點之間的一階相似度大于零,否則為零;其中,i,j分別表示節點編號;
2.2、定義Xi(1)=(Ai,1,...,Ai,n)表示節點i的一階相似度向量,Xj(1)=(Aj,1,...,Aj,n)表示節點j的一階相似度向量;使用和Xj(1)的余弦相似度作為節點i和節點j的二階相似度,所述二階相似度的取值范圍為0到1;
2.3、獲取相似度矩陣為X=X(1)+5*X(2);
2.4、對相似度矩陣X進行非負矩陣分解,生成兩個非負的矩陣和其中,M表示基矩陣,U表示系數矩陣,矩陣U的第i行為節點i的向量表示,(d≤n)為節點表示向量的維度;為了近似相似度矩陣X,得到第一目標函數:
4.根據權利要求3所述的文本增強的網絡表示學習方法,其特征在于,所述步驟3)包括:
3.1、將網絡節點的文本信息表示為文檔-詞項矩陣,其中,n表示網絡中節點的個數,即文本的個數,m表示詞項的個數;
3.2、將文本-詞項矩陣分解成兩個非負的矩陣和得到第二目標函數為:
其中,矩陣Q中的元素Qij表示節點i隸屬于文本簇j的程度,矩陣V中的元素Vij表示詞項i與簇j相關的程度。
5.根據權利要求4所述的文本增強的網絡表示學習方法,其特征在于,所述步驟4)包括:
4.1、根據文本簇的表示矩陣獲取中間目標函數:
其中,矩陣C的第z行是第z個簇的表示向量,它的維度為d,和節點表示向量的維度相同;
4.2、通過中間目標函數(3),在由公式(1)表示的網絡結構模型和由公式(2)表示的文本模型之間建立連接,獲取第三目標函數:
其中,α是一個大于零的參數,用來調整文本信息對學習節點表示的貢獻,β是一個大于零的參數,通過輔助的文本簇表示矩陣C,節點表示矩陣U被投影到文本聚類隸屬度矩陣Q的空間中,從而在二者之間建立了一致性關系。
6.根據權利要求5所述的文本增強的網絡表示學習方法,其特征在于,所述4.2后還包括對第三目標函數進行優化,具體包括對:
A、采用乘性迭代規則更新M,并保持其它參數V,C不變:
B、采用乘性迭代規則更新V,并保持其它參數M,C不變:
C、采用乘性迭代規則更新C,并保持其它參數M,V不變:
D、更新U并保持其余參數不變:
E、更新Q并保持其余參數不變:
由于公式(9)被重寫為:
用Φ=[Φij]表示針對約束Q≥0的拉格朗日乘子矩陣,對應的拉格朗日乘數函數寫為:
將L′(Q)關于Q的偏導數設置為零:
通過引入Karush-Kuhn-Tucker(KKT)條件ΦijQij=0,得到更新規則:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810336473.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種涉黃網站主動舉報系統
- 下一篇:殘缺數據庫文件檢驗方法





