[發明專利]一種用于關系圖數據的卷積分類方法及系統有效
| 申請號: | 201910080643.4 | 申請日: | 2019-01-28 |
| 公開(公告)號: | CN109918542B | 公開(公告)日: | 2021-12-17 |
| 發明(設計)人: | 許勇;周恒晟 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/215;G06F16/2458 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 關系 數據 卷積 分類 方法 系統 | ||
1.一種用于關系圖數據的卷積分類方法,其特征在于,具體步驟包括:
(1)導入原始數據樣本,對數據樣本進行采樣、清洗及預處理;
(2)選定關系屬性和標簽屬性,對其余屬性進行編碼操作;
關系屬性為“是否注冊同一課程”,標簽屬性為“學生在對應課程的最終成績”;對學生數據樣本屬性進行編碼,具體為:對字符型的屬性進行獨熱編碼處理,對數值型屬性進行標準化編碼處理;
構建數據集,具體為:構建六個與樣本數據集等長的數組,其中train mask、valmask、test mask對應訓練集、驗證集和測試集的特征向量集;y train、y val、y test對應訓練集、驗證集和測試集的標簽向量集;其中M表示樣本數據集的長度;當某一個數據樣本被劃分進訓練集時,train mask中的對應位置被設為True,其余特征向量集中對應位置被設為False;y train中的對應位置被設為該數據樣本的標簽,其余標簽向量集保持默認值;以此類推完成數據集的劃分;
(3)根據選定的關系屬性,構建關系圖數據并計算關系圖的拉普拉斯矩陣和切比雪夫多項式的系數;
(4)對關系圖數據進行分類訓練和交叉檢驗;
(5)根據訓練和檢驗結果對關系圖卷積模型的參數進行調節,得到最優分類器;
原始數據樣本為同一種類考核安排的課程并采集學生基本信息表中注冊過這些課程學生數據樣本;
所述步驟(4)中,對數據樣本按照一定比例隨機分為訓練集、驗證集和測試集;設定模型結構參數,包括輸入數據尺寸、圖卷積層數量、隱藏層大小;所述訓練參數包括學習速率、迭代次數、正則項系數、提前停止的限度。
2.根據權利要求1所述的一種用于關系圖數據的卷積分類方法,其特征在于,所述步驟(1)中,對數據樣本預處理,即對數值型屬性和非數值型屬性進行編碼操作。
3.根據權利要求1所述的一種用于關系圖數據的卷積分類方法,其特征在于,所述步驟(3)中,根據選定的關系屬性構建關系圖數據,包括構建關系圖的鄰接矩陣和提取關系特征。
4.根據權利要求3所述的一種用于關系圖數據的卷積分類方法,其特征在于,構建關系圖的鄰接矩陣的方法為:假定關系圖中節點的數量為N,從1至N為所有節點編號,鄰接矩陣A即為N*N的二維矩陣,若節點i和節點j之間存在邊,則二維矩陣對應位置設置為A[i][j]=1。
5.根據權利要求3所述的一種用于關系圖數據的卷積分類方法,其特征在于,對于提取關系特征,類比卷積神經網絡中卷積操作:
H(l)=Θ(WTH(l-1)) (1)
將關系圖數據中的卷積操作定義為:
H(l)=f(H(l-1),A) (2)
其中,W表示卷積神經網絡的卷積核參數,H表示隱藏層的輸出,f表示關系圖的卷積函數,A表示關系圖的鄰接矩陣;
關系圖的卷積操作具體定義如下:
f(H(l),A)=Θ(UgθUTH(l)Wλ(l)) (3)
其中,Θ表示激活函數,Wλ表示權重矩陣,U表示圖拉普拉斯矩陣分解后的特征向量矩陣,gθ表示以圖拉普拉斯矩陣特征值為參數的函數,λ表示圖拉普拉斯矩陣的特征值矩陣;
gθ(λ)通過k階的切比雪夫截斷展開多項式進行近似操作:
以此為擴展得到關系圖卷積的多項式近似公式:
其中,L表示圖的拉普拉斯矩陣,λmax是L的最大特征值,K表示截斷階數,根據具體的需求人為設定,C表示切比雪夫多項式,通過Ck(x)=2xCk-1(x)-Ck-2(x)循環定義。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910080643.4/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





