[發明專利]一種高效寬度圖卷積神經網絡模型及其訓練方法在審
| 申請號: | 202011642718.2 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112633482A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 劉勛;宗建華;夏國清;葉和忠;劉強 | 申請(專利權)人: | 廣州大學華軟軟件學院 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06K9/62;G06F16/35 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郭浩輝;顏希文 |
| 地址: | 510990 廣東省廣州市從*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 高效 寬度 圖卷 神經網絡 模型 及其 訓練 方法 | ||
本發明提供了一種高效寬度圖卷積神經網絡模型及其訓練方法,所述高效寬度圖卷積神經網絡模型依次包括輸入層、同時捕捉節點的多階鄰域信息的高階圖卷積層、融合多階鄰域信息的SP信息融合池化層和softmax函數多分類輸出層,所述高效寬度圖卷積神經網絡模型對應的訓練方法為先進行預處理得到預處理特征,再將預處理特征輸入訓練的高效模型訓練方法。該模型及其訓練方法應用于實際分類測試時,采用一層高階圖卷積層增加模型寬度、降低模型深度、減少參數量的同時,還能同時聚集多階鄰域信息,進而擴寬了模型的感受野、避免了模型的過擬合風險、提升了模型的學習能力和分類精度。
技術領域
本發明涉及圖像處理及深度學習技術領域,特別是涉及一種基于高效寬度圖卷積神經網絡模型及其訓練方法。
背景技術
隨著圖像處理及深度機器學習研究的不斷加深,一種能夠同時對節點特征信息和結構信息進行端到端學習,適用于任意拓撲結構的節點與圖,且在公開經典數據集上的測試效果都優于其他方法的圖卷積神經網絡逐漸成為學者們研究文本分類、圖像分類等優選方法,并不斷改進以提高分類效果。但由于現有的圖卷積神經網絡的每個卷積僅執行一跳鄰域信息聚集,對應的圖卷積神經網絡模型要么采用淺層機制限制了獲取全局信息能力,要么通過堆疊多個卷積層聚集多跳鄰域信息來擴大感受野的規模,卻導致參數量過多、模型太復雜,從而加大訓練難度,還增加了過擬合的風險。
因此,現有圖卷積神經網絡模型的感受野和學習能力受限,從而影響測試精度的問題,亟需進一步解決。
發明內容
本發明的目的是為了解決現有圖卷積神經網絡的感受野和學習能力受限問題,通過增加卷積的鄰域階數來加寬模型寬度,進而擴大模型的感受野,提高模型的學習能力,提高測試精度。
為了實現上述目的,有必要針對上述技術問題,提供了一種高效寬度圖卷積神經網絡模型及其訓練方法。
第一方面,本發明實施例提供了一種高效寬度圖卷積神經網絡模型,所述高效寬度圖卷積神經網絡模型依次包括輸入層、高階圖卷積層、信息融合池化層和輸出層;
所述輸入層,用于接收訓練數據集的圖特征;
所述高階圖卷積層,用于根據所述圖特征進行一階到k階的圖卷積運算,得到圖卷積數據;
所述信息融合池化層,用于根據所述圖卷積數據進行一階到k階的特征融合,得到融合數據;
所述輸出層,用于根據所述融合數據輸出模型結果。
進一步地,所述高效寬度圖卷積神經網絡模型的輸出層的輸出HGCNSP可表示為:
其中,X是圖的輸入矩陣,w是參數矩陣,是圖的正則化鄰接矩陣,k是圖卷積的最高階數,σ(·)為激活函數,SP(·)為信息融合函數,softmax(·)為多分類輸出函數。
進一步地,所述圖的正則化鄰接矩陣是含自連接的正則化鄰接矩陣。
進一步地,所述σ激活函數為ReLU非線性激活函數。
進一步地,所述高階圖卷積層包括基于權重共享的一階圖卷積到k階圖卷積,即
進一步地,所述信息融合池化層采用SP求和信息融合池化,其計算公式如下:
第二方面,本發明實施例提供了一種高效寬度圖卷積神經網絡模型的訓練方法,所述訓練方法的步驟包括:
根據訓練數據集,得到所述高效寬度圖卷積神經網絡模型的圖的輸入矩陣和正則化鄰接矩陣;
根據所述圖的輸入矩陣和正則化鄰接矩陣進行特征預處理,得到預處理特征;





