[發(fā)明專利]一種基于混合擴散的圖卷積網(wǎng)絡文獻分類方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202211525235.3 | 申請日: | 2022-11-30 |
| 公開(公告)號: | CN115795344A | 公開(公告)日: | 2023-03-14 |
| 發(fā)明(設計)人: | 楊智;李康;甘海濤;周然;嚴亞東;歐陽翰;顏家璇 | 申請(專利權)人: | 湖北工業(yè)大學 |
| 主分類號: | G06F18/24 | 分類號: | G06F18/24;G06F18/214;G06F18/22;G06F17/16;G06N3/0464;G06N3/08 |
| 代理公司: | 武漢科皓知識產(chǎn)權代理事務所(特殊普通合伙) 42222 | 代理人: | 黃靖 |
| 地址: | 430068 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 混合 擴散 圖卷 網(wǎng)絡 文獻 分類 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于混合擴散的圖卷積網(wǎng)絡的文獻分類方法及系統(tǒng),包括:獲取包含文獻數(shù)據(jù)的訓練數(shù)據(jù)集;通過特征相似性擴散模型對節(jié)點進行特征空間鄰域節(jié)點間信息擴散,得到經(jīng)過節(jié)點特征空間信息擴散的數(shù)據(jù)集;對經(jīng)過特征空間信息擴散的數(shù)據(jù)集,通過圖卷積模型利用鄰接矩陣進行鄰接節(jié)點間的信息擴散;對經(jīng)過混合擴散后的數(shù)據(jù)集進行半監(jiān)督的圖卷積網(wǎng)絡訓練,并使用節(jié)點間的擴散距離對最終的預測標簽進行約束;采用訓練后得到的基于混合擴散的圖卷積網(wǎng)絡進行文獻分類。本發(fā)明利用了節(jié)點特征的混合擴散,來對每個節(jié)點信息進行在特征空間中的相近節(jié)點的信息擴散和鄰接節(jié)點間的信息擴散,使得節(jié)點特征包含更多信息,可顯著提升文獻分類準確率。
技術領域
本發(fā)明屬于文獻分類技術領域,特別涉及一種基于混合擴散的圖卷積網(wǎng)絡的文獻分類方法及系統(tǒng)。
背景技術
科技文獻分類一直以來都是數(shù)據(jù)挖掘技術領域的關鍵問題,隨著機器學習技術的不斷成熟以及深度學習技術的出現(xiàn),使得科技文獻分類變得越來越高效準確。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡在圖像處理領域有著廣泛的應用場景,而科技文獻的數(shù)據(jù)集絕大多數(shù)都是以圖結構這種非歐式結構的形式存在,無法使用圖像領域的卷積神經(jīng)網(wǎng)絡進行處理,圖卷積神經(jīng)網(wǎng)絡就很好的將卷積的概念引入了圖結構數(shù)據(jù)之中,用圖卷積神經(jīng)網(wǎng)絡就可以很好的處理科技文獻分類問題,并有著很高的準確率。
發(fā)明內(nèi)容
針對以上研究現(xiàn)狀與問題,本發(fā)明的目的是提供一種基于混合擴散的圖卷積網(wǎng)絡文獻分類方法,增強了節(jié)點特征的表達能力,同時也降低了節(jié)點信息中的噪聲成分,從而提升網(wǎng)絡性能。
為了解決上述技術問題,本發(fā)明采用如下技術方案:
一種基于混合擴散的圖卷積網(wǎng)絡的文獻分類方法,包含以下步驟:
S100:獲取公共科學論文數(shù)據(jù)集;
S200:通過節(jié)點特征相似性擴散模型對引入的公共科學論文數(shù)據(jù)集的節(jié)點信息進行擴散映射并計算節(jié)點間的擴散距離,通過其中的擴散過程來對節(jié)點進行特征空間鄰域節(jié)點間信息擴散,以此來得到各個節(jié)點新的特征信息,來得到經(jīng)過節(jié)點特征空間信息擴散的數(shù)據(jù)集;
S300:通過半監(jiān)督圖卷積模型,對經(jīng)過S200后的數(shù)據(jù)集通過圖卷積操作對數(shù)據(jù)集進行鄰接節(jié)點間的信息擴散;
S400:使用S300中的圖卷積模型,對經(jīng)過S200和S300混合擴散后的數(shù)據(jù)集進行半監(jiān)督的圖卷積網(wǎng)絡訓練,并在訓練的過程中使用S200中得到的節(jié)點間的擴散距離對最終的預測標簽進行約束,使得最終的分類面更加平滑;
S500:采用步驟S400訓練后得到的圖卷積神經(jīng)網(wǎng)絡進行文獻分類。
進一步地,所述訓練數(shù)據(jù)集Cora數(shù)據(jù)集、Pubmed數(shù)據(jù)集、Citeseer數(shù)據(jù)集中的一個或多個。
進一步地,步驟S200中包括如下子步驟:
步驟S201:數(shù)據(jù)集記為G(X,A),X∈Rn×d,A∈Rn×n,X表示數(shù)據(jù)集的節(jié)點信息,A表示數(shù)據(jù)集的鄰接矩陣,n表示數(shù)據(jù)集中的樣本數(shù)量,D表示樣本的特征維數(shù),構建數(shù)據(jù)集X構造的相似性矩陣L;
步驟S202:歸一化相似性矩陣L得到在數(shù)據(jù)集X上的Markov狀態(tài)轉移矩陣M;
步驟S203:通過得到的Markov狀態(tài)轉移矩陣M,定義鄰接圖G上任意兩點之間的擴散距離;
步驟S204:通過節(jié)點特征相似性擴散模型得到從原始數(shù)據(jù)到嵌入在原始空間中的k維空間的擴散映射。
進一步地,定義鄰接圖G上任意兩點之間的擴散距離為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北工業(yè)大學,未經(jīng)湖北工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211525235.3/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 一種腸胃鏡配套清潔達標圖譜
- 一種混合高低階圖卷積傳播系統(tǒng)
- 基于圖結構矩陣特征向量的圖卷積神經(jīng)網(wǎng)絡生成方法
- 基于骨骼關節(jié)點的圖卷積行為識別方法及裝置
- 一種基于網(wǎng)絡結構增強的圖卷積模型防御方法、裝置和系統(tǒng)
- 一種基于骨架的雙流自適應圖卷積網(wǎng)絡行為識別方法
- 一種基于時空圖卷積網(wǎng)絡的人臉檢測方法及裝置
- 一種基于權重不確定的圖卷積神經(jīng)網(wǎng)絡的優(yōu)化方法、裝置
- 一種基于圖自編碼器的融合子空間聚類方法及系統(tǒng)
- 基于圖卷積神經(jīng)網(wǎng)絡交互的推薦方法及系統(tǒng)





