[發(fā)明專利]一種基于圖結(jié)構(gòu)的多源遷移學(xué)習(xí)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010917529.5 | 申請(qǐng)日: | 2020-09-03 |
| 公開(kāi)(公告)號(hào): | CN112085085A | 公開(kāi)(公告)日: | 2020-12-15 |
| 發(fā)明(設(shè)計(jì))人: | 張偉哲;何慧;方濱興;楊洪偉;白雅雯 | 申請(qǐng)(專利權(quán))人: | 哈爾濱工業(yè)大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06F16/901;G06N20/00 |
| 代理公司: | 黑龍江立超同創(chuàng)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 23217 | 代理人: | 楊立超 |
| 地址: | 150001 黑龍*** | 國(guó)省代碼: | 黑龍江;23 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 結(jié)構(gòu) 遷移 學(xué)習(xí)方法 | ||
一種基于圖結(jié)構(gòu)的多源遷移學(xué)習(xí)方法,屬于人工智能領(lǐng)域,為了解決單純利用圖結(jié)構(gòu)數(shù)據(jù)的節(jié)點(diǎn)實(shí)體特征不能準(zhǔn)確預(yù)測(cè)目標(biāo)域節(jié)點(diǎn)標(biāo)簽的問(wèn)題。該方法通過(guò)構(gòu)建節(jié)點(diǎn)T?鄰域結(jié)構(gòu),獲得T?鄰域結(jié)構(gòu)集合;并對(duì)T?鄰域結(jié)構(gòu)集合進(jìn)行去重,獲得子圖集B;通過(guò)學(xué)習(xí)子圖集B,獲得通用結(jié)構(gòu);利用通用結(jié)構(gòu)分別獲得源域節(jié)點(diǎn)結(jié)構(gòu)特征和目標(biāo)域節(jié)點(diǎn)結(jié)構(gòu)特征;將節(jié)點(diǎn)實(shí)體特征和節(jié)點(diǎn)結(jié)構(gòu)特征相結(jié)合,分別獲得源域新特征和目標(biāo)域新特征,從而獲得目標(biāo)域節(jié)點(diǎn)標(biāo)簽。本發(fā)明方法可以應(yīng)用于目標(biāo)任務(wù)相同的同構(gòu)遷移學(xué)習(xí)和異構(gòu)遷移學(xué)習(xí),在具有圖結(jié)構(gòu)的數(shù)據(jù)中具有很好的預(yù)測(cè)效果,可以對(duì)一個(gè)新未知網(wǎng)絡(luò)進(jìn)行較為準(zhǔn)確的節(jié)點(diǎn)標(biāo)簽信息預(yù)測(cè)。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能領(lǐng)域,具體涉及一種基于圖結(jié)構(gòu)的多源遷移學(xué)習(xí)方法。
技術(shù)背景
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,社會(huì)步入信息化時(shí)代,網(wǎng)民不斷地增多,面向社交應(yīng)用的軟件也迅速增多。互聯(lián)網(wǎng)信息隨著時(shí)間而不斷變化著,數(shù)據(jù)也越來(lái)越多樣化。如果用節(jié)點(diǎn)表示實(shí)體,邊表示實(shí)體之間的關(guān)系,則數(shù)據(jù)可以形成一個(gè)巨大的網(wǎng)絡(luò)結(jié)構(gòu)。通過(guò)對(duì)這個(gè)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行深入挖掘,可以得到知識(shí)信息的快速響應(yīng),使得我們的社會(huì)生活更加智能化。其實(shí)這種圖數(shù)據(jù)網(wǎng)絡(luò)已經(jīng)應(yīng)用于我們的生活中,從一開(kāi)始的搜索引擎,例如Google搜索、百度搜索,以及現(xiàn)在的推薦系統(tǒng)、智能機(jī)器人、數(shù)據(jù)風(fēng)控等等,都是圖數(shù)據(jù)網(wǎng)絡(luò)應(yīng)用在工業(yè)界的體現(xiàn)。為更好的分析這些圖數(shù)據(jù)網(wǎng)絡(luò),節(jié)點(diǎn)分類問(wèn)題的研究是分析這些圖數(shù)據(jù)網(wǎng)絡(luò)的重要問(wèn)題。對(duì)于一些新興業(yè)務(wù)或一些新產(chǎn)生的圖數(shù)據(jù)網(wǎng)絡(luò),網(wǎng)絡(luò)中的節(jié)點(diǎn)具有較少的標(biāo)簽信息或者甚至無(wú)可用標(biāo)簽信息。若對(duì)這些網(wǎng)絡(luò)進(jìn)行手工標(biāo)注節(jié)點(diǎn)標(biāo)簽將耗費(fèi)大量的人力資源,若僅利用已知的少量標(biāo)簽信息則無(wú)法訓(xùn)練出一個(gè)較好的分類器。而在現(xiàn)實(shí)生活中,大量豐富的標(biāo)簽信息存在于許多已知的網(wǎng)絡(luò)數(shù)據(jù)中。因此希望利用遷移學(xué)習(xí),從已知標(biāo)簽信息源域中學(xué)習(xí)到有用的知識(shí)來(lái)幫助目標(biāo)域更好的預(yù)測(cè)節(jié)點(diǎn)標(biāo)簽。
目前,遷移學(xué)習(xí)主要是側(cè)重于基于特征的遷移,尤其是對(duì)于這種具有結(jié)構(gòu)的數(shù)據(jù)來(lái)講,并沒(méi)有一種明顯的映射關(guān)系,指出從源域中可進(jìn)行遷移的知識(shí),這是跨網(wǎng)絡(luò)遷移學(xué)習(xí)節(jié)點(diǎn)分類任務(wù)的一個(gè)難點(diǎn)。而節(jié)點(diǎn)結(jié)構(gòu)特征對(duì)于網(wǎng)絡(luò)數(shù)據(jù)中節(jié)點(diǎn)分類問(wèn)題可以提供很好的幫助,現(xiàn)有技術(shù)中,針對(duì)圖結(jié)構(gòu)數(shù)據(jù)并沒(méi)有人提出多源遷移學(xué)習(xí)算法,沒(méi)有將節(jié)點(diǎn)結(jié)構(gòu)特征和實(shí)體特征相結(jié)合來(lái)幫助對(duì)目標(biāo)域數(shù)據(jù)進(jìn)行節(jié)點(diǎn)標(biāo)簽預(yù)測(cè)。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是:
鑒于以上問(wèn)題,本發(fā)明針對(duì)圖結(jié)構(gòu)數(shù)據(jù),提出了一種多源遷移學(xué)習(xí)方法,通過(guò)將節(jié)點(diǎn)結(jié)構(gòu)特征和實(shí)體特征相結(jié)合,共同幫助對(duì)目標(biāo)域數(shù)據(jù)進(jìn)行節(jié)點(diǎn)標(biāo)簽預(yù)測(cè),用以解決單純利用節(jié)點(diǎn)實(shí)體特征不能準(zhǔn)確預(yù)測(cè)目標(biāo)域節(jié)點(diǎn)標(biāo)簽的問(wèn)題。
本發(fā)明為解決上述技術(shù)問(wèn)題所采用的技術(shù)方案是:
一種基于圖結(jié)構(gòu)的多源遷移學(xué)習(xí)方法,所述方法包括,步驟一、獲取多個(gè)源域數(shù)據(jù)集和一個(gè)目標(biāo)域數(shù)據(jù)集,其中,所述源域數(shù)據(jù)集包括源域圖結(jié)構(gòu)、源域數(shù)據(jù)節(jié)點(diǎn)實(shí)體特征和源域標(biāo)簽;所述目標(biāo)域數(shù)據(jù)集包括目標(biāo)域圖結(jié)構(gòu)和目標(biāo)域數(shù)據(jù)節(jié)點(diǎn)實(shí)體特征;
步驟二、根據(jù)源域標(biāo)簽對(duì)源域圖結(jié)構(gòu)構(gòu)建節(jié)點(diǎn)T-鄰域結(jié)構(gòu),獲得T-鄰域結(jié)構(gòu)集合C1;其中,所述T-鄰域結(jié)構(gòu)的定義為,對(duì)于圖結(jié)構(gòu)數(shù)據(jù)中節(jié)點(diǎn)T-鄰域結(jié)構(gòu)為從所述節(jié)點(diǎn)出發(fā)且深度為T所遍歷到的所有節(jié)點(diǎn)形成的子圖結(jié)構(gòu),所述子圖結(jié)構(gòu)包含深度T內(nèi)所有節(jié)點(diǎn)的標(biāo)簽信息。
步驟三、對(duì)所述T-鄰域結(jié)構(gòu)集合C1進(jìn)行去重,獲得子圖集B;
步驟四、學(xué)習(xí)子圖集B,獲得通用結(jié)構(gòu);其中,所述通用結(jié)構(gòu)與具有相同標(biāo)簽的圖結(jié)構(gòu)相似度高,與具有不同標(biāo)簽的圖結(jié)構(gòu)相似度低;
步驟五、利用所述通用結(jié)構(gòu)和所述T-鄰域結(jié)構(gòu)集合C1獲得源域節(jié)點(diǎn)結(jié)構(gòu)特征;
步驟六、將所述源域節(jié)點(diǎn)實(shí)體特征和所述源域節(jié)點(diǎn)結(jié)構(gòu)特征相結(jié)合,獲得源域新特征;
步驟七、根據(jù)源域數(shù)據(jù)節(jié)點(diǎn)實(shí)體特征和目標(biāo)域數(shù)據(jù)節(jié)點(diǎn)實(shí)體特征對(duì)目標(biāo)域標(biāo)簽進(jìn)行初步預(yù)測(cè),獲得目標(biāo)域初步預(yù)測(cè)標(biāo)簽;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工業(yè)大學(xué),未經(jīng)哈爾濱工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010917529.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種數(shù)據(jù)同步方法、系統(tǒng)、節(jié)點(diǎn)及存儲(chǔ)介質(zhì)
- 下一篇:一種云邊協(xié)同下的虛擬網(wǎng)絡(luò)性能優(yōu)化系統(tǒng)
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 遷移方法和裝置
- 移動(dòng)邊緣系統(tǒng)中遷移應(yīng)用方法、相關(guān)設(shè)備及系統(tǒng)
- 虛擬機(jī)的遷移方法及裝置
- 數(shù)據(jù)遷移方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 計(jì)算任務(wù)遷移方法及計(jì)算任務(wù)遷移器
- 文件遷移方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于遷移工具的國(guó)產(chǎn)化應(yīng)用系統(tǒng)遷移方法
- 數(shù)據(jù)遷移方法及裝置
- 文件遷移方法及裝置
- 一種數(shù)據(jù)遷移方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 數(shù)字學(xué)習(xí)方法及執(zhí)行此數(shù)字學(xué)習(xí)方法的攜帶式電子裝置
- 一種響應(yīng)式教學(xué)設(shè)計(jì)方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)及該神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法
- 一種高光譜遙感影像目標(biāo)探測(cè)方法
- 一種八維學(xué)習(xí)方法
- 一種自適應(yīng)學(xué)習(xí)特征及其張量分解式分享學(xué)習(xí)方法
- 生成模型學(xué)習(xí)方法、生成模型學(xué)習(xí)裝置及程序
- 一種高精度定位系統(tǒng)及方法
- 學(xué)習(xí)方法、管理裝置和記錄介質(zhì)
- 一種基于圖像屬性特征表述的少樣本學(xué)習(xí)方法





