[發(fā)明專利]一種基于圖遷移學(xué)習(xí)的通用人體解析框架及其解析方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910305230.1 | 申請(qǐng)日: | 2019-04-16 |
| 公開(公告)號(hào): | CN110111337A | 公開(公告)日: | 2019-08-09 |
| 發(fā)明(設(shè)計(jì))人: | 梁小丹;高一鳴;吳洋鑫;林倞 | 申請(qǐng)(專利權(quán))人: | 中山大學(xué) |
| 主分類號(hào): | G06T7/11 | 分類號(hào): | G06T7/11;G06K9/62;G06K9/66;G06N3/04;G06N3/08 |
| 代理公司: | 廣州容大專利代理事務(wù)所(普通合伙) 44326 | 代理人: | 劉新年 |
| 地址: | 510275 廣東省*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 解析 遷移 目標(biāo)圖 卷積神經(jīng)網(wǎng)絡(luò) 提取圖像特征 圖像特征提取 語(yǔ)義 標(biāo)簽集合 可區(qū)分性 類別特征 全局信息 人體圖像 神經(jīng)網(wǎng)絡(luò) 視覺特征 數(shù)據(jù)集中 圖像特征 推理單元 語(yǔ)義信息 重新映射 網(wǎng)絡(luò) 通用 數(shù)據(jù)集 結(jié)點(diǎn) 推理 映射 標(biāo)簽 學(xué)習(xí) 高層 傳播 | ||
1.一種基于圖遷移學(xué)習(xí)的通用人體解析框架,包括:
圖像特征提取單元,用于利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)人體圖像提取圖像特征;
圖內(nèi)推理單元,用于將提取的圖像特征映射到一個(gè)高層的圖卷積神經(jīng)網(wǎng)絡(luò)中,其中的語(yǔ)義結(jié)點(diǎn)和邊由數(shù)據(jù)集中類別以及類別間的關(guān)系決定,全局信息通過圖內(nèi)推理進(jìn)行傳播并重新映射以增強(qiáng)視覺特征的可區(qū)分性;
圖間遷移單元,用于從源圖網(wǎng)絡(luò)中提取相關(guān)的語(yǔ)義信息到目標(biāo)圖網(wǎng)絡(luò),以將不同數(shù)據(jù)集的標(biāo)簽聯(lián)系起來,并利用來自不同數(shù)據(jù)集的不同標(biāo)簽集合之間的多種圖的特征遷移,來加強(qiáng)目標(biāo)圖網(wǎng)絡(luò)的類別特征。
2.如權(quán)利要求1所述的一種基于圖遷移學(xué)習(xí)的通用人體解析框架,其特征在于:所述圖內(nèi)推理單元首先將提取的圖像特征轉(zhuǎn)化成了圖結(jié)點(diǎn)的高層表示,即每個(gè)圖節(jié)點(diǎn)表示一個(gè)類別的信息,然后與某一特定部位相關(guān)聯(lián)的視覺特征經(jīng)過傳播,被聚合在一起用以增強(qiáng)對(duì)應(yīng)圖結(jié)點(diǎn)的特征。
3.如權(quán)利要求2所述的一種基于圖遷移學(xué)習(xí)的通用人體解析框架,其特征在于:于所述圖內(nèi)推理單元中,定義一個(gè)無向圖G=(V,E),其中V代表結(jié)點(diǎn)數(shù),E代表邊數(shù)目,且N=|V|,模型的輸入特征圖為其中H,W和C分別是特征圖的高、寬和通道數(shù),引入N個(gè)結(jié)點(diǎn)的高層圖表示其中D是每個(gè)結(jié)點(diǎn)v∈V的特征維度,圖中的結(jié)點(diǎn)數(shù)N對(duì)應(yīng)于數(shù)據(jù)集中目標(biāo)部位標(biāo)簽的數(shù)目,映射通過函數(shù)Φ表示:
Z=Φ(X,W)
其中W為用于轉(zhuǎn)化每個(gè)圖片特征xi∈X轉(zhuǎn)化到維度D的可訓(xùn)練的轉(zhuǎn)化矩陣。
4.如權(quán)利要求3所述的一種基于圖遷移學(xué)習(xí)的通用人體解析框架,其特征在于:基于高層圖特征Z,所述圖內(nèi)推理單元利用人體結(jié)構(gòu)的先驗(yàn)知識(shí)語(yǔ)義約束對(duì)全局表示進(jìn)行修改。
5.如權(quán)利要求4所述的一種基于圖遷移學(xué)習(xí)的通用人體解析框架,其特征在于:基于圖卷積,所述圖內(nèi)推理單元對(duì)圖特征表示Z在所有部位結(jié)點(diǎn)上通過矩陣乘法的方式進(jìn)行圖傳播操作,得到修改后的圖特征Ze:
Ze=σ(AeZWe)
其中是一個(gè)可訓(xùn)練的權(quán)重矩陣,σ是非線性函數(shù)。結(jié)點(diǎn)鄰接權(quán)重av→v′∈Ae由邊連接(v,v′)∈E定義,其中E是是一個(gè)歸一化的對(duì)稱鄰接矩陣。
6.如權(quán)利要求5所述的一種基于圖遷移學(xué)習(xí)的通用人體解析框架,其特征在于:所述圖內(nèi)推理單元反復(fù)進(jìn)行三次圖卷積。
7.如權(quán)利要求6所述的一種基于圖遷移學(xué)習(xí)的通用人體解析框架,其特征在于:于所述圖間遷移單元中,令源圖網(wǎng)絡(luò)和目標(biāo)圖網(wǎng)絡(luò)分別為Gs=(Vs,Es),Gt=(Vt,Et),其中Gs和Gt是可能有不同的結(jié)構(gòu)和特征的兩個(gè)圖,圖可以通過矩陣表示,其中N=|V|,D是結(jié)點(diǎn)v的維度即v∈V,圖的轉(zhuǎn)換由下列式子表示:
Zt=Zt+σ(AtrZsWtr)
其中是將圖表示從Zs映射到Zt的轉(zhuǎn)換矩陣,是一個(gè)可訓(xùn)練的權(quán)重矩陣。
8.如權(quán)利要求7所述的一種基于圖遷移學(xué)習(xí)的通用人體解析框架,其特征在于:所述圖間遷移單元從手工關(guān)系、可學(xué)習(xí)的矩陣、特征相似度、語(yǔ)義相似度來構(gòu)建轉(zhuǎn)換矩陣。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué),未經(jīng)中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910305230.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 遷移方法和裝置
- 移動(dòng)邊緣系統(tǒng)中遷移應(yīng)用方法、相關(guān)設(shè)備及系統(tǒng)
- 虛擬機(jī)的遷移方法及裝置
- 數(shù)據(jù)遷移方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 計(jì)算任務(wù)遷移方法及計(jì)算任務(wù)遷移器
- 文件遷移方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于遷移工具的國(guó)產(chǎn)化應(yīng)用系統(tǒng)遷移方法
- 數(shù)據(jù)遷移方法及裝置
- 文件遷移方法及裝置
- 一種數(shù)據(jù)遷移方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲(chǔ)介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計(jì)方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測(cè)方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法及檢測(cè)裝置





