[發(fā)明專利]一種基于ResNet-GCN網(wǎng)絡(luò)的圖像情感分類方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810292286.3 | 申請(qǐng)日: | 2018-03-30 |
| 公開(kāi)(公告)號(hào): | CN108416397A | 公開(kāi)(公告)日: | 2018-08-17 |
| 發(fā)明(設(shè)計(jì))人: | 王偉凝;李樂(lè)敏;黃杰雄 | 申請(qǐng)(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州市華學(xué)知識(shí)產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 陳文姬 |
| 地址: | 510640 廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 情感分類 圖像 網(wǎng)絡(luò) 支持向量分類 測(cè)試圖像 決策融合 框架設(shè)計(jì) 判斷過(guò)程 人工參與 人類情感 網(wǎng)絡(luò)設(shè)計(jì) 網(wǎng)絡(luò)特征 網(wǎng)絡(luò)組成 訓(xùn)練圖像 用戶圖像 原始圖像 金字塔 切割 分類 | ||
本發(fā)明公開(kāi)了一種基于ResNet?GCN網(wǎng)絡(luò)的圖像情感分類方法,包括以下步驟:(1)圖像情感分類網(wǎng)絡(luò)設(shè)計(jì):由前部分結(jié)構(gòu)ResNet?50網(wǎng)絡(luò)和后部分結(jié)構(gòu)GCN網(wǎng)絡(luò)組成;(2)圖像情感分類框架設(shè)計(jì):包含一個(gè)圖像情感分類網(wǎng)絡(luò)ResNet?GCN和一個(gè)用于決策融合網(wǎng)絡(luò)特征的支持向量分類器;(3)對(duì)原始圖像進(jìn)行顯著主體提取和金字塔切割;(4)訓(xùn)練圖像情感分類網(wǎng)絡(luò);(5)測(cè)試圖像情感分類框架;(6)用戶圖像使用已訓(xùn)練好的圖像情感分類框架進(jìn)行分類,實(shí)現(xiàn)圖像情感分類。本發(fā)明得到的圖像情感分類結(jié)果符合人類情感標(biāo)準(zhǔn),判斷過(guò)程無(wú)需人工參與,實(shí)現(xiàn)了機(jī)器全自動(dòng)圖像情感分類。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像分類的技術(shù)領(lǐng)域,特別涉及一種基于ResNet-GCN網(wǎng)絡(luò)的圖像情感分類方法。
背景技術(shù)
我們?nèi)菀资艿揭曈X(jué)內(nèi)容尤其是圖像的刺激而產(chǎn)生各種情感。圖像情感分類,就是針對(duì)圖像所喚醒的人類情感對(duì)圖像進(jìn)行分類。研究中常用的圖像情感分別為愉悅、敬畏、滿足、興奮、憤怒、厭惡、恐懼、悲傷共8類。由于圖像的復(fù)雜性和人類情感的主觀性,通過(guò)計(jì)算機(jī)模擬人類高層感知來(lái)判斷圖像情感,自動(dòng)實(shí)現(xiàn)圖像情感分類是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù)。
現(xiàn)有的圖像情感分類方法經(jīng)歷了傳統(tǒng)手工特征方法和深度學(xué)習(xí)方法兩個(gè)階段。與傳統(tǒng)手工特征方法相比,深度學(xué)習(xí)方法不僅省去繁瑣的特征設(shè)計(jì)和提取的過(guò)程,更能在樣本中學(xué)習(xí)到更抽象更高層次的圖像特征,提高了圖像情感分類的泛化能力。目前常用的卷積神經(jīng)網(wǎng)絡(luò)模型有AlexNet、VGG和ResNet等。
在基于深度學(xué)習(xí)方法的圖像情感分類研究中,悉尼科技大學(xué)學(xué)者Rao等人從圖像情感、紋理和美學(xué)三個(gè)角度出發(fā),通過(guò)組合3個(gè)AlexNet,提出一個(gè)多層深度表達(dá)網(wǎng)絡(luò)MldrNet。該網(wǎng)絡(luò)盲目地學(xué)習(xí)圖像不同因素的特征,缺少對(duì)影響圖像情感表達(dá)的相關(guān)因素的具體分析,不僅無(wú)法顯著提升圖像情感分類性能,還增加了網(wǎng)絡(luò)的復(fù)雜性,降低了網(wǎng)絡(luò)的泛化能力。
現(xiàn)有的圖像情感分類方法缺乏針對(duì)性的模型設(shè)計(jì),無(wú)法有效地綜合表達(dá)全局和局部圖像信息。因此需要一種新的圖像情感分類方法來(lái)克服現(xiàn)有技術(shù)存在的問(wèn)題。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)的上述缺點(diǎn)與不足,本發(fā)明的目的在于提供一種基于ResNet-GCN網(wǎng)絡(luò)的圖像情感分類方法,效地綜合表達(dá)全局和局部圖像信息,自動(dòng)實(shí)現(xiàn)圖像情感分類。
本發(fā)明的目的通過(guò)以下技術(shù)方案實(shí)現(xiàn):
一種基于ResNet-GCN網(wǎng)絡(luò)的圖像情感分類方法,包括如下步驟:
(1)圖像情感分類網(wǎng)絡(luò)設(shè)計(jì):所述圖像情感分類網(wǎng)絡(luò)由前后兩部分結(jié)構(gòu)組成,前部分為殘差網(wǎng)絡(luò)ResNet-50結(jié)構(gòu),后部分為全卷積網(wǎng)絡(luò)GCN結(jié)構(gòu);
所述ResNet-50結(jié)構(gòu)包含第一卷積層組、第二卷積層組、第三卷積層組、第四卷積層組、第五卷積層組、1個(gè)完全連接層和1個(gè)Softmax層;
所述GCN結(jié)構(gòu)四個(gè)GCN結(jié)構(gòu),分別接在前部分結(jié)構(gòu)ResNet-50的第二、三、四和五卷積層組之后;每個(gè)GCN結(jié)構(gòu)后緊跟一個(gè)池化層,其中最后一個(gè)池化層連接到前部分的完全連接層的神經(jīng)元中;
所述完全連接層根據(jù)圖像情感種類,將神經(jīng)元數(shù)量設(shè)為圖像情感類別數(shù)N;
所述第一卷積層組、第二卷積層組、第三卷積層組、第四卷積層組、第五卷積層組的輸出通道,根據(jù)圖像情感種類,將其設(shè)為圖像情感類別數(shù)N;
(2)圖像情感分類框架設(shè)計(jì):所述圖像情感分類框架包含一個(gè)圖像情感分類網(wǎng)絡(luò)和一個(gè)支持向量分類器;
(3)圖像預(yù)處理:對(duì)原始圖像進(jìn)行顯著主體提取、金字塔切割,共得到包含原始圖像在內(nèi)的三種輸入圖像;
(4)訓(xùn)練圖像情感分類網(wǎng)絡(luò):基于輸入的原始圖像,有監(jiān)督地訓(xùn)練圖像情感分類網(wǎng)絡(luò);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810292286.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種文本情感分類方法及系統(tǒng)
- 分類器的構(gòu)建方法及裝置、中文文本情感分類方法及系統(tǒng)
- 一種利用表情符號(hào)對(duì)微博進(jìn)行情感傾向分類的方法
- 一種音樂(lè)分類方法及裝置
- 一種基于ResNet-GCN網(wǎng)絡(luò)的圖像情感分類方法
- 基于情感的文本分類處理方法、裝置和計(jì)算機(jī)設(shè)備
- 一種基于LSTM網(wǎng)絡(luò)和注意力機(jī)制的圖像情感分類方法
- 音樂(lè)情感分類方法
- 一種彈幕文本中情感詞的分類方法、裝置及存儲(chǔ)介質(zhì)
- 一種基于自然語(yǔ)言理解的藏語(yǔ)情感句自動(dòng)分類系統(tǒng)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 二叉樹(shù)多類支持向量機(jī)遙感分類方法
- 一種基于支持向量機(jī)的成捆棒材識(shí)別計(jì)數(shù)方法
- 一種基于支持向量機(jī)的電網(wǎng)大數(shù)據(jù)隱私保護(hù)分類挖掘方法
- 一種基于孿生支持向量機(jī)的指紋圖像分類系統(tǒng)與方法
- 一種基于多層支持向量機(jī)的水果品質(zhì)分類方法
- 一種基于獨(dú)立向量分析和支持向量機(jī)的地質(zhì)災(zāi)害次聲信號(hào)分類識(shí)別方法及裝置
- 基于支持向量機(jī)的負(fù)荷集群控制方法和系統(tǒng)
- 一種分?jǐn)?shù)階C-支持向量機(jī)及其設(shè)計(jì)方法和應(yīng)用
- 一種分?jǐn)?shù)階C-支持向量機(jī)及其設(shè)計(jì)、優(yōu)化方法和應(yīng)用
- 一種跨技術(shù)通信的欺騙攻擊檢測(cè)方法





