[發(fā)明專利]基于深度多任務(wù)學(xué)習(xí)的圖像美感和情感聯(lián)合分類方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201910272826.6 | 申請日: | 2019-04-04 |
| 公開(公告)號: | CN109978074A | 公開(公告)日: | 2019-07-05 |
| 發(fā)明(設(shè)計)人: | 崔超然;余俊;楊文雅 | 申請(專利權(quán))人: | 山東財經(jīng)大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 濟南圣達(dá)知識產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 張慶騫 |
| 地址: | 250014 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 美感 圖像 卷積神經(jīng)網(wǎng)絡(luò) 情感類別 訓(xùn)練數(shù)據(jù)集 任務(wù)學(xué)習(xí) 分類 并行網(wǎng)絡(luò) 分支連接 損失函數(shù) 預(yù)定義 概率 聯(lián)合 標(biāo)注 輸出 預(yù)測 | ||
1.一種基于深度多任務(wù)學(xué)習(xí)的圖像美感和情感聯(lián)合分類方法,其特征在于,包括:
標(biāo)注圖像對應(yīng)的美感類別和情感類別,形成訓(xùn)練數(shù)據(jù)集;
構(gòu)造包含跨分支連接層和兩個并行網(wǎng)絡(luò)分支的深度卷積神經(jīng)網(wǎng)絡(luò);
其中,兩個網(wǎng)絡(luò)分支分別負(fù)責(zé)對輸入圖像進(jìn)行美感分類和情感分類;跨分支連接層用于連接兩個網(wǎng)絡(luò)分支中對應(yīng)的卷積層組,以關(guān)聯(lián)美感分類和情感分類這兩個任務(wù);深度卷積神經(jīng)網(wǎng)絡(luò)的輸出代表輸入圖像屬于各美感類別和各情感類別的概率;
利用訓(xùn)練數(shù)據(jù)集來訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò),直至預(yù)定義損失函數(shù)達(dá)到最小;
利用訓(xùn)練得到的深度卷積神經(jīng)網(wǎng)絡(luò)輸出給定圖像屬于各美感類別和各情感類別的概率,選取美感類別和情感類別中概率最大的類別分別作為給定圖像的預(yù)測美感類別和情感類別。
2.如權(quán)利要求1所述的基于深度多任務(wù)學(xué)習(xí)的圖像美感和情感聯(lián)合分類方法,其特征在于,在所述深度卷積神經(jīng)網(wǎng)絡(luò)中,兩個網(wǎng)絡(luò)分支中的卷積層組數(shù)量相同均為n;跨分支連接層的數(shù)量為n-1;第i個跨分支連接層將兩個網(wǎng)絡(luò)分支中第i個對應(yīng)的卷積層組輸出的圖像特征圖作為輸入,并將這些輸入的圖像特征圖沿著通道方向進(jìn)行堆疊,將堆疊后的圖像特征分別輸入至兩個網(wǎng)絡(luò)分支中第i+1個對應(yīng)的卷積層組;1≤i≤n-1;n為大于或等于2的正整數(shù)。
3.如權(quán)利要求2所述的基于深度多任務(wù)學(xué)習(xí)的圖像美感和情感聯(lián)合分類方法,其特征在于,每個卷積層組均包含一個最大池化層和至少兩個連續(xù)的卷積層。
4.如權(quán)利要求1所述的基于深度多任務(wù)學(xué)習(xí)的圖像美感和情感聯(lián)合分類方法,其特征在于,利用訓(xùn)練數(shù)據(jù)集來訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)的過程,包括:
統(tǒng)一訓(xùn)練數(shù)據(jù)集的所有圖像的大小尺寸;
初始化深度卷積神經(jīng)網(wǎng)絡(luò)各層的權(quán)重,預(yù)定義損失函數(shù);
采用隨機梯度下降算法對深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,確定能使得損失函數(shù)最小的網(wǎng)絡(luò)權(quán)重;且在每次訓(xùn)練迭代時,從圖像的隨機位置處裁剪出一塊固定大小圖像塊,并以一定概率對圖像塊進(jìn)行水平翻轉(zhuǎn)。
5.一種基于深度多任務(wù)學(xué)習(xí)的圖像美感和情感聯(lián)合分類系統(tǒng),其特征在于,包括:
訓(xùn)練數(shù)據(jù)集形成模塊,其用于標(biāo)注圖像對應(yīng)的美感類別和情感類別,形成訓(xùn)練數(shù)據(jù)集;
深度卷積神經(jīng)網(wǎng)絡(luò)構(gòu)造模塊,其用于構(gòu)造包含跨分支連接層和兩個并行網(wǎng)絡(luò)分支的深度卷積神經(jīng)網(wǎng)絡(luò);
其中,兩個網(wǎng)絡(luò)分支分別負(fù)責(zé)對輸入圖像進(jìn)行美感分類和情感分類;跨分支連接層用于連接兩個網(wǎng)絡(luò)分支中對應(yīng)的卷積層組,以關(guān)聯(lián)美感分類和情感分類這兩個任務(wù);深度卷積神經(jīng)網(wǎng)絡(luò)的輸出代表輸入圖像屬于各美感類別和各情感類別的概率;
深度卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練模塊,其用于利用訓(xùn)練數(shù)據(jù)集來訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò),直至預(yù)定義損失函數(shù)達(dá)到最小;
預(yù)測分類模塊,其用于利用訓(xùn)練得到的深度卷積神經(jīng)網(wǎng)絡(luò)輸出給定圖像屬于各美感類別和各情感類別的概率,選取美感類別和情感類別中概率最大的類別分別作為給定圖像的預(yù)測美感類別和情感類別。
6.如權(quán)利要求5所述的基于深度多任務(wù)學(xué)習(xí)的圖像美感和情感聯(lián)合分類系統(tǒng),其特征在于,在所述深度卷積神經(jīng)網(wǎng)絡(luò)中,兩個網(wǎng)絡(luò)分支中的卷積層組數(shù)量相同均為n;跨分支連接層的數(shù)量為n-1;第i個跨分支連接層將兩個網(wǎng)絡(luò)分支中第i個對應(yīng)的卷積層組輸出的圖像特征圖作為輸入,并將這些輸入的圖像特征圖沿著通道方向進(jìn)行堆疊,將堆疊后的圖像特征分別輸入至兩個網(wǎng)絡(luò)分支中第i+1個對應(yīng)的卷積層組;1≤i≤n-1;n為大于或等于2的正整數(shù)。
7.如權(quán)利要求6所述的基于深度多任務(wù)學(xué)習(xí)的圖像美感和情感聯(lián)合分類系統(tǒng),其特征在于,每個卷積層組均包含一個最大池化層和至少兩個連續(xù)的卷積層。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東財經(jīng)大學(xué),未經(jīng)山東財經(jīng)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910272826.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法及檢測裝置





