[發(fā)明專利]基于多特征提取的寬度學(xué)習(xí)系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202010181905.9 | 申請(qǐng)日: | 2020-03-16 |
| 公開(公告)號(hào): | CN111401443B | 公開(公告)日: | 2023-04-18 |
| 發(fā)明(設(shè)計(jì))人: | 劉然;劉亞瓊;劉宴齊;田逢春;錢君輝;鄭楊婷;趙洋;陳希;崔珊珊;王斐斐;陳丹 | 申請(qǐng)(專利權(quán))人: | 重慶大學(xué);重慶市中藥研究院 |
| 主分類號(hào): | G06V10/778 | 分類號(hào): | G06V10/778;G06V10/50;G06V10/56;G06V10/762 |
| 代理公司: | 重慶信航知識(shí)產(chǎn)權(quán)代理有限公司 50218 | 代理人: | 吳彬 |
| 地址: | 400044 *** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 特征 提取 寬度 學(xué)習(xí) 系統(tǒng) | ||
1.一種基于多特征提取的寬度學(xué)習(xí)系統(tǒng),其特征在于:包括四個(gè)子寬度學(xué)習(xí)系統(tǒng),每個(gè)子寬度學(xué)習(xí)系統(tǒng)包括特征節(jié)點(diǎn)、增強(qiáng)節(jié)點(diǎn)和子節(jié)點(diǎn);
所述的每個(gè)子寬度學(xué)習(xí)系統(tǒng)先對(duì)圖像數(shù)據(jù)集提取一種圖像特征,各子寬度學(xué)習(xí)系統(tǒng)提取的圖像特征互不相同,第一個(gè)子寬度學(xué)習(xí)系統(tǒng)提取圖像數(shù)據(jù)集的HOG特征,第二個(gè)子寬度學(xué)習(xí)系統(tǒng)提取圖像數(shù)據(jù)集的顏色特征,第三個(gè)子寬度學(xué)習(xí)系統(tǒng)提取圖像數(shù)據(jù)集的K-means特征,第四個(gè)子寬度學(xué)習(xí)系統(tǒng)提取圖像數(shù)據(jù)集的卷積特征;各子寬度學(xué)習(xí)系統(tǒng)將對(duì)圖像數(shù)據(jù)集提取的圖像特征合并得到各自的特征節(jié)點(diǎn),再分別通過(guò)增強(qiáng)映射函數(shù)對(duì)各自的特征節(jié)點(diǎn)進(jìn)行增強(qiáng),形成對(duì)應(yīng)的增強(qiáng)節(jié)點(diǎn);各子寬度學(xué)習(xí)系統(tǒng)在形成增強(qiáng)節(jié)點(diǎn)之后,再將其特征節(jié)點(diǎn)與對(duì)應(yīng)的增強(qiáng)節(jié)點(diǎn)合并,然后再連接到其子節(jié)點(diǎn)中;
所述的基于多特征提取的寬度學(xué)習(xí)系統(tǒng)還包括對(duì)各子寬度學(xué)習(xí)系統(tǒng)的子節(jié)點(diǎn)的輸出進(jìn)行歸一化的歸一化層和與各歸一化層連接的最終輸出層;
第一個(gè)子寬度學(xué)習(xí)系統(tǒng)提取圖像數(shù)據(jù)集的HOG特征的步驟包括:
1)對(duì)輸入圖像進(jìn)行歸一化處理,將圖像轉(zhuǎn)化為灰度圖;
2)把圖像分割成若干個(gè)小區(qū)域,將小區(qū)域稱為cell,分割方法采用分割區(qū)域之間可相互重疊的可重疊分隔方法;
3)在每個(gè)cell中計(jì)算像素點(diǎn)的梯度值和梯度方向,得到該區(qū)域的梯度方向直方圖;
4)在更大的區(qū)域中,命名更大的區(qū)域?yàn)閎locks,計(jì)算累積梯度方向直方圖,然后對(duì)blocks中所有的cell進(jìn)行歸一化;
5)將所有cell的梯度方向直方圖進(jìn)行合并,得到HOG特征;所提取到的HOG特征即為第一個(gè)子寬度學(xué)習(xí)系統(tǒng)的特征節(jié)點(diǎn);
第二個(gè)子寬度學(xué)習(xí)系統(tǒng)提取圖像數(shù)據(jù)集的顏色特征的步驟包括:
1)將圖像從RGB空間轉(zhuǎn)換到HSV空間,在HSV空間進(jìn)行特征提取;
2)依據(jù)HSV空間三個(gè)通道的取值范圍,分別使用6、4、4個(gè)bins,來(lái)計(jì)算圖像的直方圖,結(jié)果得到一個(gè)96維的顏色直方圖向量;
3)分別在三個(gè)通道上計(jì)算像素的一階顏色矩、二階顏色矩以及三階顏色矩,最終形成一個(gè)9維的顏色矩向量;
4)將顏色直方圖向量與顏色矩向量合并,從而形成105維的顏色特征向量;所提取到的顏色特征向量即為第二個(gè)子寬度學(xué)習(xí)系統(tǒng)的特征節(jié)點(diǎn);
第三個(gè)子寬度學(xué)習(xí)系統(tǒng)提取圖像數(shù)據(jù)集的K-means特征的步驟包括:
1)從訓(xùn)練集中采樣圖像塊集合,然后對(duì)圖像塊集合中的圖像塊進(jìn)行標(biāo)準(zhǔn)化以及ZCA白化,最后對(duì)圖像塊集合進(jìn)行K-means聚類,獲得聚類詞典D;
2)對(duì)于一幅三通道的彩色圖像,使用一個(gè)窗口進(jìn)行步幅為1,間隔為0的滑動(dòng)采樣,所述的窗口的大小和求解聚類詞典D時(shí)圖像塊的大小一致;采樣之后,即可得到多個(gè)圖像塊,用x表示;使用聚類詞典D對(duì)每個(gè)圖像塊進(jìn)行特征映射,映射函數(shù)f:Rd→Rk,R為實(shí)數(shù)集,將圖像塊映射為特征向量,d為圖像塊向量的維度,k為聚類中心個(gè)數(shù);映射方法為硬編碼方法,該方法的映射函數(shù)f(x;D)為:
dj=||x-μ(j)||2
其中,μ(j)是第j個(gè)聚類中心,k為聚類中心個(gè)數(shù);dj表示圖像塊x與第j個(gè)聚類中心之間的距離;進(jìn)行特征映射之后,每個(gè)圖像塊轉(zhuǎn)換為一個(gè)k維的向量;將所有圖像塊分為四份,進(jìn)行最大池化,將池化后的結(jié)果進(jìn)行合并與標(biāo)準(zhǔn)化,所得最終結(jié)果即為K-means特征,特征維度為4k;所提取到的K-means特征即為第三個(gè)子寬度學(xué)習(xí)系統(tǒng)的特征節(jié)點(diǎn);
第四個(gè)子寬度學(xué)習(xí)系統(tǒng)提取圖像數(shù)據(jù)集的卷積特征的步驟包括:
1)對(duì)圖像進(jìn)行卷積操作,再進(jìn)行池化操作,卷積操作和池化操作共交替進(jìn)行4次;
2)4次卷積與池化后,將所得的結(jié)果展平為一個(gè)向量;
3)使用PCA方法對(duì)該向量進(jìn)行降維,降維后所得最終結(jié)果即為卷積特征;所提取到的卷積特征即為第四個(gè)子寬度學(xué)習(xí)系統(tǒng)的特征節(jié)點(diǎn);
所述的增強(qiáng)映射函數(shù)為非線性映射函數(shù);
所述第一個(gè)子寬度學(xué)習(xí)系統(tǒng)在提取到的HOG特征后的處理算法如下:
HOG對(duì)應(yīng)的特征節(jié)點(diǎn)為:
ZH=[h1,h2,...,hN]T∈RN×M?(1)
其中,N為樣本個(gè)數(shù),h1,h2,...,hN分別對(duì)應(yīng)每個(gè)樣本的HOG特征;M為單個(gè)樣本的HOG特征維數(shù),即每個(gè)樣本的HOG特征為一個(gè)M維的向量,則其對(duì)應(yīng)的增強(qiáng)節(jié)點(diǎn)的輸出為:
HH=φH(ZHWEH+βH)?(2)
其中WEH是映射權(quán)重,βH是偏置,φH是非線性激活函數(shù);權(quán)重WEH和偏置βH是隨機(jī)生成的;對(duì)應(yīng)的子節(jié)點(diǎn)輸出UH的形式為:
UH=[ZH,HH]WH=AHWH?????????????????????????(3)
其中AH=[ZH,HH],HOG所對(duì)應(yīng)的子寬度學(xué)習(xí)系統(tǒng)目標(biāo)函數(shù)為:
其中,Y為標(biāo)簽集合,λH是嶺回歸參數(shù);對(duì)公式(4)進(jìn)行求導(dǎo),得到:
其中I為單位矩陣;
其它三個(gè)子寬度學(xué)習(xí)系統(tǒng)求取其對(duì)應(yīng)的權(quán)重和子節(jié)點(diǎn)輸出的方法和第一個(gè)子寬度學(xué)習(xí)系統(tǒng)求解其權(quán)重和子節(jié)點(diǎn)輸出的方法相同,在求解第二個(gè)子寬度學(xué)習(xí)系統(tǒng)的和子節(jié)點(diǎn)輸出US時(shí),只需將上述公式中對(duì)應(yīng)HOG特征的下標(biāo)H和更換成對(duì)應(yīng)顏色特征的下標(biāo)S,同理在求解第三個(gè)子寬度學(xué)習(xí)系統(tǒng)的和子節(jié)點(diǎn)輸出UK時(shí),只需將上述公式中對(duì)應(yīng)HOG特征的下標(biāo)H和更換成對(duì)應(yīng)K-means特征的下標(biāo)K,在求解第四個(gè)子寬度學(xué)習(xí)系統(tǒng)的和子節(jié)點(diǎn)輸出UF時(shí),只需將上述公式中對(duì)應(yīng)HOG特征的下標(biāo)H和更換成對(duì)應(yīng)卷積特征的下標(biāo)F;
所述的基于多特征提取的寬度學(xué)習(xí)系統(tǒng)在得到各子寬度學(xué)習(xí)系統(tǒng)對(duì)應(yīng)的子節(jié)點(diǎn)輸出UH,US,UK,UF后的處理算法如下:
對(duì)UH,US,UK,UF分別進(jìn)行歸一化,分別得到U'H,U'S,U'K,U'F,設(shè)Z為:
Z=[U'H,U'S,U'K,U'F]?(7)
所述的基于多特征提取的寬度學(xué)習(xí)系統(tǒng)的整體輸出Y為:
Y=[Z]W=AW?(8)
其中A=[Z],W是將特征節(jié)點(diǎn)和增強(qiáng)節(jié)點(diǎn)連接到輸出的整體權(quán)重,通過(guò)最小化目標(biāo)函數(shù)來(lái)得到W:
其中λ是嶺回歸參數(shù),使用嶺回歸方法對(duì)上式進(jìn)行求解,得到:
W*=(ATAI+λI)-1ATY?(10)
其中I是單位矩陣;
則基于多特征提取的寬度學(xué)習(xí)系統(tǒng)的最終輸出為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶大學(xué);重慶市中藥研究院,未經(jīng)重慶大學(xué);重慶市中藥研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010181905.9/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。





