[發(fā)明專利]一種自適應(yīng)交互結(jié)構(gòu)學(xué)習(xí)的雙二次池化模型在審
| 申請(qǐng)?zhí)枺?/td> | 202110350164.7 | 申請(qǐng)日: | 2021-03-31 |
| 公開(公告)號(hào): | CN113139587A | 公開(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計(jì))人: | 譚敏;袁富;俞俊 | 申請(qǐng)(專利權(quán))人: | 杭州電子科技大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州君度專利代理事務(wù)所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 自適應(yīng) 交互 結(jié)構(gòu) 學(xué)習(xí) 二次 模型 | ||
1.一種自適應(yīng)交互結(jié)構(gòu)學(xué)習(xí)的雙二次池化模型,其特征在于將自適應(yīng)的交互結(jié)構(gòu)選擇與圖像分類融合在一個(gè)統(tǒng)一的多任務(wù)模型框架中,同時(shí)也能夠端到端地完成訓(xùn)練,并在細(xì)粒度分類基準(zhǔn)數(shù)據(jù)集上實(shí)現(xiàn)具有競(jìng)爭(zhēng)力的分類準(zhǔn)確率,具體實(shí)現(xiàn)步驟如下:
步驟(1):圖像數(shù)據(jù)預(yù)處理
在模型訓(xùn)練前對(duì)圖像做尺寸變換和數(shù)據(jù)增強(qiáng)操作,使得圖像尺寸大小一致;
步驟(2):基于雙二次池化的多尺度特征交互,構(gòu)建層次化深度模型;
步驟(3):構(gòu)建權(quán)重向量
利用層次化深度模型提取預(yù)處理過后圖像的多個(gè)雙二次池化特征后,構(gòu)建維度為雙二次池化特征個(gè)數(shù)的權(quán)重向量;并且在層次化深度模型中添加加權(quán)池化特征;所述的加權(quán)池化特征是由權(quán)重向量與對(duì)應(yīng)的雙二次池化特征相對(duì)應(yīng)乘獲得;
步驟(4):對(duì)權(quán)重向量進(jìn)行稀疏約束
步驟(5):設(shè)計(jì)監(jiān)督模塊,然后利用所有加權(quán)池化特征構(gòu)建一個(gè)全局分類損失;
步驟(6):模型訓(xùn)練與測(cè)試。
2.根據(jù)權(quán)利要求1所述的一種自適應(yīng)交互結(jié)構(gòu)學(xué)習(xí)的雙二次池化模型,其特征在于步驟(2)具體實(shí)現(xiàn)如下:
2-1.在同一個(gè)卷積神經(jīng)網(wǎng)絡(luò)中,選取最后的三個(gè)階段,按照每個(gè)階段中特征尺寸由大變小將其分別稱為低級(jí)階段、中級(jí)階段、高級(jí)階段;從每個(gè)階段中選取一個(gè)或多個(gè)卷積層的特征,三個(gè)階段選取的特征分別稱為低層特征組、中層特征組、高層特征組;低層特征組中包含至少一個(gè)卷積層特征,最多包含低級(jí)階段所有的卷積層特征;中層特征組與高層特征組分別至少包含兩個(gè)卷積層特征,最多包含整個(gè)對(duì)應(yīng)階段所有的卷積層特征;然后利用殘差下采樣模塊對(duì)低層特征組和中層特征組中所含的特征分別進(jìn)行調(diào)整,使其特征尺寸與高層特征組中特征的尺寸一致;
2-2.低層、中層以及高層特征組之間的特征兩兩進(jìn)行雙二次池化操作;在步驟2-1中經(jīng)過殘差下采樣模塊得到新的低層與中層特征組后,不同層次特征組包含的所有特征首先跨層兩兩之間做內(nèi)積,使不同層次特征組所含的特征兩兩進(jìn)行交互;然后將每個(gè)交互后的特征與自身的轉(zhuǎn)置做矩陣外積得到雙二次池化特征,簡(jiǎn)稱池化特征,由此便得到基于雙二次池化的層次化深度模型。
3.根據(jù)權(quán)利要求2所述的一種自適應(yīng)交互結(jié)構(gòu)學(xué)習(xí)的雙二次池化模型,其特征在于殘差下采樣模塊如下:
殘差下采樣結(jié)構(gòu)具有兩條分支:主分支包含一個(gè)大小為k*k且步長(zhǎng)為k的最大池化,之后還包含一個(gè)卷積核大小與步長(zhǎng)均為1的卷積層;另一條殘差分支包含一個(gè)卷積核大小與步長(zhǎng)均為k的卷積層,用于補(bǔ)償主分支中由于最大池化所丟失的信息;最終將兩條分支的特征相加后經(jīng)過一個(gè)歸一化層。
4.根據(jù)權(quán)利要求2或3所述的一種自適應(yīng)交互結(jié)構(gòu)學(xué)習(xí)的雙二次池化模型,其特征在于步驟(3)所述的權(quán)重向量構(gòu)建過程具體如下:
3-1.在層次化深度模型產(chǎn)生多個(gè)池化特征后,構(gòu)建維度與池化特征個(gè)數(shù)等長(zhǎng)的權(quán)重向量;
3-2.在層次化深度模型進(jìn)行首輪訓(xùn)練時(shí),對(duì)層次化深度模型得到的每個(gè)池化特征求取均值,用所有池化特征的均值來初始化權(quán)重向量,并在訓(xùn)練迭代過程中對(duì)權(quán)重向量進(jìn)行歸一化,使權(quán)重向量w中每個(gè)值的范圍處于[0,1],具體公式如下:
其中max{}和min{}分別對(duì)權(quán)重向量中的所有值取最大值、最小值;Relu(w)表示線性整流激活函數(shù);
3-3.將歸一化之后的權(quán)重向量與所有池化特征進(jìn)行對(duì)應(yīng)相乘得到加權(quán)池化特征。
5.根據(jù)權(quán)利要求4所述的一種自適應(yīng)交互結(jié)構(gòu)學(xué)習(xí)的雙二次池化模型,其特征在于步驟(5)所述的設(shè)計(jì)監(jiān)督模塊是指利用所有加權(quán)池化特征來構(gòu)造全局分類損失。
6.根據(jù)權(quán)利要求5所述的一種自適應(yīng)交互結(jié)構(gòu)學(xué)習(xí)的雙二次池化模型,其特征在于步驟(6)構(gòu)建多任務(wù)深度學(xué)習(xí)模型,具體是指依照步驟(2)、(3)、(4)、(5)建立端到端的框架后,在指定數(shù)據(jù)集上,同時(shí)優(yōu)化實(shí)際分類損失、監(jiān)督模塊的全局分類損失以及權(quán)重向量的稀疏約束;
實(shí)際分類損失的構(gòu)造過程如下:
根據(jù)權(quán)重向量中各個(gè)數(shù)值的大小,選取最大K個(gè)數(shù)值所對(duì)應(yīng)的加權(quán)池化特征,將選取出的加權(quán)池化特征進(jìn)行拼接之后通過一層全連接用于最終分類,產(chǎn)生的分類損失稱為實(shí)際分類損失;其中K值最小為1,最大為加權(quán)池化特征的個(gè)數(shù);
首先根據(jù)特定的卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建層次化深度模型,在其上增加權(quán)重向量以及稀疏約束、監(jiān)督模塊后得到最終的自適應(yīng)交互結(jié)構(gòu)學(xué)習(xí)的雙二次池化模型;在訓(xùn)練過程中,首先固定由Imagenet數(shù)據(jù)集預(yù)訓(xùn)練得到的特定卷積神經(jīng)網(wǎng)絡(luò)部分的參數(shù),只訓(xùn)練其他新增模塊的參數(shù);之后再微調(diào)整個(gè)網(wǎng)絡(luò),得到最終模型并在測(cè)試集上測(cè)試訓(xùn)練效果;整個(gè)模型的具體優(yōu)化目標(biāo)函數(shù)如下:
其中θ,w分別表示模型的參數(shù)和權(quán)重向量;ys代表樣本s的標(biāo)簽;分別表示樣本s的模型實(shí)際分類輸出和監(jiān)督模塊全局分類輸出;α,λ,λ',δ分別表示各個(gè)損失間的比例;N表示訓(xùn)練集中圖片數(shù)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué),未經(jīng)杭州電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110350164.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗(yàn)證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺(tái)
- 采用自適應(yīng)機(jī)匣和自適應(yīng)風(fēng)扇的智能發(fā)動(dòng)機(jī)
- 一種自適應(yīng)樹木自動(dòng)涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動(dòng)機(jī)燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機(jī)頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





