[發(fā)明專利]一種基于AlexNet網(wǎng)絡(luò)的強(qiáng)化訓(xùn)練方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011406775.0 | 申請(qǐng)日: | 2020-12-04 |
| 公開(公告)號(hào): | CN112508189A | 公開(公告)日: | 2021-03-16 |
| 發(fā)明(設(shè)計(jì))人: | 仲偉波;林偉;馮友兵;張瑩瑩;李浩東;齊國慶;袁毓;杜運(yùn)本 | 申請(qǐng)(專利權(quán))人: | 江蘇科技大學(xué) |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 南京正聯(lián)知識(shí)產(chǎn)權(quán)代理有限公司 32243 | 代理人: | 杭行 |
| 地址: | 212003*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 alexnet 網(wǎng)絡(luò) 強(qiáng)化 訓(xùn)練 方法 | ||
本發(fā)明涉及人工智能領(lǐng)域,具體地說,一種基于AlexNet網(wǎng)絡(luò)的強(qiáng)化訓(xùn)練方法,當(dāng)網(wǎng)絡(luò)完成一次前向傳播后,將網(wǎng)絡(luò)的輸出結(jié)果與該圖像對(duì)應(yīng)的標(biāo)簽對(duì)比,若網(wǎng)絡(luò)輸出結(jié)果與標(biāo)簽不同則累加該圖像的錯(cuò)分類的次數(shù)。當(dāng)網(wǎng)絡(luò)Epoch次數(shù)大于等于K次時(shí),對(duì)訓(xùn)練集中圖像的錯(cuò)判次數(shù)進(jìn)行從大到小進(jìn)行排序,并根據(jù)排序結(jié)果將被AlexNet網(wǎng)絡(luò)錯(cuò)分類次數(shù)前N的圖像進(jìn)行n倍的數(shù)據(jù)增強(qiáng)處理,將被網(wǎng)絡(luò)錯(cuò)分類次數(shù)前M?N(NM)的圖像進(jìn)行m倍的數(shù)據(jù)增強(qiáng)處理,將增強(qiáng)后的圖像加入原始的訓(xùn)練集中形成新的訓(xùn)練集;當(dāng)網(wǎng)絡(luò)Epoch次數(shù)大于K次時(shí),則刪除上次增強(qiáng)的數(shù)據(jù),并根據(jù)訓(xùn)練集中被AlexNet網(wǎng)絡(luò)錯(cuò)分類的圖像的累計(jì)次數(shù)進(jìn)行圖像排序,然后對(duì)圖像進(jìn)行特定的增強(qiáng)處理。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能領(lǐng)域,具體地說,是一種基于AlexNet網(wǎng)絡(luò)的強(qiáng)化訓(xùn)練方法。
背景技術(shù)
在卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中是將訓(xùn)練集中的圖像逐個(gè)地輸入卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行前向傳播計(jì)算,然后根據(jù)圖像對(duì)應(yīng)的標(biāo)簽逐層地計(jì)算卷積神經(jīng)網(wǎng)絡(luò)中的誤差梯度,根據(jù)計(jì)算誤差梯度值,逐層更新網(wǎng)絡(luò)的權(quán)重值,不斷重復(fù)上述步驟直至到達(dá)設(shè)置的停止條件為止。
以上訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)的方法對(duì)于特征明顯的圖像,網(wǎng)絡(luò)可能僅需幾次學(xué)習(xí)就能獲取到圖像中一些關(guān)鍵的特征完成圖像正確的分類;然而對(duì)于特征不明顯的圖像或?qū)τ趫D像分屬不同類別且圖像之間僅存在細(xì)微特征的差別,卷積神經(jīng)網(wǎng)絡(luò)可能需要幾十次甚至上百次的學(xué)習(xí)才能獲取到圖像中的關(guān)鍵特征完成圖像的正確分類。
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明設(shè)計(jì)了一種基于AlexNet網(wǎng)絡(luò)的強(qiáng)化訓(xùn)練方法,在不增加網(wǎng)絡(luò)迭代次數(shù)的情況下,增加特征不明顯圖像的學(xué)習(xí)次數(shù)完成圖像的正確分類。
本發(fā)明采用的具體技術(shù)方案如下:
一種基于AlexNet網(wǎng)絡(luò)的強(qiáng)化訓(xùn)練方法,其重要步驟為:當(dāng)網(wǎng)絡(luò)完成一次前向傳播后,將網(wǎng)絡(luò)的輸出結(jié)果與該圖像對(duì)應(yīng)的標(biāo)簽對(duì)比,若網(wǎng)絡(luò)輸出結(jié)果與標(biāo)簽不同則累加該圖像的錯(cuò)分類的次數(shù);當(dāng)網(wǎng)絡(luò)Epoch次數(shù)大于等于K次時(shí),對(duì)訓(xùn)練集中圖像的錯(cuò)判次數(shù)進(jìn)行從大到小進(jìn)行排序,并根據(jù)排序結(jié)果將被AlexNet網(wǎng)絡(luò)錯(cuò)分類次數(shù)前N的圖像進(jìn)行n倍的數(shù)據(jù)增強(qiáng)處理,將被網(wǎng)絡(luò)錯(cuò)分類次數(shù)前M-N(NM)的圖像進(jìn)行m倍的數(shù)據(jù)增強(qiáng)處理,將增強(qiáng)后的圖像加入原始的訓(xùn)練集中形成新的訓(xùn)練集;當(dāng)網(wǎng)絡(luò)Epoch次數(shù)大于K次時(shí),則刪除上次增強(qiáng)的數(shù)據(jù),并根據(jù)訓(xùn)練集中被AlexNet網(wǎng)絡(luò)錯(cuò)分類的圖像的累計(jì)次數(shù)進(jìn)行圖像排序,然后對(duì)圖像進(jìn)行特定的增強(qiáng)處理;以上的做法能在不增加網(wǎng)絡(luò)Epoch次數(shù)的情況下,增加訓(xùn)練集中經(jīng)常被錯(cuò)判圖像的訓(xùn)練次數(shù),使得網(wǎng)絡(luò)能更快的完成訓(xùn)練任務(wù)。
強(qiáng)化訓(xùn)練方法的具體步驟如下:
步驟一:卷積神經(jīng)網(wǎng)絡(luò)的初始化
步驟二:判斷是否到達(dá)網(wǎng)絡(luò)訓(xùn)練的迭代次數(shù);若是,則結(jié)束;否則執(zhí)行步驟三。
步驟三:判斷Epoch次數(shù)是否大于等于K次;若是,則執(zhí)行步驟九;否則,則執(zhí)行步驟四。
步驟四:判斷是否到達(dá)設(shè)置的Iteration次數(shù);若是,則跳轉(zhuǎn)至步驟二,否則執(zhí)行步驟五。
步驟五:卷積神經(jīng)網(wǎng)絡(luò)前向傳播輸出圖像分類結(jié)果。
步驟六:將卷積神經(jīng)網(wǎng)絡(luò)輸出結(jié)果與圖像的標(biāo)簽作比較比較,累計(jì)每張圖像被誤分類的次數(shù)。
步驟七:反向傳播計(jì)算誤差梯度。
步驟八:更新網(wǎng)絡(luò)權(quán)值,跳轉(zhuǎn)至步驟四。
步驟九:判斷是否大于K次,若是執(zhí)行步驟十,若否執(zhí)行步驟十一。
步驟十:刪除上次增強(qiáng)的圖像。
步驟十一:對(duì)數(shù)據(jù)集中的所有圖像根據(jù)圖像被錯(cuò)分類的次數(shù)進(jìn)行從大到小的排序。
步驟十二:選取被錯(cuò)判前N的圖像增強(qiáng)n倍,選取被錯(cuò)判前(M-N)的圖像增強(qiáng)m倍,作為該次增強(qiáng)的圖像加入到原訓(xùn)練集中構(gòu)成新的訓(xùn)練集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇科技大學(xué),未經(jīng)江蘇科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011406775.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種類Alexnet網(wǎng)絡(luò)的模型訓(xùn)練方法和裝置
- 一種基于改進(jìn)AlexNet的燃弧識(shí)別方法
- 一種電能質(zhì)量擾動(dòng)分類方法
- 一種甲狀腺锝掃圖像的識(shí)別模型構(gòu)建方法及裝置
- 一種基于改進(jìn)Alexnet模型的尿液有形成分識(shí)別方法
- 一種基于特征融合Alexnet壁畫圖像分類方法
- 基于無線微波衰減特征遷移學(xué)習(xí)的濃霧監(jiān)測方法
- 基于AlexNet和遷移學(xué)習(xí)相結(jié)合的心電圖異常識(shí)別方法及系統(tǒng)
- 基于AlexNet網(wǎng)絡(luò)的長輸油氣管線沿線施工擾動(dòng)及泄漏識(shí)別方法
- 復(fù)數(shù)域結(jié)構(gòu)化SAR艦船目標(biāo)動(dòng)態(tài)仿真與速度估計(jì)方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





