[發(fā)明專利]一種目標(biāo)檢測方法、裝置、機器可讀介質(zhì)及設(shè)備有效
| 申請?zhí)枺?/td> | 202011077883.8 | 申請日: | 2020-10-10 |
| 公開(公告)號: | CN112200318B | 公開(公告)日: | 2021-11-09 |
| 發(fā)明(設(shè)計)人: | 姚志強;周曦;李連強;梁俊文 | 申請(專利權(quán))人: | 廣州云從人工智能技術(shù)有限公司 |
| 主分類號: | G06N5/02 | 分類號: | G06N5/02;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海光華專利事務(wù)所(普通合伙) 31219 | 代理人: | 代玲 |
| 地址: | 511458 廣東省廣州市南沙區(qū)豐澤東路106號*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 目標(biāo) 檢測 方法 裝置 機器 可讀 介質(zhì) 設(shè)備 | ||
本發(fā)明的一種目標(biāo)檢測方法,包括:構(gòu)建教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò);其中所述學(xué)生網(wǎng)絡(luò)的參數(shù)量小于所述教師網(wǎng)絡(luò)的參數(shù)量;通過樣本圖像集訓(xùn)練所述教師網(wǎng)絡(luò);從訓(xùn)練后的教師網(wǎng)絡(luò)的隱含層中提取特征圖的核心,采用知識蒸餾提取與所述特征圖的核心對應(yīng)的知識,并將所述知識遷移到與教師網(wǎng)絡(luò)的隱含層相對應(yīng)的所述學(xué)生網(wǎng)絡(luò)的隱含層中;通過樣本圖像集訓(xùn)練經(jīng)過知識蒸餾得到的學(xué)生網(wǎng)絡(luò);通過訓(xùn)練后的學(xué)生網(wǎng)絡(luò)對輸入的圖像進行目標(biāo)檢測。本發(fā)明利用神經(jīng)網(wǎng)絡(luò)自動提取的特征圖的核心知識,具有更合理和高效的特點;同時減少的冗余信息,使學(xué)生網(wǎng)絡(luò)能真切的模仿教師網(wǎng)絡(luò)。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理領(lǐng)域,具體涉及一種目標(biāo)檢測方法、裝置、機器可讀介質(zhì)及設(shè)備。
背景技術(shù)
知識蒸餾作為一類常見的輕量化神經(jīng)網(wǎng)絡(luò)算法,可以將學(xué)習(xí)能力強的教師網(wǎng)絡(luò)(一般更為復(fù)雜)學(xué)到的知識精煉出來,傳遞給學(xué)習(xí)能力弱的學(xué)生網(wǎng)絡(luò)(一般相對簡單),所精煉出來的知識不僅可以是一些包含類間信息的軟標(biāo)簽,還可以是學(xué)生網(wǎng)絡(luò)學(xué)不到而教師網(wǎng)絡(luò)可以學(xué)到的高度抽象的隱藏層特征。通過這些額外的知識學(xué)習(xí),學(xué)生網(wǎng)絡(luò)往往能夠突破自身學(xué)習(xí)能力的瓶頸限制,取得了良好的輕量化性能。但現(xiàn)有的知識蒸餾算法還存在以下幾個問題:
1)蒸餾的知識種類單一:現(xiàn)有的知識蒸餾算法基本上是在隱含層的抽象特征圖(Feature Map,FM)上通過發(fā)現(xiàn)教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò)的差異性部分,并通過最小化此誤差來將教師網(wǎng)絡(luò)的知識精煉給學(xué)生網(wǎng)絡(luò)。但是,有時教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò)的性能或者架構(gòu)差異比較大,就很難利用定義的單一知識去優(yōu)化學(xué)生網(wǎng)絡(luò)。
2)知識蒸餾的內(nèi)容冗余:如上所述,現(xiàn)有的知識蒸餾算法基本上都是將神經(jīng)網(wǎng)絡(luò)的隱含層的特征圖定義為要傳遞的知識。但是因為神經(jīng)網(wǎng)絡(luò)的隱含層特征圖一般維度較大、數(shù)目較多,學(xué)生網(wǎng)絡(luò)并不能真切地模仿教師網(wǎng)絡(luò)。其次,神經(jīng)網(wǎng)絡(luò)的隱含層的特征圖一般有用信息較少,其中包含大量冗余信息。
發(fā)明內(nèi)容
鑒于以上所述現(xiàn)有技術(shù)的缺點,本發(fā)明的目的在于提供一種目標(biāo)檢測方法、裝置、機器可讀介質(zhì)及設(shè)備,用于解決現(xiàn)有技術(shù)存在的問題。
為實現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明提供一種目標(biāo)檢測方法,包括:
構(gòu)建教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò);其中所述學(xué)生網(wǎng)絡(luò)的參數(shù)量小于所述教師網(wǎng)絡(luò)的參數(shù)量;
通過樣本圖像集訓(xùn)練所述教師網(wǎng)絡(luò);
從訓(xùn)練后的教師網(wǎng)絡(luò)的隱含層中提取特征圖的核心;
采用知識蒸餾提取與所述特征圖的核心對應(yīng)的知識,并將所述知識遷移到與教師網(wǎng)絡(luò)的隱含層相對應(yīng)的所述學(xué)生網(wǎng)絡(luò)的隱含層中;
通過樣本圖像集訓(xùn)練經(jīng)過知識蒸餾得到的學(xué)生網(wǎng)絡(luò);
通過訓(xùn)練后的學(xué)生網(wǎng)絡(luò)對輸入的圖像進行目標(biāo)檢測。
可選地,所述知識包括度量知識,所述度量知識為:所述教師網(wǎng)絡(luò)隱含層的特征圖的核心的度量大小與所述學(xué)生網(wǎng)絡(luò)中對應(yīng)的隱含層的特征圖的核心的度量大小。
可選地,通過最小化第一目標(biāo)函數(shù)將教師網(wǎng)絡(luò)的度量知識遷移至學(xué)生網(wǎng)絡(luò)中,所述第一目標(biāo)函數(shù)為:
LML為第一目標(biāo)函數(shù),表示教師網(wǎng)絡(luò)隱含層的特征圖的核心,表示學(xué)生網(wǎng)絡(luò)隱含層的特征圖的核心,ψ為樣本圖像集,表示標(biāo)準(zhǔn)化后的教師網(wǎng)絡(luò)隱含層的特征圖的核心,表示標(biāo)準(zhǔn)化后的學(xué)生網(wǎng)絡(luò)隱含層的特征圖的核心。
可選地,所述知識還包括關(guān)系知識,所述關(guān)系知識包括:教師網(wǎng)絡(luò)針對單個樣本圖像產(chǎn)生的特征圖的核心之間的差異性,以及教師網(wǎng)絡(luò)針對多個樣本圖像產(chǎn)生的特征圖的核心之間的相似性。
可選地,通過最小化第二目標(biāo)函數(shù)將教師網(wǎng)絡(luò)的關(guān)系知識遷移至學(xué)生網(wǎng)絡(luò),所述第二目標(biāo)函數(shù)為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州云從人工智能技術(shù)有限公司,未經(jīng)廣州云從人工智能技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011077883.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





