[發明專利]一種基于塑性卷積神經網絡的可擴展類別的圖像識別方法有效
| 申請號: | 201911039729.9 | 申請日: | 2019-10-29 |
| 公開(公告)號: | CN110781968B | 公開(公告)日: | 2022-04-19 |
| 發明(設計)人: | 王戟;楊文婧;楊紹武;黃達;徐利洋;黃萬榮;胡亞清;劉向陽;沙建松;顏豪杰;梁卓 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06V10/74 | 分類號: | G06V10/74;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 國防科技大學專利服務中心 43202 | 代理人: | 王文惠 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 塑性 卷積 神經網絡 擴展 類別 圖像 識別 方法 | ||
1.一種基于塑性卷積神經網絡的可擴展類別的圖像識別方法,其特征在于,包括以下步驟:
第一步,基于卷積神經網絡和塑性神經網絡,構造一個具有元學習能力的卷積塑性神經網絡,其中,卷積塑性神經網絡由11層結構組成,最前和最后分別為輸入層和輸出層,第2-9層為卷積池化層交替結構組成,第10層為由塑性網絡層構造的classification層;卷積塑性神經網絡通過對圖片數據的學習能夠學會如何學習,從而通過一個類別的1張或幾張圖片就能習得該類別的特征,實現從幾個類別中找到與待識別圖片最相似的類別;其包含以下兩個步驟:
(1.1)建立一個塑性神經網絡用于數據計算;
(1.2)基于Imagenet開源數據集對(1.1)中的網絡進行訓練,訓練步驟如下:
(1.2.1)進行參數初始化,將數據集劃分為訓練集數據和測試集數據;
(1.2.2)以K-way-N-shot數據結構作為訓練集數據的數據結構,其中,K-way表示每次待識別類別的數目,N-shot表示每個待識別類別的樣本數目,加上一張待識別圖片樣本,共K×N+1張圖片,每個類別均有一個唯一的標簽,共K個編碼標簽,以上圖片和標簽作為一組訓練數據,64組訓練數據為一個batch,以batch為單位使用構造的網絡進行計算并更新網絡參數,直到完成M個batch;
(1.2.3)對測試集數據進行測試,當測試準確率大于P時,預訓練結束,保存訓練好的參數結果,否則返回(1.2.2)直到測試準確率大于P;
第二步,針對應用所需,管理、建立待識別類別庫,當需要對可識別類別進行拓展時只需要進行待識別類別庫的管理操作,而無需重新建立和訓練神經網絡,其具體操作包含以下2個步驟:
(2.1)建立待識別類別庫,在指定存儲位置建立待識別類別庫;
(2.2)管理類別庫,對于每一個可能的圖片類別存入至少一張圖片作為樣本;
第三步:使用第一步中的訓練結果初始化神經網絡,利用待識別庫作數據支撐,對輸入圖片進行識別,并返回最終的識別結果給終端,其中包含以下4個步驟:
(3.1)網絡初始化,加載訓練好的參數文件;
(3.2)從待識別類別庫中選取K個類別,每個類別取N張圖片與待識別圖片共K×N+1張圖片組成初始測試數據傳遞給卷積塑性神經網絡,由卷積塑性神經網絡判斷并返回與待識別圖片最相似的類別;
(3.3)從待識別類別庫中選取K-1個未參與過測試的類別與上一輪返回的最相似類別組成K個類,且當未測試類別少于K-1個時不足的以空白圖片填充,每個類別取N張圖片與待識別圖片共K×N+1張組成新一輪測試數據傳遞給卷積塑性神經網絡,由卷積塑性神經網絡判斷并返回結果;
(3.4)判斷待識別類別庫是否有未參與過判斷的,有則返回(3.3),沒有則結束該識別,以最后一輪的識別結果為最終結果,返回給終端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911039729.9/1.html,轉載請聲明來源鉆瓜專利網。





