[發明專利]一種基于強聚類損失函數的多種類目標辨識方法及系統有效
| 申請號: | 202310762241.9 | 申請日: | 2023-06-27 |
| 公開(公告)號: | CN116503675B | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 史琪;李猛猛;丁大志;王紹然;賴瑞鑫;張晉偉;曾董;胡悅;文明浩 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/762;G06F30/327;G06F30/34 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 薛云燕 |
| 地址: | 210094 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 強聚類 損失 函數 多種 類目 辨識 方法 系統 | ||
1.一種基于強聚類損失函數的多種類目標辨識方法,其特征在于,包括以下步驟:
步驟1、根據同一批次待識別目標標簽的特征值和標簽值特點,構建強聚類損失函數,使得隨著迭代次數的增加,不同類別目標之間得到損失函數結果的差距增加;
步驟2、在步驟1的基礎上加入目標的移位特征,進一步增大不同類別目標的損失值差異;
步驟3、編寫CNN模型的網絡層硬件代碼并進行并行加速,生成的RTL級代碼結合網絡權重數據、偏置數據遷移到FPGA中;
步驟4、構建硬件層面電路圖,對RTL級代碼生成的IP核和Zynq處理器部署硬件設計,PS端和PL端聯合生成比特流,實現CNN模型在FPGA上的運算;
步驟1中所述根據同一批次待識別目標標簽的特征值和標簽值特點,構建強聚類損失函數,具體如下:
步驟1.1、建立損失函數的輸入為CNN模型一個批次中各圖片的特征值和標簽值,輸出是一個批次得到的相對損失值;
步驟1.2、用表示各目標輸入圖片經過CNN模型推理得到的種類特征值,用表示各目標輸入圖片的種類標簽值;
步驟1.3、計算兩個目標種類特征值之間的歐拉距離為:
(1)
步驟1.4、構建損失值修正項:
(2)
步驟1.5、結合交叉熵損失函數,增加加權修正項,得到強聚類損失函數:
(3)
其中和是指同一批次不同的兩個輸入目標,為損失函數所計算的損失值,是該批次樣本數量,是種類的總數,是指樣本可能是種類的概率,超參數是指不同類別圖像的特征的最小距離,是修正項在整個損失函數中的權重,也是一個超參數。
2.根據權利要求1所述的基于強聚類損失函數的多種類目標辨識方法,其特征在于,步驟2中所述在步驟1的基礎上加入目標的移位特征,具體如下:
步驟2.1、損失函數的輸入為同一批次待識別目標的特征值和標簽值,在計算兩個目標損失值時,對輸入的標簽值、特征值進行循環移位,將第一位移到最后一位,原來第二位變成第一位,以此類推循環移位;
步驟2.2、移位后的標簽值、特征值再進行損失值的計算,實現特征組合;
步驟2.3、對損失函數的輸入值進行持續移位,直至與最初輸入相同;
步驟2.4、將不同移位位置的標簽值與特征值,通過損失函數計算得到的損失值求和,作為最終的損失函數值。
3.根據權利要求2所述的基于強聚類損失函數的多種類目標辨識方法,其特征在于,步驟3中所述CNN模型的網絡結構中包含的網絡層有卷積層、池化層、全連接層;
每一層的輸入通道數為,輸入高度為,輸入寬度為,采樣核大小為,采樣區域移動步長為,在樣本數據外圍補0的層數為,規定層的輸出通道數為,得到網絡層的輸出高度和輸出寬度:
(4)。
4.根據權利要求3所述的基于強聚類損失函數的多種類目標辨識方法,其特征在于,對于卷積層,輸出矩陣的每一個數據是卷積核區域內權重和輸入矩陣數據的乘積與偏置之和,輸入數據與輸出數據的關系如式(5)所示:
(5)
其中是該輸入數據對應的權重數據,是該輸入數據對應的偏置數據;
對于池化層,輸出矩陣的每一個數據與采樣核區域內的輸入數據具有函數關系;對于最大池化層,輸出的一個數據元素是輸入數據在采樣核區域內的最大值;對于最小池化層,輸出的一個數據元素是輸入數據在采樣核區域內的最小值;對于平均池化層,輸出的一個數據元素是輸入數據在采樣核區域內的平均值;
對于全連接層,采用高度、寬度與輸入高度、輸入寬度相同大小的卷積核,進行一次卷積計算得到,全連接層輸出矩陣形狀為。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310762241.9/1.html,轉載請聲明來源鉆瓜專利網。





