[發明專利]一種基于人工合成數據和多源遷移學習的長尾物體識別方法在審
| 申請號: | 202310056416.4 | 申請日: | 2023-01-18 |
| 公開(公告)號: | CN116152644A | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 張雪松;劉麗娟 | 申請(專利權)人: | 大連交通大學 |
| 主分類號: | G06V20/00 | 分類號: | G06V20/00;G06V10/764;G06V10/82;G06N3/08;G06N3/0464 |
| 代理公司: | 大連至誠專利代理事務所(特殊普通合伙) 21242 | 代理人: | 王丹;陳義華 |
| 地址: | 116000 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 人工合成 數據 遷移 學習 長尾 物體 識別 方法 | ||
1.一種基于人工合成數據和多源遷移學習的長尾物體識別方法,其特征在于,包括,
步驟一、獲取N個源領域訓練圖像集和一個目標領域訓練圖像集并進行預處理,根據深度神經網絡分別對預處理后的N個源領域訓練圖像集和一個目標領域訓練圖像集中的每張訓練圖像進行特征提取,獲取每張訓練圖像的訓練特征向量,
步驟二、對每張訓練圖像的訓練特征向量進行l2-zscore歸一化處理,根據每張訓練圖像所包含的物體類別確定所述訓練圖像的類標簽,分別根據歸一化處理后的訓練特征向量、類標簽構建N個源領域訓練數據集和一個目標領域訓練數據集,
步驟三、分別對N個源領域訓練數據集和一個目標領域訓練數據集所對應的權重集進行初始化,設置權重調節因子,設置迭代次數為T,選擇初始弱分類器學習算法,根據權重調節因子、迭代次數、初始弱分類器學習算法以及初始化后的權重集對N個源領域訓練數據集和一個目標領域訓練數據集進行訓練,獲取T個弱分類器及其分類器系數,
步驟四、獲取目標領域測試圖像集并進行預處理,根據深度神經網絡對預處理后目標領域測試圖像集進行特征提取,獲取目標領域測試圖像集中每張測試圖像的測試特征向量,根據T個弱分類器對每張測試圖像的測試特征向量所屬的類標簽進行預測,根據T個弱分類器的預測結果和分類器系數確定每張測試圖像的類標簽,所述類標簽為測試圖像中所包含的物體類別。
2.根據權利要求1所述的一種基于人工合成數據和多源遷移學習的長尾物體識別方法,其特征在于,所述步驟三包括,
S1、分別將N個源領域訓練數據集和一個目標領域訓練數據集的權重集進行初始化,設置權重調節因子,初始化n=1,t=1,
S2、對于第t次迭代,對N個源領域訓練數據集和目標領域訓練數據集的權重集進行歸一化,分別對目標領域訓練數據集和目標領域訓練數據集所對應的權重集進行人工合成,獲取人工合成后的目標領域訓練數據集和目標領域訓練數據集所對應的權重集,
S3、分別將第n個源領域訓練數據集、目標領域訓練數據集與人工合成后的目標領域訓練數據集進行合并并表示為第n個合并訓練集,分別將第n個源領域訓練數據集所對應的權重集、目標領域訓練數據集所對應的權重集與人工合成后的目標領域訓練數據集所對應的權重集進行合并并表示為第n個合并權重集,根據所選擇的初始弱分類器學習算法和第n個合并權重集對第n個合并訓練集進行訓練,獲取訓練后的第n個弱分類器,計算第n個弱分類器在目標領域數據集上的第n個訓練錯誤率,
S4、令n=n+1,當n≤N時,返回執行S3,獲取N個弱分類器,從N個弱分類器中選擇訓練錯誤率取值最低的分類器作為第t次迭代的弱分類器,
S5、令n=1,獲取第t次迭代得到的弱分類器及其對應的訓練錯誤率,根據訓練錯誤率計算弱分類器的分類器系數,根據分類器系數更新目標領域訓練數據集的權重集,根據訓練錯誤率計算矯正因子,根據矯正因子更新源領域訓練數據集的權重集,
S6、令t=t+1,返回執行S2,直到t=T,獲取T個弱分類器及其對應的T個分類器系數。
3.根據權利要求2所述的一種基于人工合成數據和多源遷移學習的長尾物體識別方法,其特征在于,所述對目標領域訓練數據集和目標領域訓練數據集所對應的權重集進行人工合成包括,
S11、確定目標領域訓練數據集中每個訓練圖像所包含的物體類別并將物體類別作為類標簽,類標簽的數量為K,根據類標簽將目標領域訓練數據集劃分為K個樣本集合,分別計算第i個樣本集合需要人工合成的樣本數Nsmote(i),其中,i=1,i≤K,
S12、對于第i個樣本集合,基于SMOTE技術生成Nsmote(i)個合成樣本集合,并為合成樣本集合中的每個合成樣本分配一個合成權重和一個合成類標簽,存儲第i個樣本集合的合成樣本集合、合成權重集合和合成類標簽集合并表示為第i個人工合成樣本集合,
S13、令i=i+1,重復執行S12,直到i=K,依次獲取K個樣本集合的人工合成樣本集合,分別將人工合成樣本集合中的合成樣本集合與目標領域訓練數據集進行合并,將人工合成樣本集合中的合成權重集合與目標領域訓練數據集所對應的權重集進行合并。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連交通大學,未經大連交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310056416.4/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





