[發(fā)明專利]一種基于人工合成數(shù)據(jù)和多源遷移學(xué)習的長尾物體識別方法在審
| 申請?zhí)枺?/td> | 202310056416.4 | 申請日: | 2023-01-18 |
| 公開(公告)號: | CN116152644A | 公開(公告)日: | 2023-05-23 |
| 發(fā)明(設(shè)計)人: | 張雪松;劉麗娟 | 申請(專利權(quán))人: | 大連交通大學(xué) |
| 主分類號: | G06V20/00 | 分類號: | G06V20/00;G06V10/764;G06V10/82;G06N3/08;G06N3/0464 |
| 代理公司: | 大連至誠專利代理事務(wù)所(特殊普通合伙) 21242 | 代理人: | 王丹;陳義華 |
| 地址: | 116000 遼寧*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 人工合成 數(shù)據(jù) 遷移 學(xué)習 長尾 物體 識別 方法 | ||
本發(fā)明公開了一種基于人工合成數(shù)據(jù)和多源遷移學(xué)習的長尾物體識別方法,包括獲取多源訓(xùn)練圖像集并進行預(yù)處理和特征提取,確定每張訓(xùn)練圖像的類標簽,根據(jù)訓(xùn)練特征向量和類標簽構(gòu)建訓(xùn)練數(shù)據(jù)集;分別對訓(xùn)練數(shù)據(jù)集所對應(yīng)的權(quán)重集進行初始化,設(shè)置權(quán)重調(diào)節(jié)因子和迭代次數(shù),選擇初始弱分類器學(xué)習算法,根據(jù)權(quán)重調(diào)節(jié)因子、迭代次數(shù)、初始弱分類器學(xué)習算法以及初始化后的權(quán)重集對訓(xùn)練數(shù)據(jù)集進行訓(xùn)練,獲取T個弱分類器及其分類器系數(shù);獲取目標領(lǐng)域測試圖像集并進行預(yù)處理和特征提取,根據(jù)T個弱分類器對每張測試圖像的類標簽進行預(yù)測并根據(jù)預(yù)測結(jié)果和分類器系數(shù)獲確定每張測試圖像的類標簽。有效地提高了圖像類分布絕對不平衡條件下的圖像分類器性能。
技術(shù)領(lǐng)域
本發(fā)明涉及小樣本長尾物體識別領(lǐng)域,尤其涉及一種基于人工合成數(shù)據(jù)和多源遷移學(xué)習的長尾物體識別方法。
背景技術(shù)
物體識別是計算機視覺領(lǐng)域的一個基礎(chǔ)性問題,由于真實世界的圖像數(shù)據(jù)集中類標簽分布呈現(xiàn)長尾趨勢,使用類不平衡圖像數(shù)據(jù)訓(xùn)練的分類器易于對多數(shù)類(頭部)數(shù)據(jù)過擬合,從而在分類預(yù)測時忽略少數(shù)類(尾部)。特別是當訓(xùn)練數(shù)據(jù)不足時,還會存在模型泛化能力下降的問題。
對于以上問題,有以下解決方案:文獻[1]中提出的一種基于單源實例遷移學(xué)習的Rare-Transfer算法,該算法首次將單源實例遷移學(xué)習應(yīng)用于解決訓(xùn)練樣本不足條件的類標簽不平衡分類問題。Rare-Transfer基于遷移學(xué)習領(lǐng)域經(jīng)典的TrAdaboost框架[2],通過在每輪Boosting迭代時引入一個校正因子Ct來防止源領(lǐng)域樣本的權(quán)重過早收斂。Rare-Transfer算法的主要缺點是只適用于處理二分類問題和從單個源領(lǐng)域進行實例遷移,當該源領(lǐng)域的少數(shù)類樣本仍然較少時,單源遷移學(xué)習的效果很有限且容易引起“負遷移”,即源領(lǐng)域“正樣本”中蘊含的知識對于解決目標領(lǐng)域物體識別是有害的。文獻[3-5]雖然將TrAdaboost框架從單源遷移推廣到了多源遷移學(xué)習,提出了基于TrAdaBoost框架的多源遷移學(xué)習算法,但是這些算法主要針對的是類標簽分布平衡數(shù)據(jù)的二分類問題。文獻[6]提出了一種Weighted?Multisource-TrAdaboost算法,在實例遷移時考慮到了源領(lǐng)域和目標領(lǐng)域的訓(xùn)練樣本總數(shù)量對分類器性能的影響,該算法的主要缺點是適用于二分類問題、引入新的超參數(shù)且沒有考慮解決目標領(lǐng)域類不平衡問題。文獻[7]將多類Adaboost算法SAMME[8]和TrAdaboost框架相結(jié)合,提出了一種多分類的單源實例遷移學(xué)習算法,該算法的主要缺點是只適用于單源遷移學(xué)習和標準類標簽分布數(shù)據(jù)集,當目標領(lǐng)域訓(xùn)練數(shù)據(jù)不平衡時無法有效地處理。
綜上所述,現(xiàn)有方法存在以下缺點:1)基于TrAdaboost框架的不平衡分類算法只考慮了單源實例遷移和二分類問題,且側(cè)重于應(yīng)用在文本分類任務(wù)中,在訓(xùn)練樣本具有多種類別時,分類的準確率較低;2)基于TrAdaboost框架多源實例遷移算法只考慮了類標簽是標準分布情況下的分類器訓(xùn)練問題,不能對類標簽分布不平衡的訓(xùn)練樣本進行有效、準確地分類;3)基于SMOTE技術(shù)和Boosting框架的算法只是在目標領(lǐng)域進行模型訓(xùn)練,沒有考慮有效利用源領(lǐng)域的知識,降低了分類的準確率,且主要集中在二分類模型的訓(xùn)練算法設(shè)計上,不能對具有多種類別的訓(xùn)練樣本進行分類。
參考文獻
[1]Al-Stouhi?S.,Reddy?C?K.Transfer?learning?for?class?imbalanceproblems?with?inadequate?data.KnowledgeInformation?Systems,2016,48(1),201-228.
[2]Dai?W,Yang?Q,Xue?GR,Yu?Y(2007a)Boosting?for?transfer?learning.In:Proceedings?of?the?international?conference?on?machine?learning,2007,pp?193–200.
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連交通大學(xué),未經(jīng)大連交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310056416.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





