[發(fā)明專利]一種適用于樣本分布不均衡的多標簽多分類方法有效
| 申請?zhí)枺?/td> | 202010166042.8 | 申請日: | 2020-03-11 |
| 公開(公告)號: | CN111382800B | 公開(公告)日: | 2022-11-25 |
| 發(fā)明(設(shè)計)人: | 馬祥祥 | 申請(專利權(quán))人: | 上海愛數(shù)信息技術(shù)股份有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06F16/55 |
| 代理公司: | 上??剖⒅R產(chǎn)權(quán)代理有限公司 31225 | 代理人: | 楊宏泰 |
| 地址: | 201112 上海市閔行*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 適用于 樣本 分布 均衡 標簽 分類 方法 | ||
本發(fā)明涉及一種適用于樣本分布不均衡的多標簽多分類方法,包括以下步驟:S1:構(gòu)建并訓(xùn)練一個基于神經(jīng)網(wǎng)絡(luò)的多標簽多分類模型,并設(shè)定比較對象;S2:利用訓(xùn)練完成的多標簽多分類模型和訓(xùn)練樣本,計算各個標簽上,所有訓(xùn)練樣本對應(yīng)比較對象的平均值,作為比較平均值;S3:將待檢測圖片輸入多標簽多分類模型,得到在各標簽上,該圖片對應(yīng)比較對象的值,作為比較值;S4:選取該圖片比較值與比較平均值最接近的前N個標簽,作為待檢測圖片的標簽,完成對圖片的多標簽多分類,與現(xiàn)有技術(shù)相比,本發(fā)明具有實現(xiàn)簡單、容易訓(xùn)練且適用性廣等優(yōu)點。
技術(shù)領(lǐng)域
本發(fā)明涉及深度學(xué)習(xí)的多標簽多分類領(lǐng)域,尤其是涉及一種適用于樣本分布不均衡的多標簽多分類方法。
背景技術(shù)
利用深度學(xué)習(xí)做多標簽多分類問題時一般會遇到樣本數(shù)量不均衡的問題,比以flickr30K樣本集做圖像標簽為例,該樣本集共有30000張圖片,每張圖片有5個標簽,所有的標簽合并在一起后,共有30W條摘要,下表為包含狗、貓、海豚和大象的標簽的樣本數(shù)量:
類別 狗 貓 海豚 大象 數(shù)量 10619 308 40 94
顯然相對于包含狗的樣本,其它的樣本數(shù)量少到可以忽略不計。而目前主流的基于深度學(xué)習(xí)的多分類方法中,最后一層的激活函數(shù)為sigmoid函數(shù),該函數(shù)的值域為(0,1),其結(jié)果往往被用于作為某個標簽的概率。模型的期望損失函數(shù)為:
其中,Ni為包含標簽i的樣本數(shù)量,Nj為不包含標簽j的樣本數(shù)量,Pi為模型預(yù)測標簽i的平均概率,Pj為模型預(yù)測標簽j的平均概率。
由于海豚標簽的訓(xùn)練樣本數(shù)量遠小于狗標簽的訓(xùn)練樣本數(shù)量,就算海豚標簽全部被預(yù)測錯,只要把狗標簽全部預(yù)測對,那么模型的損失也是很小的,因此用這樣的樣本訓(xùn)練出來的結(jié)果不可避免地會出現(xiàn)這樣的問題:對于出現(xiàn)頻率高的標簽,模型預(yù)測的概率也相應(yīng)偏高,這樣的問題就是樣本類別不均衡問題。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海愛數(shù)信息技術(shù)股份有限公司,未經(jīng)上海愛數(shù)信息技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010166042.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





