[發明專利]一種適用于樣本分布不均衡的多標簽多分類方法有效
| 申請號: | 202010166042.8 | 申請日: | 2020-03-11 |
| 公開(公告)號: | CN111382800B | 公開(公告)日: | 2022-11-25 |
| 發明(設計)人: | 馬祥祥 | 申請(專利權)人: | 上海愛數信息技術股份有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06F16/55 |
| 代理公司: | 上海科盛知識產權代理有限公司 31225 | 代理人: | 楊宏泰 |
| 地址: | 201112 上海市閔行*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 適用于 樣本 分布 均衡 標簽 分類 方法 | ||
1.一種適用于樣本分布不均衡的多標簽多分類方法,其特征在于,包括以下步驟:
S1:構建并訓練一個基于神經網絡的多標簽多分類模型,并設定比較對象;
S2:利用訓練完成的多標簽多分類模型和訓練樣本,計算各個標簽上,所有訓練樣本對應比較對象的平均值,作為比較平均值;
S3:將待檢測圖片輸入多標簽多分類模型,得到在各標簽上,該圖片對應比較對象的值,作為比較值;
S4:選取該圖片比較值與比較平均值最接近的前N個標簽,作為待檢測圖片的標簽,完成對圖片的多標簽多分類;
所述的比較對象為隱藏層輸出logits,所述的多標簽多分類模型首先對輸入的圖像進行特征提取,得到特征向量V,再通過線性變換得到隱藏層輸出logits;
當比較對象為隱藏層輸出logits時,所述的步驟S2-步驟S4具體包括:
A1:利用訓練好的多標簽多分類模型,計算所有訓練樣本上各標簽對應的隱藏層輸出logits之和,并求其平均值,記為隱藏層輸出平均
A2:將待測圖片輸入多標簽多分類模型,計算得到其在各標簽上對應的隱藏層輸出logits;
A3:計算隱藏層輸出logits與隱藏層輸出平均的差值作為指標,選取該值最大的前N個標簽作為該圖片的標簽,完成圖片的多標簽多分類。
2.根據權利要求1所述的一種適用于樣本分布不均衡的多標簽多分類方法,其特征在于,所述的比較對象為標簽概率P、第一標簽概率對數log(P)或第二標簽概率對數ln(P)。
3.根據權利要求1所述的一種適用于樣本分布不均衡的多標簽多分類方法,其特征在于,所述的隱藏層輸出平均通過將隱藏層輸出平均作為一個變量向量進行訓練得到,該訓練的目標函數表達式為:
4.根據權利要求1所述的一種適用于樣本分布不均衡的多標簽多分類方法,其特征在于,所述的步驟S4中,選取該圖片比較值與比較平均值最接近的前3個標簽,作為待檢測圖片的標簽。
5.根據權利要求1所述的一種適用于樣本分布不均衡的多標簽多分類方法,其特征在于,所述的步驟A3中,選取隱藏層輸出logits與隱藏層輸出平均的差值最大的前3個標簽作為該圖片的標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海愛數信息技術股份有限公司,未經上海愛數信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010166042.8/1.html,轉載請聲明來源鉆瓜專利網。





