[發明專利]分類方法、介質、裝置和計算設備有效
| 申請號: | 202010021998.9 | 申請日: | 2020-01-09 |
| 公開(公告)號: | CN111259932B | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 楊楊;姜波 | 申請(專利權)人: | 網易(杭州)網絡有限公司 |
| 主分類號: | G06F18/24 | 分類號: | G06F18/24;G06F18/214 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 閻敏;楊瑾瑾 |
| 地址: | 310052 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類 方法 介質 裝置 計算 設備 | ||
1.一種分類方法,其特征在于,包括:
接收多媒體數據;
獲取所述多媒體數據的多媒體特征;
將所述多媒體特征分別輸入預先訓練的多個二元分類器以得到多個分類概率值;其中,各個所述二元分類器分別對應不同的類別;
基于所述多個分類概率值,確定所述多媒體數據的類別;
所述方法還包括:對多個二元分類器進行訓練,訓練的方法包括:
接收多個樣本數據組,每個樣本數據組對應指定的兩個二元分類器;利用轉換網絡對每個樣本數據組進行標簽轉換處理,以將樣本數據組中的各個樣本數據的標簽進行轉換,并將樣本數據組中的樣本數據按照正負樣本均衡的比例發送至指定的兩個二元分類器;
根據每個二元分類器輸出的類別概率值以及預先設置的損失函數分別對每個二元分類器模型參數進行調整,以實現對多個二元分類器的訓練。
2.根據權利要求1所述的方法,其特征在于,所述獲取所述多媒體數據的多媒體特征,包括:
提取所述多媒體數據的第一特征向量;
對所述第一特征向量進行降維處理,得到所述多媒體數據的第二特征向量;
將所述第二特征向量作為所述多媒體數據的多媒體特征。
3.根據權利要求1所述的方法,其特征在于,所述預先設置的損失函數為:
其中,
所述j表示所述多個樣本數據組中樣本數據的序列號;
所述N表示所述多個樣本數據組中樣本數據的個數;
所述k表示所述多個樣本數據組訓練的二元分類器的序列號;
所述L表示所述多個樣本數據組訓練的二元分類器的個數;
所述i表示一個所述樣本數據組對應的二元分類器組中,二元分類器的序列號;
所述C等于2;
所述yijk表示序列號為j的樣本數據對應的二元分類器組包含序列號為k的二元分類器的情況下,序列號為j的樣本數據相對于該二元分類器組中組內序列號為i的二元分類器所對應的類別的標簽;
所述pijk表示序列號為j的樣本數據對應的二元分類器組包含序列號為k的二元分類器的情況下,序列號為j的樣本數據被預測屬于該二元分類器組中組內序列號為i的二元分類器所對應的類別的概率;
其中,所述組內序列號為二元分類器在所屬的二元分類器組內部的序列號,組內序列號的取值為1或2。
4.根據權利要求3所述的方法,其特征在于,所述pijk采用下式表示:
其中,
所述e表示自然常數;
所述Sijk表示序列號為j的樣本數據對應的二元分類器組包含序列號為k的二元分類器的情況下,將序列號為j的樣本數據的多媒體特征輸入該二元分類器組中組內序列號為i的二元分類器時,該二元分類器輸出的分類概率值。
5.根據權利要求1所述的方法,其特征在于,所述預先設置的損失函數為:
其中,
所述j表示所述多個樣本數據組中樣本數據的序列號;
所述N表示所述多個樣本數據組中樣本數據的個數;
所述i表示所述多個樣本數據組訓練的二元分類器的序列號;
所述C表示所述多個樣本數據組訓練的二元分類器的個數;
所述yij表示序列號為j的樣本數據相對于序列號為i的二元分類器所對應的類別的標簽;
所述pij表示序列號為j的樣本數據被所述訓練的二元分類器預測屬于序列號為i的二元分類器所對應的類別的概率。
6.根據權利要求5所述的方法,其特征在于,所述pij采用下式表示:
其中,
所述e表示自然常數;
所述s[1]ij表示序列號為j的樣本數據的多媒體特征輸入序列號為i的二元分類器時,該二元分類器輸出的第一分類概率值;其中,所述第一分類概率值表示輸入的樣本數據屬于所述二元分類器對應類別的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于網易(杭州)網絡有限公司,未經網易(杭州)網絡有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010021998.9/1.html,轉載請聲明來源鉆瓜專利網。





