[發(fā)明專利]對象分類模型訓(xùn)練、對象分類和對象推薦方法及裝置在審
| 申請?zhí)枺?/td> | 202310414442.X | 申請日: | 2023-04-13 |
| 公開(公告)號: | CN116304841A | 公開(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計(jì))人: | 李昂;張曉露;周俊 | 申請(專利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類號: | G06F18/24 | 分類號: | G06F18/24;G06F18/214;G06F18/23;G06F18/22;G06F16/9535;G06F18/213;G06N3/08;G06N3/082;G06N3/0464;G06N3/045 |
| 代理公司: | 北京永新同創(chuàng)知識產(chǎn)權(quán)代理有限公司 11376 | 代理人: | 林錦輝;劉景峰 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 對象 分類 模型 訓(xùn)練 推薦 方法 裝置 | ||
1.一種基于自蒸餾的對象分類模型訓(xùn)練方法,包括:
將當(dāng)前訓(xùn)練對象樣本和各個(gè)當(dāng)前樣本聚類的聚類中心對象樣本分別提供給對象分類模型進(jìn)行分類預(yù)測,得到所述當(dāng)前訓(xùn)練對象樣本和各個(gè)聚類中心對象樣本的分類預(yù)測結(jié)果,所述各個(gè)當(dāng)前樣本聚類通過對全量訓(xùn)練對象樣本集進(jìn)行聚類得到;
確定所述當(dāng)前訓(xùn)練對象樣本與各個(gè)聚類中心對象樣本之間的樣本相似度;
基于所述當(dāng)前訓(xùn)練對象樣本與各個(gè)聚類中心對象樣本之間的樣本相似度以及各個(gè)聚類中心對象樣本的分類預(yù)測結(jié)果,確定所述當(dāng)前訓(xùn)練對象樣本的軟標(biāo)簽;
根據(jù)所述當(dāng)前訓(xùn)練對象樣本的分類預(yù)測結(jié)果和軟標(biāo)簽,確定當(dāng)前損失函數(shù);以及
基于所述當(dāng)前損失函數(shù),調(diào)整所述對象分類模型的當(dāng)前模型參數(shù)。
2.如權(quán)利要求1所述的對象分類模型訓(xùn)練方法,其中,根據(jù)所述當(dāng)前訓(xùn)練對象樣本的分類預(yù)測結(jié)果和軟標(biāo)簽,確定當(dāng)前損失函數(shù)包括:
根據(jù)所述當(dāng)前訓(xùn)練對象樣本的分類預(yù)測結(jié)果和原始分類標(biāo)簽,確定當(dāng)前原始標(biāo)簽損失項(xiàng);
根據(jù)所述當(dāng)前訓(xùn)練對象樣本的分類預(yù)測結(jié)果和軟標(biāo)簽,確定當(dāng)前蒸餾損失項(xiàng);以及
基于所述當(dāng)前原始標(biāo)簽損失項(xiàng)和所述當(dāng)前蒸餾損失項(xiàng),確定所述當(dāng)前損失函數(shù)。
3.如權(quán)利要求2所述的對象分類模型訓(xùn)練方法,其中,根據(jù)所述當(dāng)前訓(xùn)練對象樣本的分類預(yù)測結(jié)果和軟標(biāo)簽,確定當(dāng)前損失函數(shù)還包括:
確定所述當(dāng)前訓(xùn)練對象樣本相對于當(dāng)前樣本聚類的當(dāng)前對比聚類損失項(xiàng),
基于所述當(dāng)前原始標(biāo)簽損失項(xiàng)和所述當(dāng)前蒸餾損失項(xiàng),確定所述當(dāng)前損失函數(shù)包括:
基于所述當(dāng)前原始標(biāo)簽損失項(xiàng)、所述當(dāng)前蒸餾損失項(xiàng)和所述當(dāng)前對比聚類損失項(xiàng),確定所述當(dāng)前損失函數(shù)。
4.如權(quán)利要求1所述的對象分類模型訓(xùn)練方法,其中,所述各個(gè)當(dāng)前樣本聚類通過對全量訓(xùn)練對象樣本集中的正樣本和負(fù)樣本分別進(jìn)行聚類得到。
5.如權(quán)利要求1所述的對象分類模型訓(xùn)練方法,還包括:
對所述當(dāng)前訓(xùn)練對象樣本進(jìn)行樣本聚類;以及
利用經(jīng)過樣本聚類后的當(dāng)前訓(xùn)練對象樣本對當(dāng)前樣本聚類進(jìn)行樣本聚類更新和聚類中心對象樣本更新,
確定所述當(dāng)前訓(xùn)練對象樣本與各個(gè)聚類中心對象樣本之間的樣本相似度包括:
確定所述當(dāng)前訓(xùn)練對象樣本與各個(gè)當(dāng)前樣本聚類的經(jīng)過更新后的聚類中心對象樣本之間的樣本相似度。
6.如權(quán)利要求1所述的對象分類模型訓(xùn)練方法,其中,所述對象分類模型包括嵌入層和分類層,將所述當(dāng)前訓(xùn)練對象樣本和各個(gè)聚類中心對象樣本分別提供給對象分類模型進(jìn)行分類預(yù)測,得到所述當(dāng)前訓(xùn)練對象樣本和各個(gè)聚類中心對象樣本的分類預(yù)測結(jié)果包括:
將所述當(dāng)前訓(xùn)練對象樣本和各個(gè)聚類中心對象樣本分別提供給所述對象分類模型的嵌入層,得到所述當(dāng)前訓(xùn)練對象樣本和各個(gè)聚類中心對象樣本的樣本特征表征;以及
將所述當(dāng)前訓(xùn)練對象樣本和各個(gè)聚類中心對象樣本的樣本特征表征分別提供給所述對象分類模型的分類層進(jìn)行分類預(yù)測,得到所述當(dāng)前訓(xùn)練對象樣本和各個(gè)聚類中心對象樣本的分類預(yù)測結(jié)果。
7.如權(quán)利要求6所述的對象分類模型訓(xùn)練方法,其中,確定所述當(dāng)前訓(xùn)練對象樣本與各個(gè)聚類中心對象樣本之間的樣本相似度包括:
基于對象樣本的樣本特征表征,確定所述當(dāng)前訓(xùn)練對象樣本與所述各個(gè)聚類中心對象樣本之間的樣本相似度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310414442.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





