[發(fā)明專利]一種內(nèi)容分類模型的訓(xùn)練方法、內(nèi)容分類的方法及裝置在審
| 申請?zhí)枺?/td> | 202210126390.1 | 申請日: | 2022-02-10 |
| 公開(公告)號: | CN114462539A | 公開(公告)日: | 2022-05-10 |
| 發(fā)明(設(shè)計)人: | 徐培;黃珊 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06N7/00 |
| 代理公司: | 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 閔晶晶 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 內(nèi)容 分類 模型 訓(xùn)練 方法 裝置 | ||
本申請公開了一種內(nèi)容分類模型的訓(xùn)練方法,涉及基于人工智能的計算機視覺技術(shù)和圖像語義理解技術(shù)。本申請包括基于內(nèi)容訓(xùn)練樣本,通過內(nèi)容分類模型所包括的特征提取網(wǎng)絡(luò)獲取M個模態(tài)特征向量;基于M個模態(tài)特征向量,通過內(nèi)容分類模型所包括的多模態(tài)融合網(wǎng)絡(luò)獲取內(nèi)容概率分布;基于M個模態(tài)特征向量,通過M個模態(tài)分類網(wǎng)絡(luò)獲取M個模態(tài)概率分布;根據(jù)M個模態(tài)概率分布、M個單模態(tài)類別標簽、內(nèi)容概率分布和內(nèi)容類別標簽,對內(nèi)容分類模型的模型參數(shù)進行更新。本申請還提供了一種內(nèi)容分類方法及裝置。本申請實現(xiàn)同時優(yōu)化多模態(tài)融合網(wǎng)絡(luò)和特征提取網(wǎng)絡(luò)的目的,達到內(nèi)容分類模型中各個網(wǎng)絡(luò)的平衡的效果,有利于提升多模態(tài)分類結(jié)果的精度和效果。
技術(shù)領(lǐng)域
本申請涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種內(nèi)容分類模型的訓(xùn)練方法、內(nèi)容分類的方法及裝置。
背景技術(shù)
隨著信息技術(shù)日新月異的發(fā)展,各種領(lǐng)域的內(nèi)容應(yīng)運而生,內(nèi)容的生產(chǎn)、積累、共享以及傳播越來越多樣且靈活。其中,內(nèi)容的傳播在現(xiàn)代人類生活占據(jù)了重要地位。為了提高用戶消費內(nèi)容的體驗,通常需要對內(nèi)容進行識別和分類。
目前,主流的內(nèi)容分類工作可采用人工智能模型來實現(xiàn)。在模型訓(xùn)練的過程中,通常對各個單模態(tài)特征提取模型進行微調(diào)后,分別提取內(nèi)容中各個單模態(tài)的特征向量,然后以各個模態(tài)特征向量作為多模態(tài)融合網(wǎng)絡(luò)的輸入,以實現(xiàn)分類任務(wù)的訓(xùn)練。
發(fā)明人發(fā)現(xiàn)現(xiàn)有方案中至少存在如下問題,各個單模態(tài)特征提取模型的效果未必平衡,也就是說,對單模態(tài)特征提取模型的優(yōu)化屬于局部優(yōu)化,而多模態(tài)融合網(wǎng)絡(luò)對各個單模態(tài)的依賴程度不同,因此,局部優(yōu)化可能無法達到全局最優(yōu),從而導(dǎo)致多模態(tài)分類結(jié)果的精度和效果不佳。
發(fā)明內(nèi)容
本申請實施例提供了一種內(nèi)容分類模型的訓(xùn)練方法、內(nèi)容分類的方法及裝置。本申請實現(xiàn)同時優(yōu)化多模態(tài)融合網(wǎng)絡(luò)和特征提取網(wǎng)絡(luò)的目的,達到內(nèi)容分類模型中各個網(wǎng)絡(luò)的平衡的效果,從而有利于提升多模態(tài)分類結(jié)果的精度和效果。
有鑒于此,本申請一方面提供一種內(nèi)容分類模型的訓(xùn)練方法,包括:
獲取內(nèi)容訓(xùn)練樣本,其中,內(nèi)容訓(xùn)練樣本對應(yīng)于已標注的M個單模態(tài)類別標簽和內(nèi)容類別標簽,M為大于1的整數(shù);
基于內(nèi)容訓(xùn)練樣本,通過內(nèi)容分類模型所包括的特征提取網(wǎng)絡(luò)獲取M個模態(tài)特征向量;
基于M個模態(tài)特征向量,通過內(nèi)容分類模型所包括的多模態(tài)融合網(wǎng)絡(luò)獲取內(nèi)容概率分布;
基于M個模態(tài)特征向量,通過M個模態(tài)分類網(wǎng)絡(luò)獲取M個模態(tài)概率分布,其中,每個模態(tài)分類網(wǎng)絡(luò)輸入的模態(tài)特征向量與輸出的模態(tài)概率分布具有對應(yīng)關(guān)系;
根據(jù)M個模態(tài)概率分布、M個單模態(tài)類別標簽、內(nèi)容概率分布和內(nèi)容類別標簽,對內(nèi)容分類模型的模型參數(shù)進行更新。
本申請另一方面提供一種內(nèi)容分類的方法,包括:
獲取目標內(nèi)容;
基于目標內(nèi)容,通過內(nèi)容分類模型獲取目標內(nèi)容所對應(yīng)的內(nèi)容概率分布,其中,內(nèi)容分類模型為采用上述各方面的方法訓(xùn)練得到的;
根據(jù)目標內(nèi)容所對應(yīng)的內(nèi)容概率分布,確定目標內(nèi)容的分類結(jié)果。
本申請另一方面提供一種模型訓(xùn)練裝置,包括:
獲取模塊,用于獲取內(nèi)容訓(xùn)練樣本,其中,內(nèi)容訓(xùn)練樣本對應(yīng)于已標注的M個單模態(tài)類別標簽和內(nèi)容類別標簽,M為大于1的整數(shù);
獲取模塊,還用于基于內(nèi)容訓(xùn)練樣本,通過內(nèi)容分類模型所包括的特征提取網(wǎng)絡(luò)獲取M個模態(tài)特征向量;
獲取模塊,還用于基于M個模態(tài)特征向量,通過內(nèi)容分類模型所包括的多模態(tài)融合網(wǎng)絡(luò)獲取內(nèi)容概率分布;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210126390.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





