[發明專利]一種數據分類方法、計算機設備及可讀存儲介質在審
| 申請號: | 202110011574.9 | 申請日: | 2021-01-04 |
| 公開(公告)號: | CN113392236A | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 諸加丹 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/45 | 分類號: | G06F16/45 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 分類 方法 計算機 設備 可讀 存儲 介質 | ||
本申請實施例公開了一種數據分類方法、計算機設備及可讀存儲介質,其中,方法包括:獲取多媒體數據中的圖像數據和文本數據;獲取多媒體數據的圖像特征,獲取多媒體數據的文本特征,將圖像特征及文本特征進行特征融合得到融合特征;基于數據分類模型對圖像特征進行預測,得到對象標簽,獲取對象標簽所關聯的至少兩個預測標簽及每個預測標簽的第一概率值,基于數據分類模型對融合特征進行預測,得到每個預測標簽的第二概率值;對預測標簽p的第一概率值與預測標簽p的第二概率值進行融合,直至得到每個預測標簽的第三概率值,基于每個預測標簽的第三概率值及對象標簽,確定媒體數據類別。采用本申請實施例,可以提高數據分類的準確性。
技術領域
本申請涉及計算機技術領域,尤其涉及一種數據分類方法、計算機設備及可讀存儲介質。
背景技術
多媒體數據已廣泛應用于多個行業,在某些應用場景中,例如對多媒體數據進行分類的場景中,現有技術一般是根據多媒體數據中的圖像對多媒體數據進行分類,以得到該多媒體數據中所包括的客觀物體,基于該客觀物體確定多媒體數據的類別。然而,只依靠多媒體數據中圖像本身的信息去獲取多媒體數據的主觀分類結果時,由于針對同一客觀物體進行主觀判斷,會出現判斷結果不同的情況,從而導致數據分類的準確性較低。
發明內容
本申請實施例提供一種數據分類方法、計算機設備及可讀存儲介質,可以提高數據分類的準確性。
本申請實施例一方面提供一種數據分類方法,包括:
獲取多媒體數據中的圖像數據和文本數據;
根據該圖像數據獲取該多媒體數據的圖像特征,根據該文本數據獲取該多媒體數據的文本特征,將該圖像特征及該文本特征進行特征融合,得到融合特征;
基于數據分類模型對該圖像特征進行預測,得到對象標簽,獲取該對象標簽所關聯的至少兩個預測標簽及每個預測標簽分別對應的第一概率值,基于該數據分類模型對該融合特征進行預測,得到該每個預測標簽分別對應的第二概率值;該至少兩個預測標簽包括預測標簽p,該p為正整數;
對該預測標簽p的第一概率值與該預測標簽p的第二概率值進行融合,得到該預測標簽p的第三概率值,直至得到該每個預測標簽分別對應的第三概率值,基于該每個預測標簽分別對應的第三概率值及該對象標簽,確定該多媒體數據對應的媒體數據類別。
本申請實施例一方面提供一種數據分類方法,包括:
獲取樣本多媒體數據中的樣本圖像數據和樣本文本數據,獲取該樣本多媒體數據的樣本標簽;
根據該樣本圖像數據獲取該樣本多媒體數據的樣本圖像特征,根據該樣本文本數據獲取該樣本多媒體數據的樣本文本特征,將該樣本圖像特征及該樣本文本特征進行特征融合,得到樣本融合特征;
基于初始數據分類模型對該樣本圖像特征進行預測,得到樣本對象標簽,獲取該樣本對象標簽所關聯的至少兩個樣本預測標簽及每個樣本預測標簽對應的第一樣本概率值,基于該初始數據分類模型對該樣本融合特征進行預測,得到該每個樣本預測標簽分別對應的第二樣本概率值;該至少兩個樣本預測標簽包括樣本預測標簽j,該j為正整數;
對該樣本預測標簽j的第一樣本概率值與該樣本預測標簽j的第二樣本概率值進行融合,得到該樣本預測標簽j的第三樣本概率值,直至得到該每個樣本預測標簽分別對應的第三樣本概率值,根據該每個樣本預測標簽分別對應的第三樣本概率值及該樣本對象標簽,確定該樣本多媒體數據對應的模型輸出標簽;根據該樣本標簽及該模型輸出標簽所組成的損失函數,對該初始數據分類模型進行訓練,得到數據分類模型。
本申請實施例一方面提供一種數據分類裝置,包括:
數據獲取模塊,用于獲取多媒體數據中的圖像數據和文本數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110011574.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據處理方法、裝置、設備及介質
- 下一篇:一種生米黃酒的生產工藝
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





