[發明專利]數據處理方法、裝置、服務器及存儲介質在審
| 申請號: | 202011153160.1 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN112148902A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 歐子菁;趙瑞輝;林民龍;蘇勤亮 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/48 | 分類號: | G06F16/48;G06F16/438;G06F16/44;G06F16/9535 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 服務器 存儲 介質 | ||
1.一種數據處理方法,其特征在于,包括:
獲取樣本多媒體數據集,所述樣本多媒體數據集包括至少兩個樣本多媒體數據;
獲取所述樣本多媒體數據集中每個樣本多媒體數據的特征信息,其中,所述特征信息包括數據內容信息或向量分布特征信息;
對任意兩個樣本多媒體數據的特征信息進行關聯性分析,并根據關聯性分析結果確定所述樣本多媒體數據集中任意兩個樣本多媒體數據之間的數據關聯關系;
根據所述數據關聯關系構建目標模型,所述目標模型用于對輸入的目標多媒體數據進行處理并生成目標哈希碼,所述目標哈希碼用于獲取與所述目標多媒體數據相關的多媒體數據。
2.根據權利要求1所述的方法,其特征在于,一個樣本多媒體數據對應一個哈希碼向量,若所述特征信息為向量分布特征信息,且所述多媒體數據集中每個樣本多媒體數據的哈希碼向量的分布屬于目標分布;所述對任意兩個樣本多媒體數據的特征信息進行關聯性分析,包括:
確定任意兩個樣本多媒體數據對應哈希碼向量的數量積,并將所述數量積和預設數量積閾值進行對比;
將所述數量與和所述預設數量積閾值的對比結果,作為對所述任意兩個樣本多媒體數據的關聯性分析結果。
3.根據權利要求2所述的方法,其特征在于,所述根據關聯性分析結果確定所述樣本多媒體數據集中任意兩個樣本多媒體數據之間的數據關聯關系,包括:
若所述數量積大于所述預設數量積閾值,則確定所述任意兩個樣本多媒體數據之間具備數據關聯關系;
若所述數量積小于等于所述預設數量積閾值,則確定所述任意兩個樣本多媒體數據之間不具備數據關聯關系。
4.根據權利要求1所述的方法,其特征在于,若所述特征信息為數據內容信息,所述對任意兩個樣本多媒體數據的特征信息進行關聯性分析,包括:
根據任意兩個樣本多媒體數據的數據內容信息,對所述任意兩個樣本多媒體數據進行引用關系檢測;
將所述引用關系檢測的結果作為對所述任意兩個樣本多媒體數據的關聯性分析結果。
5.根據權利要求4所述的方法,其特征在于,所述根據關聯性分析結果確定所述樣本多媒體數據集中任意兩個樣本多媒體數據之間的數據關聯關系,包括:
若所述引用關系檢測的結果指示所述任意兩個多媒體數據的數據內容存在引用關系,則確定所述任意兩個樣本多媒體數據之間具備數據關聯關系;
若所述引用關系檢測的結果指示所述任意兩個多媒體數據的數據內容不存在引用關系,則確定所述任意兩個樣本多媒體數據之間不具備數據關聯關系。
6.根據權利要求1所述的方法,其特征在于,構建的目標模型滿足聯合概率分布函數,所述聯合概率分布函數為第一聯合概率分布函數或第二聯合概率分布函數;
其中,若所述數據關聯關系根據對所述向量分布特征信息的關聯性分析確定,則所述目標模型滿足所述第一聯合概率分布函數,若所述數據關聯關系根據對所述數據內容信息的關聯性分析確定,則所述目標模型滿足所述第二聯合概率分布函數。
7.根據權利要求1所述的方法,其特征在于,所述根據所述數據關聯關系構建目標模型之后,所述方法還包括:
確定用于訓練所述目標模型的獎勵函數;
采用所述樣本多媒體數據集包括的樣本多媒體數據,并按照所述獎勵函數增大的方向對所述目標模型滿足的聯合概率分布函數和概率計算函數進行訓練;
在所述獎勵函數的函數取值滿足預設閾值時完成對所述目標模型的訓練。
8.根據權利要求7所述的方法,其特征在于,所述方法還包括:
調用訓練完成的目標模型生成輸入的目標多媒體數據的多個參考哈希碼向量;
根據概率計算函數確定每個參考哈希碼向量為所述目標多媒體數據的理論哈希碼向量的概率值,并從所述概率值中選取滿足預設條件的目標概率值;
確定所述目標概率值對應的目標哈希碼向量,并根據所述目標哈希碼向量指示的哈希碼確定所述目標多媒體數據的目標哈希碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011153160.1/1.html,轉載請聲明來源鉆瓜專利網。





