[發(fā)明專利]數(shù)據(jù)處理方法、裝置、服務器及存儲介質在審
| 申請?zhí)枺?/td> | 202011153160.1 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN112148902A | 公開(公告)日: | 2020-12-29 |
| 發(fā)明(設計)人: | 歐子菁;趙瑞輝;林民龍;蘇勤亮 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/48 | 分類號: | G06F16/48;G06F16/438;G06F16/44;G06F16/9535 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù)處理 方法 裝置 服務器 存儲 介質 | ||
本發(fā)明實施例公開了一種數(shù)據(jù)處理方法、裝置、服務器及存儲介質,其中方法包括:獲取樣本多媒體數(shù)據(jù)集,樣本多媒體數(shù)據(jù)集包括至少兩個樣本多媒體數(shù)據(jù);獲取樣本多媒體數(shù)據(jù)集中每個樣本多媒體數(shù)據(jù)的特征信息,其中,特征信息包括數(shù)據(jù)內容信息或向量分布特征信息;對任意兩個樣本多媒體數(shù)據(jù)的特征信息進行關聯(lián)性分析,并根據(jù)關聯(lián)性分析結果確定樣本多媒體數(shù)據(jù)集中任意兩個樣本多媒體數(shù)據(jù)之間的數(shù)據(jù)關聯(lián)關系;根據(jù)數(shù)據(jù)關聯(lián)關系構建目標模型,目標模型用于對輸入的目標多媒體數(shù)據(jù)進行處理并生成目標哈希碼,目標哈希碼用于獲取與目標多媒體數(shù)據(jù)相關的多媒體數(shù)據(jù)。可構建新的目標模型,采用該新的目標模型可提升進行數(shù)據(jù)搜索時的速度和準確度。
技術領域
本申請涉及計算機技術領域,尤其涉及一種數(shù)據(jù)處理方法、裝置、服務器及存儲介質。
背景技術
隨著當前互聯(lián)網技術的深入發(fā)展,當前,為了實現(xiàn)基于用戶的搜索信息(或查詢信息),向用戶輸出滿足搜索條件的多媒體數(shù)據(jù),通常采用訓練完成的模型對用戶的信息搜索(或數(shù)據(jù)搜索)過程進行支撐,其中,當前用于支撐信息搜索的模型都是調用模型對多媒體數(shù)據(jù)進行數(shù)據(jù)分析,從而根據(jù)模型對多媒體數(shù)據(jù)的分析結果確定每個多媒體數(shù)據(jù)是否滿足搜索條件,并輸出滿足搜索條件的多媒體數(shù)據(jù)。但是,隨著多媒體數(shù)據(jù)數(shù)量的快速增長,使得對多媒體數(shù)據(jù)的數(shù)據(jù)分析壓力越來越大,從而造成信息搜索的響應速度的下降和精準度的降低,由此可見,如何構建新的模型,并使得該新的模型進行信息搜索時具備較高的精準度和搜索速度成為了當前的研究熱點。
發(fā)明內容
本發(fā)明實施例提供了一種數(shù)據(jù)處理方法、裝置、服務器及存儲介質,可構建新的目標模型,采用該新的目標模型可提升進行數(shù)據(jù)搜索時的速度和準確度。
一方面,本發(fā)明實施例提供了一種數(shù)據(jù)處理方法,包括:
獲取樣本多媒體數(shù)據(jù)集,所述樣本多媒體數(shù)據(jù)集包括至少兩個樣本多媒體數(shù)據(jù);
獲取所述樣本多媒體數(shù)據(jù)集中每個樣本多媒體數(shù)據(jù)的特征信息,其中,所述特征信息包括數(shù)據(jù)內容信息或向量分布特征信息;
對任意兩個樣本多媒體數(shù)據(jù)的特征信息進行關聯(lián)性分析,并根據(jù)關聯(lián)性分析結果確定所述樣本多媒體數(shù)據(jù)集中任意兩個樣本多媒體數(shù)據(jù)之間的數(shù)據(jù)關聯(lián)關系;
根據(jù)所述數(shù)據(jù)關聯(lián)關系構建目標模型,所述目標模型用于對輸入的目標多媒體數(shù)據(jù)進行處理并生成目標哈希碼,所述目標哈希碼用于獲取與所述目標多媒體數(shù)據(jù)相關的多媒體數(shù)據(jù)。
再一方面,本發(fā)明實施例提供了一種數(shù)據(jù)處理裝置,包括:
獲取單元,用于獲取樣本多媒體數(shù)據(jù)集,所述樣本多媒體數(shù)據(jù)集包括至少兩個樣本多媒體數(shù)據(jù);
所述獲取單元,還用于獲取所述樣本多媒體數(shù)據(jù)集中每個樣本多媒體數(shù)據(jù)的特征信息,其中,所述特征信息包括數(shù)據(jù)內容信息或向量分布特征信息;
確定單元,用于對任意兩個樣本多媒體數(shù)據(jù)的特征信息進行關聯(lián)性分析,并根據(jù)關聯(lián)性分析結果確定所述樣本多媒體數(shù)據(jù)集中任意兩個樣本多媒體數(shù)據(jù)之間的數(shù)據(jù)關聯(lián)關系;
構建單元,用于根據(jù)所述數(shù)據(jù)關聯(lián)關系構建目標模型,所述目標模型用于對輸入的目標多媒體數(shù)據(jù)進行處理并生成目標哈希碼,所述目標哈希碼用于獲取與所述目標多媒體數(shù)據(jù)相關的多媒體數(shù)據(jù)。
再一方面,本發(fā)明實施例提供了一種服務器,包括處理器、輸入設備、輸出設備和存儲器,所述處理器、輸入設備、輸出設備和存儲器相互連接,其中,所述存儲器用于存儲支持終端執(zhí)行上述方法的計算機程序,所述計算機程序包括程序指令,所述處理器被配置用于調用所述程序指令,執(zhí)行如下步驟:
獲取樣本多媒體數(shù)據(jù)集,所述樣本多媒體數(shù)據(jù)集包括至少兩個樣本多媒體數(shù)據(jù);
獲取所述樣本多媒體數(shù)據(jù)集中每個樣本多媒體數(shù)據(jù)的特征信息,其中,所述特征信息包括數(shù)據(jù)內容信息或向量分布特征信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011153160.1/2.html,轉載請聲明來源鉆瓜專利網。
- 數(shù)據(jù)處理設備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





