[發(fā)明專利]數(shù)據(jù)處理方法、裝置、存儲介質(zhì)和電子裝置有效
| 申請?zhí)枺?/td> | 201810074163.2 | 申請日: | 2018-01-25 |
| 公開(公告)號: | CN108427708B | 公開(公告)日: | 2021-06-25 |
| 發(fā)明(設計)人: | 周星 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F40/284;G06N3/04;G06N3/08 |
| 代理公司: | 北京康信知識產(chǎn)權代理有限責任公司 11240 | 代理人: | 趙囡囡 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù)處理 方法 裝置 存儲 介質(zhì) 電子 | ||
1.一種數(shù)據(jù)處理方法,其特征在于,包括:
獲取目標樣本,其中,所述目標樣本包括目標媒體文件在本次曝光時的特征數(shù)據(jù)和與所述特征數(shù)據(jù)相關聯(lián)的歷史信息,所述特征數(shù)據(jù)為影響所述目標媒體文件被執(zhí)行目標操作的概率的數(shù)據(jù),所述特征數(shù)據(jù)用于確定所述目標媒體文件被執(zhí)行目標操作的概率,所述特征數(shù)據(jù)包括的多個特征之間具有非線性關系,所述歷史信息用于指示在已過去的預定時間段上與所述特征數(shù)據(jù)對應的所述目標媒體文件的信息;
使用所述歷史信息對預定模型進行深度學習的訓練,得到訓練好的目標模型,其中,所述歷史信息由所述預定模型中的至少一個神經(jīng)元進行處理;
通過所述目標模型和所述目標媒體文件在所述本次曝光時的所述特征數(shù)據(jù),確定出所述目標媒體文件在所述本次曝光之后被執(zhí)行所述目標操作的概率。
2.根據(jù)權利要求1所述的方法,其特征在于,獲取所述目標樣本包括:
獲取在所述預定時間段上所述目標媒體文件進行曝光的曝光數(shù)據(jù),和在所述目標媒體文件進行所述曝光后,目標媒體文件被執(zhí)行所述目標操作的操作數(shù)據(jù);
從目標媒體數(shù)據(jù)中提取出所述特征數(shù)據(jù),其中,所述目標媒體數(shù)據(jù)包括具有關聯(lián)關系的所述曝光數(shù)據(jù)和所述操作數(shù)據(jù);
將與所述特征數(shù)據(jù)對應的所述歷史信息添加至樣本數(shù)據(jù)中,得到所述目標樣本,其中,所述樣本數(shù)據(jù)為用于進行所述深度學習的訓練的數(shù)據(jù),所述樣本數(shù)據(jù)包括所述特征數(shù)據(jù)。
3.根據(jù)權利要求2所述的方法,其特征在于,從所述目標媒體數(shù)據(jù)中提取出所述特征數(shù)據(jù)包括:
從所述目標媒體數(shù)據(jù)中的多組組合數(shù)據(jù)中,提取出權重大于目標閾值的目標組合數(shù)據(jù),其中,每組所述組合數(shù)據(jù)包括一組具有所述關聯(lián)關系的所述曝光數(shù)據(jù)和所述操作數(shù)據(jù),所述權重用于指示所述組合數(shù)據(jù)對確定所述目標媒體文件被執(zhí)行所述目標操作的概率的影響程度;
將所述目標組合數(shù)據(jù)中的具有所述關聯(lián)關系的所述曝光數(shù)據(jù)和所述操作數(shù)據(jù)確定為所述特征數(shù)據(jù)。
4.根據(jù)權利要求2所述的方法,其特征在于,在從所述目標媒體數(shù)據(jù)中提取出所述特征數(shù)據(jù)之前,所述方法還包括:
將具有相同標識信息的所述曝光數(shù)據(jù)和所述操作數(shù)據(jù)進行關聯(lián),得到所述目標媒體數(shù)據(jù),其中,具有所述標識信息的所述操作數(shù)據(jù),是在具有所述標識信息的所述曝光數(shù)據(jù)產(chǎn)生之后,在所述目標媒體文件被執(zhí)行所述目標操作時產(chǎn)生。
5.根據(jù)權利要求1所述的方法,其特征在于,
在所述獲取目標樣本之后、且在所述使用所述歷史信息對所述預定模型進行深度學習的訓練,得到訓練好的所述目標模型之前,所述方法還包括:對所述歷史信息進行處理,得到目標維度的向量,其中,所述目標維度低于目標閾值,在對所述預定模型進行所述深度學習的訓練時,所述目標維度的向量的辨識度高于所述歷史信息;
使用所述歷史信息對所述預定模型進行所述深度學習的訓練,得到訓練好的所述目標模型包括:使用所述目標維度的向量對所述預定模型進行所述深度學習的訓練,得到訓練好的所述目標模型。
6.根據(jù)權利要求1所述的方法,其特征在于,在確定出在所述目標媒體文件在所述本次曝光之后被執(zhí)行所述目標操作的概率之后,所述方法還包括:
按照所述目標媒體文件被執(zhí)行所述目標操作的概率,確定所述目標媒體文件在目標列表中的排序位置,其中,所述目標列表中包括的多個媒體文件按照各自被執(zhí)行所述目標操作的概率進行排序。
7.根據(jù)權利要求1至6中任意一項所述的方法,其特征在于,通過所述目標模型和所述目標媒體文件在所述本次曝光時的所述特征數(shù)據(jù),確定出在所述目標媒體文件在所述本次曝光之后被執(zhí)行所述目標操作的概率包括:
通過所述目標模型中的目標公式,對所述目標媒體文件在所述本次曝光時的所述特征數(shù)據(jù)對應的數(shù)值進行處理,得到在所述目標媒體文件在所述本次曝光之后被執(zhí)行所述目標操作的概率,其中,所述目標公式用于指示所述特征數(shù)據(jù)與在所述目標媒體文件在所述本次曝光之后被執(zhí)行所述目標操作的概率之間的關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810074163.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





