[發明專利]數據處理方法、裝置、電子設備和介質在審
| 申請號: | 202110647282.4 | 申請日: | 2021-06-10 |
| 公開(公告)號: | CN113312552A | 公開(公告)日: | 2021-08-27 |
| 發明(設計)人: | 劉昊騁;陳奇石 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06K9/62 |
| 代理公司: | 北京市漢坤律師事務所 11602 | 代理人: | 姜浩然;吳麗麗 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 電子設備 介質 | ||
1.一種數據處理方法,包括:
獲取樣本用戶數據;
基于二分類算法對所述樣本用戶數據進行有監督訓練并生成決策樹;以及
基于所述決策樹中的一個或多個節點,生成與用戶屬性相關的召回規則。
2.根據權利要求1所述的方法,其中,所述基于所述決策樹中的一個或多個節點,生成與用戶屬性相關的召回規則,包括:
對所述決策樹中的一個或多個節點進行加權計算,以生成與用戶屬性相關的所述召回規則。
3.根據權利要求1或2所述的方法,還包括:
根據所述召回規則在數據源中匹配用戶,其中,經匹配得到的用戶為可召回用戶。
4.根據權利要求3所述的方法,其中,所述用戶屬性對應于來自用戶的檢索詞,并且其中,所述數據源為全量用戶的搜索日志。
5.根據權利要求2所述的方法,其中,所述對所述決策樹中的一個或多個節點進行加權計算,以生成與用戶屬性相關的所述召回規則,包括:
基于所述決策樹中的一個或多個節點的相應的特征值生成特征值列表,其中,特征值為相應的節點用于分裂的次數與該節點分裂時的增益的乘積,所述特征值列表包含所述決策樹中的所述一個或多個節點及其對應的特征值;以及
對所述特征值列表進行排序并生成與所述用戶屬性有關的所述召回規則。
6.根據權利要求3所述的方法,其中,所述用戶屬性對應于用戶所安裝的應用程序,并且其中,所述數據源為應用程序安裝日志。
7.根據權利要求3至6中任一項所述的方法,還包括:
將所述可召回用戶的用戶特征輸入預設的排序模型;以及
根據所述排序模型的輸出結果,確定所述可召回用戶是否是目標用戶。
8.一種數據處理裝置,包括:
獲取模塊,被配置為獲取樣本用戶數據;
訓練模塊,被配置為基于二分類算法對所述樣本用戶數據進行有監督訓練并生成決策樹;以及
召回規則生成模塊,被配置為基于所述決策樹中的一個或多個節點,生成與用戶屬性相關的召回規則。
9.根據權利要求8所述的裝置,其中,所述召回規則生成模塊被進一步配置為對所述決策樹中的一個或多個節點進行加權計算,以生成與用戶屬性相關的所述召回規則。
10.根據權利要求8或9所述的裝置,還包括,
匹配模塊,被配置為根據所述召回規則在數據源中匹配用戶,其中,經匹配得到的用戶為可召回用戶。
11.根據權利要求10所述的裝置,其中,所述用戶屬性對應于來自用戶的檢索詞,并且其中,所述數據源為全量用戶的搜索日志。
12.根據權利要求9所述的裝置,其中,所述召回規則生成模塊包括:
列表生成單元,被配置為基于所述決策樹中的一個或多個節點的相應的特征值生成特征值列表,其中,特征值為相應的節點用于分裂的次數與該節點分裂時的增益的乘積,所述特征值列表包含所述決策樹中的所述一個或多個節點及其對應的特征值;以及
排序單元,被配置為對所述特征值列表進行排序并生成與所述用戶屬性有關的所述召回規則。
13.根據權利要求10所述的裝置,其中,所述用戶屬性對應于用戶所安裝的應用程序,并且其中,所述數據源為應用程序安裝日志。
14.根據權利要求10至13中任一項所述的裝置,還包括:
輸入模塊,被配置為將所述可召回用戶的用戶特征輸入預設的排序模型;以及
確定模塊,被配置為根據所述排序模型的輸出結果,確定所述可召回用戶是否是目標用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110647282.4/1.html,轉載請聲明來源鉆瓜專利網。





