[發明專利]數據處理方法及系統、計算機系統和計算機可讀存儲介質在審
| 申請號: | 201810727790.1 | 申請日: | 2018-07-04 |
| 公開(公告)號: | CN110689032A | 公開(公告)日: | 2020-01-14 |
| 發明(設計)人: | 曹宇;周默;周瑜;李凱東 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q10/06;G06Q30/02 |
| 代理公司: | 11021 中科專利商標代理有限責任公司 | 代理人: | 呂雁葭 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基礎指標 偏好 目標應用 權重 計算機可讀存儲介質 數據處理系統 場景 偏好特征 權重確定 數據處理 用戶參與 預設條件 統計 計算機系統 更新 構建 表現 | ||
本公開提供了一種數據處理方法,包括:構建適用于目標應用場景的多個基礎指標,其中,多個基礎指標中的每個基礎指標所對應的指標值用于評價用戶參與目標應用場景時所表現的偏好特征;獲取與用戶對應的多個基礎指標中的每個基礎指標所對應的指標值;根據每個基礎指標所對應的指標值和該基礎指標的權重確定該用戶的統計偏好得分;以及根據用戶的統計偏好得分和該用戶的標準偏好得分更新每個基礎指標的權重,以使得在更新每個基礎指標的權重之后,用戶的統計偏好得分與標準偏好得分之間的差值滿足預設條件。本公開還提供了一種數據處理系統、一種計算機系統和一種計算機可讀存儲介質。
技術領域
本公開涉及計算機技術領域,更具體地,涉及一種數據處理方法及系統、一種計算機系統和一種計算機可讀存儲介質。
背景技術
在相關技術中,通過對用戶產生的操作數據進行分析,可以評價用戶的行為特征。例如,根據交易用戶的歷史瀏覽,參與促銷,關注,購買等操作數據,將用戶分成具有區分度的不同類別,例如將用戶分成高度敏感,中高度敏感,中度敏感,中低度敏感和低度敏感,通過對用戶的分類可以有針對性地進行促銷。
但由于交易用戶促銷敏感度概念不夠明確,邊界不夠清晰,不適合采用有監督學習對用戶設置一個目標值(該目標值用于確定用戶是否敏感)來進行分類,由此,當前所采用的技術為非監督學習,例如采用聚類算法。但聚合的類別不一定能表示出敏感度從高到低的等級劃分,因為聚類準確度,很大程度取決于特征的設計和具體數據的分布,聚類算法不能夠靈活地通過調整特征權重以自適應的重新匹配。
在實現本公開構思的過程中,發明人發現相關技術中至少存在如下問題:相關技術中確定用戶的敏感度等模糊概念時采用的技術難以適用不同的應用場景,導致泛化能力差。
發明內容
有鑒于此,本公開提供了一種數據處理方法及系統、一種計算機系統和一種計算機可讀存儲介質。
本公開的一個方面提供了一種數據處理方法,包括構建適用于目標應用場景的多個基礎指標,其中,上述多個基礎指標中的每個基礎指標所對應的指標值用于評價用戶參與上述目標應用場景時所表現的偏好特征;獲取與用戶對應的上述多個基礎指標中的每個基礎指標所對應的指標值;根據上述每個基礎指標所對應的指標值和該基礎指標的權重確定該用戶的統計偏好得分;以及根據上述用戶的統計偏好得分和該用戶的標準偏好得分更新上述每個基礎指標的權重,以使得在更新上述每個基礎指標的權重之后,上述用戶的統計偏好得分與標準偏好得分之間的差值滿足預設條件。
根據本公開的實施例,上述方法還包括確定每個用戶的標準偏好得分,包括獲取上述每個用戶參與上述目標應用場景時產生的操作數據;確定適用于上述目標應用場景的權重,其中,上述目標應用場景的權重與上述基礎指標的權重不同;根據上述每個用戶參與上述目標應用場景時產生的操作數據與上述適用于上述目標應用場景的權重確定用戶的標準偏好得分。
根據本公開的實施例,根據上述每個用戶參與上述目標應用場景時產生的操作數據與上述適用于上述目標應用場景的權重確定用戶的標準偏好得分包括將上述每個用戶參與上述目標應用場景時產生的操作數據按照操作類型進行分類,得到上述每個用戶在不同操作類型下對應的操作數據;將上述每個用戶在同一操作類型下對應的操作數據按照數值大小進行排序;根據排序結果將所有用戶分成多個組,其中,每個用戶都具有與之對應的組;為上述多個組中的每個組設置相應的標準得分;以及根據上述每個用戶對應的組的標準得分與上述適用于上述目標應用場景的權重確定每個用戶的標準偏好得分。
根據本公開的實施例,根據上述用戶的統計偏好得分和該用戶的標準偏好得分更新上述每個基礎指標的權重包括確定上述用戶的統計偏好得分與標準偏好得分之間的差值的損失函數;以及通過上述損失函數采用誤差反向傳播算法和梯度下降算法更新上述每個基礎指標的權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810727790.1/2.html,轉載請聲明來源鉆瓜專利網。





