[發明專利]數據處理方法及系統、計算機系統和計算機可讀存儲介質在審
| 申請號: | 201810616843.2 | 申請日: | 2018-06-14 |
| 公開(公告)號: | CN110610392A | 公開(公告)日: | 2019-12-24 |
| 發明(設計)人: | 徐邵稀 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06Q10/04 |
| 代理公司: | 11021 中科專利商標代理有限責任公司 | 代理人: | 呂雁葭 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 向量 向量集 隱含 預測評估模型 神經網絡 計算機可讀存儲介質 目標函數生成 數據處理系統 目標函數 誤差優化 樣本數據 輸出 數據處理 計算機系統 評估 預測 優化 | ||
本公開提供了一種數據處理方法,包括:根據第一樣本數據確定第一向量集和第二向量集;將第一向量集中的每一個第一向量輸入第一神經網絡,輸出第一隱含因子向量;將第二向量集中的每一個第二向量輸入第二神經網絡,輸出第二隱含因子向量;根據第一隱含因子向量集的誤差和第二隱含因子向量集的誤差優化目標函數;以及根據優化后的目標函數生成預測評估模型,其中,預測評估模型用于預測用戶對產品的評估值。本公開還提供了一種數據處理系統、一種計算機系統和一種計算機可讀存儲介質。
技術領域
本公開涉及計算機技術領域,更具體地,涉及一種數據處理方法及系統、一種計算機系統和一種計算機可讀存儲介質。
背景技術
隨著網絡的迅速發展,使得信息量呈爆炸式地增長,為避免用戶瀏覽大量無關的信息和產品,個性化推薦應運而生。個性化推薦是根據用戶的興趣特點和購買行為,向用戶推薦用戶感興趣的信息和產品。個性化推薦系統能建立在海量數據挖掘基礎上,幫助電子商務網站為其顧客購物提供完全個性化的決策支持和信息服務。給定用戶對產品的歷史評估記錄或行為,預測用戶對新產品的評估值,是個性化推薦系統的典型模式之一。
在實現本公開構思的過程中,發明人發現相關技術中至少存在如下問題:
相關技術中訓練得到的預測評估模型的準確率低,導致個性化推薦效果差。
發明內容
有鑒于此,本公開提供了一種數據處理方法及系統、一種計算機系統和一種計算機可讀存儲介質。
本公開的一個方面提供了一種數據處理方法,包括根據第一樣本數據確定第一向量集和第二向量集,其中,上述第一樣本數據包括多個用戶對不同產品的評估值,上述第一向量集中的每一個第一向量表征同一用戶對不同產品的評估值,上述第二向量集中的每一個第二向量表征多個用戶對同一產品的評估值;將上述第一向量集中的每一個第一向量輸入第一神經網絡,輸出第一隱含因子向量,其中,每一個第一向量具有對應的第一隱含因子向量,一個或多個第一隱含因子向量組成第一隱含因子向量集;將上述第二向量集中的每一個第二向量輸入第二神經網絡,輸出第二隱含因子向量,其中,每一個第二向量具有對應的第二隱含因子向量,一個或多個第二隱含因子向量組成第二隱含因子向量集;根據上述第一隱含因子向量集的誤差和上述第二隱含因子向量集的誤差優化目標函數;以及根據優化后的目標函數生成預測評估模型,其中,上述預測評估模型用于預測用戶對產品的評估值。
根據本公開的實施例,上述方法還包括根據上述第一樣本數據生成評估矩陣,其中,上述評估矩陣中的每一個元素表征用戶對產品的評估值;將上述評估矩陣分解成第一矩陣和第二矩陣,其中,上述第一矩陣包括多個第三隱含因子向量,每一個第三隱含因子向量表征對應用戶的隱含因子向量,上述第二矩陣包括多個第四隱含因子向量,每一個第四隱含因子向量表征對應產品的隱含因子向量;以及根據上述第一隱含因子向量集的誤差和上述第二隱含因子向量集的誤差優化目標函數包括:根據上述第一隱含因子向量和上述第三隱含因子向量之間的第一差值與上述第二隱含因子向量和上述第四隱含因子向量之間的第二差值優化上述目標函數。
根據本公開的實施例,上述方法還包括根據第二樣本數據確定第三向量集和第四向量集,其中,上述第二樣本數據包括多個用戶的用戶信息和多種產品的產品信息,上述第三向量集中的每一個第三向量表征同一用戶的用戶信息,上述第四向量集中的每一個第四向量表征同一產品的產品信息;將上述第一向量集中的每一個第一向量輸入第一神經網絡,輸出第一隱含因子向量包括:將第一向量和相應的第三向量一起輸入上述第一神經網絡,輸出第五隱含因子向量;將上述第二向量集中的每一個第二向量輸入第二神經網絡,輸出第二隱含因子向量包括:將第二向量和相應的第四向量一起輸入上述第二神經網絡,輸出第六隱含因子向量;以及根據上述第一隱含因子向量集的誤差和上述第二隱含因子向量集的誤差優化目標函數包括根據上述第五隱含因子向量和上述第三隱含因子向量之間的第三差值與上述第六隱含因子向量和上述第四隱含因子向量之間的第四差值優化上述目標函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810616843.2/2.html,轉載請聲明來源鉆瓜專利網。





