[發明專利]瀏覽數據處理方法、裝置、非易失性存儲介質和處理在審
| 申請號: | 202010339967.8 | 申請日: | 2020-04-26 |
| 公開(公告)號: | CN111523944A | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 陳鉻亮 | 申請(專利權)人: | 北京深演智能科技股份有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F16/9535;G06N20/00 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 董文倩 |
| 地址: | 100020 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 瀏覽 數據處理 方法 裝置 非易失性 存儲 介質 處理 | ||
本發明公開了一種瀏覽數據處理方法、裝置、非易失性存儲介質和處理。其中,該方法包括:獲取歷史瀏覽數據和線下意向數據;從歷史瀏覽數據和線下意向數據中獲取樣本數據,其中,樣本數據包括:訓練樣本數據和測試樣本數據;依據訓練樣本數據和測試樣本數據通過機器學習,得到打分模型;依據打分模型對每個用戶標識的瀏覽數據進行打分,依據打分確定用戶的瀏覽意向。本發明解決了由于現有技術中針對線上和線下數據量大導致的數據處理效率低的技術問題。
技術領域
本發明涉及互聯網技術領域,具體而言,涉及一種瀏覽數據處理方法、裝置、非易失性存儲介質和處理。
背景技術
隨著線上商務的發展,針對網站的瀏覽量的數據分析也越來越重要,特別是對瀏覽網站的用戶的意向分析;
但是線上和線下數據量往往都非常大,選擇、篩選、確定若都通過人工完成,對人工的工作量而言則負擔太大,以及對數據的獲取的準確度往往不會達到業務需求標準。
針對上述由于現有技術中針對線上和線下數據量大導致的數據處理效率低的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種瀏覽數據處理方法、裝置、非易失性存儲介質和處理,以至少解決由于現有技術中針對線上和線下數據量大導致的數據處理效率低的技術問題。
根據本發明實施例的一個方面,提供了一種瀏覽數據處理方法,包括:獲取歷史瀏覽數據和線下意向數據;從歷史瀏覽數據和線下意向數據中獲取樣本數據,其中,樣本數據包括:訓練樣本數據和測試樣本數據;依據訓練樣本數據和測試樣本數據通過機器學習,得到打分模型;依據打分模型對每個用戶標識的瀏覽數據進行打分,依據打分確定用戶的瀏覽意向。
可選的,獲取歷史瀏覽數據和線下意向數據包括:檢測網站每個頁面和每個頁面中可交互項在每個用戶標識訪問時是否觸發過;依據檢測結果生成歷史瀏覽數據;以及,獲取線下門店反饋的每個用戶標識的意向數據,其中,意向數據包括:購買、試用和了解待售產品中至一種;依據意向數據生成線下意向數據。
可選的,從歷史瀏覽數據和線下意向數據中獲取樣本數據包括:依據每個用戶標識從歷史瀏覽數據和線下意向數據中,獲取每個用戶標識的訪問記錄;依據每個用戶標識的訪問記錄中對網頁中的可交互項進行操作確定為特征數據;依據每個用戶標識的訪問記錄中對待售產品的意向數據確定類別標簽;依據特征數據和類別標簽生成樣本數據。
進一步地,可選的,依據特征數據和類別標簽生成樣本數據包括:依據預設比例,從特征數據和類別標簽中獲取訓練樣本數據和測試樣本數據。
可選的,依據訓練樣本數據和測試樣本數據通過機器學習,得到打分模型包括:依據訓練樣本數據進行機器學習,得到待優化模型;依據測試樣本數據對待優化模型進行優化,得到打分模型。
可選的,依據打分確定用戶的瀏覽意向包括:依據打分所處的預設分值區間,確定打分對應的用戶的瀏覽意向;其中,瀏覽意向包括:購買意向、收藏意向和推薦意向中的至少一種。
根據本發明實施例的另一方面,還提供了一種瀏覽數據處理裝置,包括:獲取模塊,用于獲取歷史瀏覽數據和線下意向數據;樣本獲取模塊,用于從歷史瀏覽數據和線下意向數據中獲取樣本數據,其中,樣本數據包括:訓練樣本數據和測試樣本數據;模型生成模塊,用于依據訓練樣本數據和測試樣本數據通過機器學習,得到打分模型;打分模塊,用于依據打分模型對每個用戶標識的瀏覽數據進行打分,依據打分確定用戶的瀏覽意向。
可選的,獲取模塊包括:檢測單元,用于檢測網站每個頁面和每個頁面中可交互項在每個用戶標識訪問時是否觸發過;第一數據生成單元,用于依據檢測結果生成歷史瀏覽數據;以及,獲取單元,用于獲取線下門店反饋的每個用戶標識的意向數據,其中,意向數據包括:購買、試用和了解待售產品中至一種;第二數據生成單元,用于依據意向數據生成線下意向數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京深演智能科技股份有限公司,未經北京深演智能科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010339967.8/2.html,轉載請聲明來源鉆瓜專利網。





