[發明專利]數據處理方法、介質、裝置和計算設備在審
| 申請號: | 201811394830.1 | 申請日: | 2018-11-21 |
| 公開(公告)號: | CN109543107A | 公開(公告)日: | 2019-03-29 |
| 發明(設計)人: | 傅凌進 | 申請(專利權)人: | 網易無尾熊(杭州)科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06K9/62;G06Q30/06 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 呂雁葭 |
| 地址: | 310051 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標識序列 對象標識 向量數據 用戶行為數據 計算設備 數據處理 嵌入 數據處理裝置 對象構建 用戶行為 計算量 構建 | ||
本發明的實施方式提供了一種數據處理方法,包括:獲取多個用戶行為數據;基于所述多個用戶行為數據確定所述多個用戶行為對應的多個對象;基于所述多個對象構建至少一個標識序列,每個標識序列中包括至少一個對象標識,其中,每個對象對應一個對象標識;對所述至少一個標識序列進行詞嵌入處理,確定所述至少一個標識序列中的每個對象標識對應的第一向量數據。本發明通過構建對象的標識序列,并且通過詞嵌入方法處理該標識序列,可以得到每個對象對應的向量數據,從而可以通過向量數據表示某個對象,降低了確定對象之間相關性的計算難度,減少了計算量。此外,本發明的實施方式提供了一種數據處理裝置、一種計算設備和一種介質。
技術領域
本發明的實施方式涉及計算機技術領域,更具體地,本發明的實施方式涉及一種數據處理方法、介質、裝置和計算設備。
背景技術
本部分旨在為權利要求書中陳述的本發明的實施方式提供背景或上下文。此處的描述不因為包括在本部分中就承認是現有技術。
隨著互聯網技術和計算機技術的快速發展,通過網絡平臺進行信息搜索或者交易等活動以其低成本、高效率的優勢獲得了越來越多的用戶青睞。用戶在使用網絡平臺瀏覽當前對象時,通常也會關注與當前對象相關的其他對象。有鑒于此,服務提供商為了給用戶提供更加體貼的服務,通常在展示當前對象的同時,也為其推薦其他相關的對象,從而可以為用戶提供更加全面的信息,提高用戶體驗感。因此,如何確定各對象之間的相關性成為推薦時的重要參考標準。
目前,已經出現一些計算對象之間相關性的方法,例如,通過屬性信息來表示某個對象(例如,可以通過手機、256GB內存、2160×1080像素、5.99英寸顯示屏等屬性信息表示對象A,通過鞋、37碼、卡其色等屬性信息表述對象B),然后通過計算各個對象之間的屬性信息的相關性確定對象之間的相關性。
發明內容
然而,在實現本發明構思的過程中,發明人發現現有技術中至少存在如下問題,即,通過屬性信息來表示對象則會導致確定對象之間的相關性的算法十分復雜。
為此,非常需要一種改進的數據處理方法,以簡化對象之間的相關性的計算,降低相關性計算的難度。
在本上下文中,本發明的實施方式期望提供一種數據處理方法、介質、裝置和計算設備。
在本發明實施方式的第一方面中,提供了一種數據處理方法,包括:獲取多個用戶行為數據,基于所述多個用戶行為數據確定所述多個用戶行為對應的多個對象,基于所述多個對象構建至少一個標識序列,每個標識序列中包括至少一個對象標識,其中,每個對象對應一個對象標識,以及對所述至少一個標識序列進行詞嵌入處理,確定所述至少一個標識序列中的每個對象標識對應的第一向量數據。
在本發明的一個實施例中,上述方法還包括:對所述用戶行為數據進行預處理,去除不滿足第一預設條件的用戶的用戶行為數據。
在本發明的一個實施例中,上述基于所述多個對象構建至少一個標識序列,包括:根據每個用戶的用戶行為數據的時間順序,基于每個用戶的用戶行為對應的對象構建每個用戶對應的第一序列,以及根據第一預設規則切分所述每個用戶對應的第一序列,得到所述至少一個標識序列。
在本發明的一個實施例中,上述方法還包括:獲取所述至少一個標識序列中的每個對象標識對應的向量數據集合,所述向量數據集合中包括該對象標識在不同時間對應的至少一個第二向量數據,以及基于所述向量數據集合中的至少一個第二向量數據和所述第一向量數據確定每個對象對應的平均向量數據。
在本發明的一個實施例中,上述的方法還包括:根據預設參數對所述每個對象對應的平均向量數據進行降維處理,得到所述每個對象對應的降維向量數據。
在本發明的一個實施例中,上述的方法還包括:根據所述每個對象對應的降維向量數據,確定對象間的相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于網易無尾熊(杭州)科技有限公司,未經網易無尾熊(杭州)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811394830.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種體育運動綜合咨詢服務系統
- 下一篇:面向網絡多域信息的用戶角色挖掘系統





