[發(fā)明專利]一種目標用戶的挖掘方法、裝置、電子設備及存儲介質在審
| 申請?zhí)枺?/td> | 201910195363.8 | 申請日: | 2019-03-14 |
| 公開(公告)號: | CN109992606A | 公開(公告)日: | 2019-07-09 |
| 發(fā)明(設計)人: | 高偉;陸子龍 | 申請(專利權)人: | 北京達佳互聯(lián)信息技術有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06K9/62 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標用戶 向量 嵌入 存儲介質 待選用戶 電子設備 基準向量 用戶挖掘 相似度 方法和裝置 基準用戶 檢索效率 模型計算 向量計算 挖掘 數(shù)據量 預設 檢索 | ||
本發(fā)明實施例提供了一種目標用戶的挖掘方法、裝置、電子設備及存儲介質,該方法和裝置具體為根據預先訓練的向量計算模型計算多個待選用戶的圖嵌入向量;計算每個所述圖嵌入向量與基準用戶的基準向量之間的相似度;將超過預設閾值的相似度所對應的待選用戶選定為目標用戶。本方案通過對待選用戶的圖嵌入向量與基準向量之間進行比較的方式進行用戶挖掘,有效降低了檢索的數(shù)據量,從而加快了檢索效率,進而有效提高了用戶挖掘的效率。
技術領域
本公開涉及互聯(lián)網技術領域,尤其涉及一種目標用戶的挖掘方法、裝置、電子設備及存儲介質。
背景技術
隨著網絡技術的發(fā)展,人們的生活逐漸全面向互聯(lián)網和移動互聯(lián)網轉移,然而我們在享受網絡帶來的便利的同時,極速發(fā)展的互聯(lián)網也給我們帶來了信息爆炸的問題。對于互聯(lián)網平臺來說,如果能夠找到合適的目標用戶的話,就可以針對相應目標用戶實現(xiàn)相應的目的,例如,對于潛在的商業(yè)用戶可以向其推送相應的信息,可以實現(xiàn)相應的營銷目的。
目前在尋找合適的目標用戶時,是基于大規(guī)模離散深度學習來將用戶映射到稠密的特征空間的方法,其通過一個全連接的神經網絡對用戶頻特征進行變換,從而實現(xiàn)用戶挖掘,整個計算過程的復雜度比較高,當數(shù)據量大的時候計算速度較慢,且因為需要到用戶的整個向量空間中進行檢索,而用戶數(shù)量往往是上億級別的,使得整個檢索過程十分漫長,從而導致挖掘效率較低。
發(fā)明內容
為克服相關技術中存在的問題,本公開提供一種目標用戶的挖掘方法、裝置、電子設備及存儲介質。
第一方面,提供一種目標用戶的挖掘方法,包括:
根據預先訓練的向量計算模型計算多個待選用戶的圖嵌入向量;
計算每個所述圖嵌入向量與基準用戶的基準向量之間的相似度;
將超過預設閾值的相似度所對應的待選用戶選定為目標用戶。
可選的,所述計算每個所述圖嵌入向量與基準用戶的基準向量之間的相似度,包括:
利用局部敏感哈希算法將所述多個待選用戶的圖嵌入向量哈希到多個哈希桶中;
根據所述基準向量對每個所述哈希桶中進行計算,得到所述相似度。
可選的,在所述根據預先訓練的向量計算模型計算多個待選用戶的圖嵌入向量步驟之后,還包括:
將所述待選用戶的人口統(tǒng)計學特征值加入到與其對應的所述圖嵌入向量中。
可選的,還包括:
基于用戶的行為構建多個用戶的用戶圖,所述用戶圖包括多個節(jié)點,每個所述節(jié)點代表一個用戶;
根據所述用戶圖選定正樣本和負樣本;
利用所述正樣本和所述負樣本進行模型訓練,得到所述向量計算模型。
可選的,所述根據所述用戶圖選定正樣本和負樣本,包括:
在所述用戶圖中采用加權游走方法選定所述正樣本;
從所述用戶圖中與特定用戶有聯(lián)系的其他用戶中隨機選取,得到所述負樣本。
第二方面,提供一種目標用戶的挖掘裝置,包括:
向量計算模塊,被配置為根據預先訓練的向量計算模型計算多個待選用戶的圖嵌入向量;
相似度計算模塊,被配置為計算每個所述圖嵌入向量與基準用戶的基準向量之間的相似度;
目標選定模塊,被配置為將超過預設閾值的相似度所對應的待選用戶選定為目標用戶。
可選的,所述相似度計算模塊包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯(lián)信息技術有限公司,未經北京達佳互聯(lián)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910195363.8/2.html,轉載請聲明來源鉆瓜專利網。





