[發明專利]用于確定相似用戶的方法、裝置和服務器在審
| 申請號: | 201710451969.4 | 申請日: | 2017-06-15 |
| 公開(公告)號: | CN107247786A | 公開(公告)日: | 2017-10-13 |
| 發明(設計)人: | 李澤中 | 申請(專利權)人: | 北京小度信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司11204 | 代理人: | 王達佐,馬曉亞 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 確定 相似 用戶 方法 裝置 服務器 | ||
1.一種用于確定相似用戶的方法,其特征在于,所述方法包括:
獲取待處理用戶集中各用戶的用戶信息,所述用戶信息包括地理位置信息以及與至少一個預設標簽關聯的歷史訂單信息;
統計與各所述預設標簽關聯的歷史訂單信息對應的用戶數量,以確定各所述預設標簽的權重;
基于所述待處理用戶集中各用戶的歷史訂單信息以及各所述預設標簽的權重,生成各所述用戶的標簽屬性特征;
根據所述標簽屬性特征和地理位置信息將所述待處理用戶集中的用戶聚類為多個用戶簇;
基于所述標簽屬性特征計算目標用戶與同一用戶簇中其他用戶的相似度并確定出所述目標用戶的相似用戶。
2.根據權利要求1所述的方法,其特征在于,所述統計與各所述預設標簽關聯的歷史訂單信息對應的用戶數量,以確定各所述預設標簽的權重,包括:
對每個所述預設標簽,篩選出與所述預設標簽關聯的歷史訂單信息;
統計篩選出的歷史訂單信息對應的用戶數量;
對統計出的用戶數量求對數后取倒數作為所述預設標簽的權重。
3.根據權利要求1所述的方法,其特征在于,所述基于所述待處理用戶集中各用戶的歷史訂單信息以及各所述預設標簽的權重,生成各所述用戶的標簽屬性特征,包括:
根據所述歷史訂單信息,確定每個所述用戶對應于各預設標簽的下單頻次;
基于每個用戶對應于各預設標簽的下單頻次和對應預設標簽的權重,計算得出每個用戶對應的各所述預設標簽的有效下單頻次;
基于各所述預設標簽的有效下單頻次生成所述用戶的標簽特征向量,作為各所述用戶的標簽屬性特征。
4.根據權利要求3所述的方法,其特征在于,所述基于每個用戶對應于各預設標簽的下單頻次和對應預設標簽的權重,計算得出每個用戶對應的各所述預設標簽的有效下單頻次,包括:
將每個用戶對應于各預設標簽的下單頻次與對應各預設標簽的權重相乘,作為每個用戶對應的各預設標簽的有效下單頻次;
所述基于各所述預設標簽的有效下單頻次生成各所述用戶的標簽特征向量,包括:
將各所述預設標簽的有效下單頻次作為所述標簽特征向量中對應于各所述預設標簽的特征值。
5.根據權利要求3所述的方法,其特征在于,所述根據所述標簽屬性特征和地理位置信息將所述待處理用戶集中的用戶聚類為多個用戶簇,包括:
對各用戶的標簽特征向量中的元素按特征值進行降序排序,選擇排序前預設位的元素對應的預設標簽為待匹配標簽;
以所述地理位置信息和所述待匹配標簽為各所述用戶的特征信息,基于所述特征信息將所述待處理用戶集中的用戶聚類為多個用戶簇。
6.根據權利要求5所述的方法,其特征在于,所述以所述地理位置信息和所述待匹配標簽為各所述用戶的特征信息,基于所述特征信息將所述待處理用戶集中的用戶聚類為多個用戶簇,包括:
將所述地理位置信息相同且至少一個待匹配標簽相同的用戶聚為同一用戶簇。
7.根據權利要求3所述的方法,其特征在于,所述基于所述標簽屬性特征計算目標用戶與同一用戶簇中其他用戶的相似度并確定出所述目標用戶的相似用戶,包括:
計算所述目標用戶的標簽特征向量與同一用戶簇中其他各用戶的標簽特征向量的相似度;
基于所述目標用戶的標簽特征向量與同一用戶簇中其他各用戶的標簽特征向量的相似度篩選出所述目標用戶的相似用戶。
8.一種用于確定相似用戶的裝置,其特征在于,所述裝置包括:
獲取單元,配置用于獲取待處理用戶集中各用戶的用戶信息,所述用戶信息包括地理位置信息以及與至少一個預設標簽關聯的歷史訂單信息;
統計單元,配置用于統計與各所述預設標簽關聯的歷史訂單信息對應的用戶數量,以確定各所述預設標簽的權重;
生成單元,配置用于基于所述待處理用戶集中各用戶的歷史訂單信息以及各所述預設標簽的權重,生成各所述用戶的標簽屬性特征;
聚類單元,配置用于根據所述標簽屬性特征和地理位置信息將所述待處理用戶集中的用戶聚類為多個用戶簇;
確定單元,配置用于基于所述標簽屬性特征計算目標用戶與同一用戶簇中其他用戶的相似度并確定出所述目標用戶的相似用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小度信息科技有限公司,未經北京小度信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710451969.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種靜態只讀地圖文件生成方法和裝置
- 下一篇:一種基于多源數據融合的分類方法





