[發明專利]一種確定用戶組相似性的系統和方法在審
| 申請號: | 202010790992.8 | 申請日: | 2017-04-20 |
| 公開(公告)號: | CN111931845A | 公開(公告)日: | 2020-11-13 |
| 發明(設計)人: | 楊文君;李奘;凌宏博;曹利鋒;常智華;楊帆 | 申請(專利權)人: | 北京嘀嘀無限科技發展有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都七星天知識產權代理有限公司 51253 | 代理人: | 楊永梅 |
| 地址: | 100193 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 確定 用戶組 相似性 系統 方法 | ||
1.一種確定用戶組相似性的系統,其特征在于,所述系統包括:
可訪問平臺數據的一個或多個處理器,其中所述平臺數據包括與多個用戶組相關的一個或多個相關數據域;以及
存儲指令的存儲器,當所述指令由一個或多個處理器執行時,使所述計算系統執行:
基于所述一個或多個相關數據域,確定一個或多個關鍵數據域;
基于所述一個或多個關鍵數據域,確定所述多個用戶組中兩個用戶組的距離;
獲取距離閾值;以及
響應于所述多個用戶組中兩個用戶組的所述距離小于所述距離閾值,確定所述兩個用戶組相似。
2.根據權利要求1所述的系統,其特征在于:所述基于所述一個或多個關鍵數據域,確定所述多個用戶組中兩個用戶組的距離包括:
比較所述多個用戶組中兩個用戶組的每對用戶,對每個用戶組中的用戶的用戶屬性進行平均;
比較平均后的用戶屬性。
3.根據權利要求1所述的系統,其特征在于:所述基于所述一個或多個關鍵數據域,確定所述多個用戶組中兩個用戶組的距離包括:
選取所述多個用戶組中每個用戶組的代表用戶;
確定所述多個用戶組中每個用戶組的代表用戶的用戶屬性;
比較所述代表用戶的用戶屬性。
4.根據權利要求1所述的系統,其特征在于:所述距離通過相似性測量得到。
5.根據權利要求4所述的系統,其特征在于:所述相似性測量包括歐氏距離法、曼哈頓距離法、切比雪夫距離法、Minkowski距離法、馬哈諾比斯距離法、余弦法、漢明距離法、Jaccard相似系數法、相關系數和距離法、信息熵法中的一種。
6.根據權利要求1所述的系統,其特征在于:
所述相關數據域包括數據維度或數據度量中的至少一個。
7.根據權利要求1所述的系統,其特征在于:
所述多個用戶組為所述平臺的用戶組;
所述平臺為車輛信息平臺;以及
所述數據域包括位置、使用量、交易金額或投訴數量中的至少一個。
8.一種確定用戶組相似性的方法,其特征在于,所述方法包括:
從多個用戶組中獲取與用戶組相關的一個或多個相關數據域,其中,所述多個用戶組和所述一個或多個相關數據域是平臺數據的一部分;
基于所述一個或多個相關數據域,確定一個或多個關鍵數據域;
基于所述一個或多個關鍵數據域,確定所述多個用戶組中兩個用戶組的距離;
獲取距離閾值;以及
響應于所述多個用戶組中兩個用戶組的所述距離小于所述距離閾值,確定所述兩個用戶組相似。
9.根據權利要求8所述的方法,其特征在于:所述基于所述一個或多個關鍵數據域,確定所述多個用戶組中兩個用戶組的距離包括:
比較所述多個用戶組中兩個用戶組的每對用戶,對每個用戶組中的用戶的用戶屬性進行平均;
比較平均后的用戶屬性。
10.根據權利要求8所述的方法,其特征在于:所述基于所述一個或多個關鍵數據域,確定所述多個用戶組中兩個用戶組的距離包括:
選取所述多個用戶組中每個用戶組的代表用戶;
確定所述多個用戶組中每個用戶組的代表用戶的用戶屬性;
比較所述代表用戶的用戶屬性。
11.根據權利要求8所述的方法,其特征在于:所述距離通過相似性測量得到。
12.根據權利要求11所述的系統,其特征在于:所述相似性測量包括歐氏距離法、曼哈頓距離法、切比雪夫距離法、Minkowski距離法、馬哈諾比斯距離法、余弦法、漢明距離法、Jaccard相似系數法、相關系數和距離法、信息熵法中的一種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘀嘀無限科技發展有限公司,未經北京嘀嘀無限科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010790992.8/1.html,轉載請聲明來源鉆瓜專利網。





