[發明專利]一種確定用戶組相似性的系統和方法在審
| 申請號: | 202010790992.8 | 申請日: | 2017-04-20 |
| 公開(公告)號: | CN111931845A | 公開(公告)日: | 2020-11-13 |
| 發明(設計)人: | 楊文君;李奘;凌宏博;曹利鋒;常智華;楊帆 | 申請(專利權)人: | 北京嘀嘀無限科技發展有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都七星天知識產權代理有限公司 51253 | 代理人: | 楊永梅 |
| 地址: | 100193 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 確定 用戶組 相似性 系統 方法 | ||
本申請實施例公開了確定用戶組相似性的系統和方法,該系統包括:可訪問平臺數據的一個或多個處理器,其中所述平臺數據包括與多個用戶組相關的一個或多個相關數據域;以及存儲指令的存儲器,當所述指令由一個或多個處理器執行時,使所述計算系統執行:基于所述一個或多個相關數據域,確定一個或多個關鍵數據域;基于所述一個或多個關鍵數據域,確定所述多個用戶組中兩個用戶組的距離;獲取距離閾值;以及響應于所述多個用戶組中兩個用戶組的所述距離小于所述距離閾值,確定所述兩個用戶組相似。
分案說明
本申請是針對申請日為2017年4月20日、申請號為201780051176.1、發明名稱為基于學習的組標記系統和方法的中國申請提出的分案申請。
技術領域
本申請涉及一種確定用戶組相似性的系統和方法。
背景技術
一個平臺可以提供各種服務給用戶。為便于用戶服務和管理,需要分組管理用戶。此過程可能帶來很多挑戰,尤其是當用戶數量變大時。
發明內容
本發明的各種實施例可以包括系統,方法,以及被配置為執行組標記的計算機可讀介質。用于組標記的計算系統可以包括可訪問平臺數據的一個或多個處理器以及存儲指令的存儲器,所述指令在由所述一個或多個處理器執行時使所述計算系統執行方法。平臺數據可以包括多個用戶以及多個相關數據域。該方法可以包括:獲取用戶的第一子集以及與所述用戶的第一子集相關的一個或多個第一標簽;分別為一個或多個相關數據域,確定所述用戶的第一子集和至少部分所述多個用戶之間的至少一個差值;響應于確定差值超過第一閾值,將對應的數據域確定為關鍵數據域,將與與所述用戶的第一子集相關的對應于一個或多個關鍵數據域的數據確定為正樣本,基于所述一個或多個關鍵數據域,獲取來自平臺數據的用戶的第二子集以及相關數據作為負樣本,以及用正樣本和負樣本訓練規則模型以獲取訓練后的組標記規則模型。
在一些實施例中,平臺數據可以包括與多個用戶中每個用戶對應的表格數據,以及數據域可以包括數據維度或數據度量中至少一個。
在一些實施例中,所述多個用戶可以是平臺用戶,該平臺可以是車輛信息平臺,以及所述數據域可以包括位置、使用量、交易金額或投訴數量中的至少一種。
在一些實施例中,獲取用戶的第一子集包括從一個或多個分析者中接收所述用戶的第一子集的標識符,而無需完全訪問所述平臺數據。
在一些實施例中,在服務器獲取用戶的第一子集之前,平臺數據可以不包括所述第一標簽。
在一些實施例中,所述差值為Kullback-Leibler散度。
在一些實施例中,基于對一個或多個關鍵數據域的相似性測量,所述用戶的第二子集在超過第三閾值時與所述用戶的第一子集不同。
在一些實施例中,所述規則模型可以是決策樹模型。
在一些實施例中,所述訓練后的組標記規則模型可以判斷是否將第一標簽分配給所述多個用戶中的一個或多個。
在一些實施例中,所述服務器進一步被配置為將所述訓練后的組標記規則模型應用于標記所述多個用戶和添加到所述多個用戶中的新用戶。
在一些實施例中,組標記方法可以包括獲取平臺的多個實體的第一子集。實體的第一子集可以用第一標簽標記,以及平臺數據可以包括多個實體的一個或多個數據域的數據。組標記方法可以進一步包括確定所述實體的第一子集與所述多個實體中一些其他實體的一個或多個數據域中數據之間的至少一個差值。響應于確定所述差值超過第一閾值,獲取與所述實體的第一子集相關的對應數據作為正樣本,以及獲取與所述多個實體的第二子集相關的對應數據作為負樣本。所述組標記方法還包括用正樣本和負樣本訓練規則模型,以獲取訓練后的組標記規則模型。所述訓練后的組標記規則模型可以判斷現有的或新的實體是否有資格獲得第一標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘀嘀無限科技發展有限公司,未經北京嘀嘀無限科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010790992.8/2.html,轉載請聲明來源鉆瓜專利網。





