[發明專利]一種用于用戶分析的系統和方法在審
| 申請號: | 201880092679.8 | 申請日: | 2018-05-18 |
| 公開(公告)號: | CN112106067A | 公開(公告)日: | 2020-12-18 |
| 發明(設計)人: | 劉躍翔;李奘;曹利鋒;常智華;凌宏博;徐翔 | 申請(專利權)人: | 北京嘀嘀無限科技發展有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都七星天知識產權代理有限公司 51253 | 代理人: | 袁春曉 |
| 地址: | 100193 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 用戶 分析 系統 方法 | ||
提供了一種用于用戶挖掘的方法。該方法可以包括獲取至少兩個正樣本的至少兩個第一特征向量和至少兩個負樣本的至少兩個第二特征向量,并且基于所述至少兩個第一特征向量和第二特征向量以及擴充第二特征向量生成至少兩個擴充第一特征向量。每個第一特征向量可以包括描述相應的正樣本的至少兩個特征的第一特征信息。每個第二特征向量可以包括描述相應的正樣本的至少兩個特征的第二特征信息。該方法還可以包括通過使用至少兩個擴充第一特征向量和擴充第二特征向量生成訓練后的二元模型,基于訓練后的二元模型確定至少兩個特征中的與至少兩個正樣本相關的一個或以上核心特征。
技術領域
本申請一般涉及用戶分析,更具體地,涉及用于挖掘用戶的特征并生成用戶的虛擬簡檔的系統和方法。
背景技術
在互聯網技術中,用戶特征挖掘通常是服務系統開發和運行的關鍵。通過用戶特征挖掘,可以識別和量化各種用戶類型的特征,從而為用戶分類、個性化服務和營銷提供基礎。僅作為示例,可以確定服務系統中至少兩個活動用戶的核心特征,并且這樣的核心特征可以用于識別具有與活動用戶類似的特征的潛在活動用戶。因此,可以對所識別的潛在活動用戶采用活動營銷策略。因此,期望提供用于挖掘用戶特征的有效系統和方法。
發明內容
根據本申請的一個方面,提供了一個系統。該系統可以包括至少一個存儲介質和至少一個與該至少一個存儲介質通信的處理器。存儲介質可以包括用于用戶挖掘的一組指令。當執行該組指令時,可以指示所述至少一個處理器獲取至少兩個正樣本的至少兩個第一特征向量和至少兩個負樣本的至少兩個第二特征向量。每個第一特征向量可以包括描述至少兩個正樣本中相應的正樣本的至少兩個特征的第一特征信息。每個第二特征向量可以包括描述至少兩個負樣本中相應的正樣本的至少兩個特征的第二特征信息。所述至少一個處理器還可以用于基于至少兩個第一特征向量和至少兩個第二特征向量來生成至少兩個擴充第一特征向量和至少兩個擴充第二特征向量。至少一個處理器還可以用于在至少兩個特征中,基于訓練后的二元模型確定與至少兩個正樣本相關的一個或以上核心特征,訓練后的二元模型通過使用至少兩個擴充第一特征向量和至少兩個擴充第二特征向量生成。
在一些實施例中,為了獲取至少兩個正樣本的至少兩個第一特征向量,所述至少一個處理器可以用于獲取與一個或以上目標特征相關的一個或以上選擇標準,并獲取至少兩個樣本的一個或以上目標特征的第三特征信息。所述至少一個處理器可以進一步用于基于所述第三特征信息和所述一個或以上選擇標準選擇來自所述至少兩個樣本中所述至少兩個正樣本。
在一些實施例中,為了獲取至少兩個負樣本的至少兩個第二特征向量,可以指示至少一個處理器在至少兩個樣本中選擇至少兩個初始負樣本。所述至少一個處理器還可以用于獲取至少兩個初始負樣本的一個或以上目標特征的第四特征信息。所述至少一個處理器還可以用于基于所述第四特征信息和所述一個或以上選擇標準在至少兩個初始負樣本中選擇至少兩個負樣本。
在一些實施例中,為了確定至少兩個擴充第一特征向量和至少兩個擴充第二特征向量,所述至少一個處理器可以用于確定第一特征向量中的每一對第一特征向量之間的第一向量差,并將第一特征向量中的每一對第一特征向量之間的第一向量差指定為擴充第一特征向量之一。所述至少一個處理器還可以進一步用于確定第一特征向量和第二特征向量中的每一對之間的第二向量差,并將第一特征向量和第二特征向量中的每一對之間的第二向量差為指定擴充第二特征向量之一。
在一些實施例中,為了確定至少兩個充滿第一特征向量和至少兩個第二特征向量,至少一個處理器可以用于標準化至少兩個第一特征向量和至少兩個第二特征向量。該至少一個處理器可以基于至少兩個標準化的第一特征向量和至少兩個標準化的第二特征向量進一步用于確定至少兩個擴充第一特征向量和至少兩個擴充第二特征向量。
在一些實施例中,為了確定與至少兩個正樣本相關的一個或以上核心特征,可以指示至少一個處理器基于訓練后的二元模型確定至少兩個特征的至少兩個權重。該至少一個處理器還可以用于根據相應的權重對至少兩個特征進行排名。至少一個處理器還可以用于基于排序結果確定特征中的一個或以上核心特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘀嘀無限科技發展有限公司,未經北京嘀嘀無限科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880092679.8/2.html,轉載請聲明來源鉆瓜專利網。





