[發明專利]用戶行為相似性計算方法及裝置有效
| 申請號: | 201510618301.5 | 申請日: | 2015-09-24 |
| 公開(公告)號: | CN105260414B | 公開(公告)日: | 2018-10-19 |
| 發明(設計)人: | 李倚 | 申請(專利權)人: | 精碩科技(北京)股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 宋揚;黃健 |
| 地址: | 100041 北京市石景山*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 行為 相似性 計算方法 裝置 | ||
1.一種用戶行為相似性計算方法,其特征在于,包括:
采集第一類用戶的多個行為特征中每個行為特征對應的行為特征值,以及第二類用戶的所述多個行為特征中每個行為特征對應的行為特征值;
依據所述第一類用戶對應的多個行為特征值和所述第二類用戶對應的多個行為特征值對所述多個行為特征進行篩選獲得目標行為特征集合;
依據所述目標行為特征集合建立第一廣義線性模型,利用最優化方法計算所述第一廣義線性模型的第一極大似然估計值,并獲得所述第一極大似然估計值對應的估計參數;
利用所述估計參數和待測用戶對應的所述目標行為特征集合中每個行為特征對應的行為特征值計算所述待測用戶與所述第一類用戶的行為相似度;
所述依據所述第一類用戶對應的多個行為特征值和所述第二類用戶對應的多個行為特征值對所述多個行為特征進行篩選獲得目標行為特征集合,包括:
依據所述第一類用戶對應的多個行為特征值和所述第二類用戶對應的多個行為特征值計算所述多個行為特征中每個行為特征分別對應的覆蓋率、卡方統計量和信息熵;
從所述多個行為特征中刪除覆蓋率小于第一閾值的行為特征、卡方統計量小于第二閾值的行為特征和信息熵小于第三閾值的行為特征獲得第一行為特征集合;
刪除所述第一行為特征集合中關聯度大于第四閾值的兩個行為特征中的任意一個行為特征獲得第二行為特征集合;
依據所述第二行為特征集合建立第二廣義線性模型,利用最優化方法計算所述第二廣義線性模型的第二極大似然估計值,刪除所述第二行為特征集合中對所述第二極大似然估計值沒有影響的行為特征獲得所述目標行為特征集合。
2.根據權利要求1所述的方法,其特征在于,所述第一類用戶為符合第一目標行為特征的用戶,所述第二類用戶為符合第二目標行為特征的用戶,所述第一目標行為特征和所述第二目標行為特征具有部分相同的行為特征。
3.根據權利要求2所述的方法,其特征在于,所述利用所述估計參數和待測用戶對應的所述目標行為特征集合中每個行為特征對應的行為特征值計算所述待測用戶與所述第一類用戶的行為相似度,包括:
將所述估計參數構成第一向量,將所述待測用戶對應的所述目標行為特征集合中每個行為特征對應的行為特征值構成第二向量;
計算所述第一向量和所述第二向量的內積獲得所述行為相似度。
4.根據權利要求3所述的方法,其特征在于,所述利用所述估計參數和待測用戶對應的所述目標行為特征集合中每個行為特征對應的行為特征值計算所述待測用戶與所述第一類用戶的行為相似度之后,還包括:
判斷比較所述行為相似度是否大于第五閾值;
若所述行為相似度大于所述第五閾值,則判斷所述待測用戶與所述第一類用戶的行為相似;
統計所有待測用戶中與所述第一類用戶的行為相似的待測用戶的比例。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于精碩科技(北京)股份有限公司,未經精碩科技(北京)股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510618301.5/1.html,轉載請聲明來源鉆瓜專利網。





