[發明專利]一種DPI聚類及用戶擴量方法有效
| 申請號: | 202010872201.6 | 申請日: | 2020-08-26 |
| 公開(公告)號: | CN111950657B | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 項亮;潘信法 | 申請(專利權)人: | 上海數鳴人工智能科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/2458 |
| 代理公司: | 上海天辰知識產權代理事務所(特殊普通合伙) 31275 | 代理人: | 吳世華;陶金龍 |
| 地址: | 200436 上海市靜安*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 dpi 用戶 方法 | ||
一種DPI聚類及用戶擴量方法,包括確定N項不同的且未歸類的DPI,每一項DPI包括一個訪問用戶群;使用關聯規則中的Apriori算法,在N條DPI中發現由不重復的頻繁項集個數C;遍歷C個頻繁項集中的每個頻繁項集,根據用戶基數和營銷廣告方向的頻繁項集作為標準,選擇優質頻繁項集K;對于K個優質頻繁項集中的每一個非基準頻繁項集的DPI及其訪問用戶群體計算DPI支持度:將所有DPI支持度計算出來,按照支持度的大小進行排序;并根據DPI的支持度大小以及訪問DPI的用戶數量,決定是否將訪問過DPI的用戶作為潛在的目標用戶加入至廣告投放的目標群體中,直到用戶數量擴充到達到滿意的范圍。
技術領域
本發明涉及大數據處理及信息技術領域,更具體地,涉及一種基于關聯規則挖掘算法和用戶DPI訪問情況的DPI聚類及用戶擴量方法。
背景技術
隨著大數據及信息技術的發展,應用于利用運營商的營銷用戶擴量的場景越來越多,尤其是從海量的用戶群體中發現符合營銷手段的用戶群體在廣告營銷領域往往十分困難。
在互聯網行業可以通過用戶對網頁或APP的點擊、下載、使用等行為輕松為用戶進行分組,再進行廣告的曝光和投放。而在傳統的利用運營商的營銷,就很難輕易得到一個優質的潛在營銷用戶群體。
此外,現有技術中通常在對一個已知的廣告目標用戶群體進行用戶擴量時,經常利用用戶自身的特征進行相似度的分析,即將與已知的用戶群里特征相似的新用戶作為新的目標來實現擴量。例如,互聯網行業中想要對某些特定用戶組進行擴量,常使用用戶的年齡、性別、網絡訪問行為、APP點擊內容等特征來對新的用戶進行判斷,確定其是否屬于現有的特定用戶組。
然而,上述做法有兩個主要缺點:
①.潛在用戶難以大量的獲得,因為從所有非已知目標群體中找出新的目標群體成本非常高,而且新用戶的數量較難保證;
②.通過用戶特征來發現新的用戶效率太低,無法實現用戶的快速擴量,因為上述特征獲取渠道繁瑣,且正確性也無法保證。
發明內容
本發明的目的在于提供一種基于關聯規則挖掘算法和用戶DPI訪問情況的DPI聚類及用戶擴量方法,其從DPI訪問用戶的角度利用關聯規則挖掘算法先從大量零散的DPI中發現有價值的頻繁項集作為基準DPI群組,再利用關聯規則挖掘中支持度的概念尋找與已知用戶群體相關性較大的新DPI,再通過新DPI的訪問情況尋找出新的營銷廣告的潛在用戶。
為實現上述目的,本發明的技術方案如下:
一種DPI聚類及用戶擴量方法,其包括如下步驟:
步驟S1:確定N項不同的且未歸類的DPI,每一項所述DPI包括一個訪問用戶群,所述N項DPI的訪問用戶群中的用戶存在交集;其中,N為大于等于2的正整數;
步驟S2:使用關聯規則中的Apriori算法,在所述N條DPI中發現由不重復的頻繁二項集、頻繁三項集…及頻繁N項集組成的頻繁項集個數C;其中,所述頻繁二項集、頻繁三項集…及頻繁N項集的選取規則為,所述頻繁二項集、頻繁三項集…及頻繁N項集中的交集用戶數量與其并集的用戶數量的比值超過了設定的閾值;
步驟S3:遍歷所述C個頻繁項集中的每個頻繁項集,根據用戶基數和營銷廣告方向的頻繁項集作為標準,選擇優質頻繁項集,設優質頻繁項集有K個;其中,K小于等于C;
步驟S4:對于K個優質頻繁項集中的每個頻繁項集i,設其為一個基準頻繁項集,所述基準頻繁項集的用戶為已知用戶群體,對于每一個非所述基準頻繁項集的DPI及其訪問用戶群體,按照以下公式計算所述DPI支持度:
其中,Idpi是所有訪問過所述DPI的用戶集合,Imain是第i個DPI頻繁項集的已知用戶群體,count()為集合中用戶的數量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海數鳴人工智能科技有限公司,未經上海數鳴人工智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010872201.6/2.html,轉載請聲明來源鉆瓜專利網。





