[發明專利]目標用戶群體的確定方法及裝置有效
| 申請號: | 201711279551.6 | 申請日: | 2017-12-06 |
| 公開(公告)號: | CN108153824B | 公開(公告)日: | 2020-04-24 |
| 發明(設計)人: | 汪昊宇;彭際群 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 陳霽 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 用戶 群體 確定 方法 裝置 | ||
1.一種目標用戶群體的確定方法,其特征在于,包括:
獲取全體用戶群體;
將所述全體用戶群體劃分為兩個以上的子用戶群體,其中,每個子用戶群體對應于一個類別的文本信息;所述文本信息用于對對應子用戶群體中的用戶進行刻畫,且對應于不同子用戶群體的各類文本信息之間相互獨立且形式不同;
根據各個子用戶群體對應類別的文本信息的篩選條件,從所述各個子用戶群體中篩選出對應的候選用戶群體,得到兩個以上的候選用戶群體;
對每個候選用戶群體,將對應類別的文本信息與關鍵詞庫中的關鍵詞進行精確匹配,若匹配成功,則確定所述類別文本信息的匹配分數;
合并所述兩個以上的候選用戶群體,得到核心用戶群體;
根據所述核心用戶群體中用戶的各類文本信息的匹配分數,確定該核心用戶群體中各用戶的匹配等級;所述匹配分數用于表征對應文本信息的重要度;
基于該核心用戶群體中各用戶的匹配等級,從所述核心用戶群體中選取種子用戶;
分別計算所述種子用戶的每類文本信息與所述全體用戶群體中除所述種子用戶外的其它用戶的該類文本信息的相似度;
根據所述相似度,從所述其它用戶中選取擴展用戶;
將所述擴展用戶擴充到所述核心用戶群體,從而得到目標用戶群體。
2.根據權利要求1所述的方法,其特征在于,所述文本信息包括:收貨地址、通訊錄、無線網絡名稱、全球定位系統GPS定位點對應的公司類地名、互聯網協議IP地址所對應的公司名稱、多媒體訪問控制Mac地址所對應的公司名稱、社交軟件的備注名稱、社交軟件的群名稱、即時通訊工具的備注名稱以及即時通訊工具的群名稱中的若干個。
3.根據權利要求1所述的方法,其特征在于,
當所述文本信息為收貨地址時,所述收貨地址的篩選條件包括以下一種或多種:收貨地址為用戶本人使用、收貨地址在近期被用戶使用過以及收貨地址歸屬于公司類地址。
4.根據權利要求3所述的方法,其特征在于,所述將對應的文本信息與關鍵詞庫中的關鍵詞進行精確匹配,若匹配成功,則確定所述文本信息的匹配分數,包括:
從所述收貨地址中提取關鍵性門址;
將所述關鍵性門址與關鍵詞庫中的關鍵詞進行精確匹配;
若匹配成功,則根據在預設時間段內所述收貨地址的使用次數,確定對應的交易天數;
將所述交易天數作為所述收貨地址的匹配分數。
5.根據權利要求1所述的方法,其特征在于,
當所述文本信息為通訊錄時,所述通訊錄包括聯系人的標注信息及對應的電話號碼;所述通訊錄的篩選條件包括以下一種或多種:通訊錄所屬用戶的電話號碼為所述用戶本人使用以及所述電話號碼包含在其它通訊錄中。
6.根據權利要求5所述的方法,其特征在于,所述將對應的文本信息與關鍵詞庫中的關鍵詞進行匹配,若匹配成功,則確定所述文本信息的匹配分數,包括:
從所述通訊錄中提取聯系人的標注信息;
從所述標注信息中去除不相關詞語,所述不相關詞語包括聯系人的姓名、昵稱以及其它無關稱謂;
將去除不相關詞語后的標注信息與關鍵詞庫中的關鍵詞進行精確匹配;
若匹配成功,則確定標注信息中包含所述通訊錄所屬用戶的其它通訊錄的個數;
將所述其它通訊錄的個數作為所述通訊錄的匹配分數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711279551.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種友情鏈接批量上傳方法
- 下一篇:數據訪問方法及裝置





