[發(fā)明專利]一種群體用戶的挖掘方法及裝置有效
| 申請?zhí)枺?/td> | 201710099962.0 | 申請日: | 2017-02-23 |
| 公開(公告)號: | CN108509434B | 公開(公告)日: | 2020-12-25 |
| 發(fā)明(設計)人: | 呂廣娜;鮑媛媛 | 申請(專利權(quán))人: | 中國移動通信有限公司研究院;中國移動通信集團公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06K9/62 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 朱琳愛義 |
| 地址: | 100032 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 群體 用戶 挖掘 方法 裝置 | ||
1.一種群體用戶的挖掘方法,其特征在于,包括:
根據(jù)由軌跡點組成的多個用戶的歷史軌跡數(shù)據(jù),將各所述用戶的每天滿足預設的時間閾值、距離閾值和方向變化閾值條件的軌跡點構(gòu)成各所述用戶每天的停留點,并將各所述用戶每天的停留點按時間順序排列構(gòu)成各所述用戶每天的停留點序列;
根據(jù)各所述用戶每天的停留點序列,統(tǒng)計各所述用戶的最頻繁的出行起始時間段軌跡特征屬性和最頻繁的結(jié)束行程時間段軌跡特征屬性;
將各所述用戶每天的停留點歸類為多個公共停留區(qū)域;為各所述公共停留區(qū)域賦予語義信息,并根據(jù)各所述公共停留區(qū)域和所述語義信息,統(tǒng)計各所述用戶的公共停留區(qū)域列表;將各所述用戶符合所述公共停留區(qū)域列表的停留點對應的公共停留區(qū)域作為該用戶的停留區(qū)域列表;根據(jù)確定出的各所述用戶的停留區(qū)域列表,統(tǒng)計各所述用戶的最經(jīng)常停留的區(qū)域列表軌跡特征屬性;
根據(jù)各所述用戶每天的停留點序列和各所述用戶的停留區(qū)域列表,確定各所述用戶每天的停留區(qū)域軌跡;根據(jù)確定出的各所述用戶每天的停留區(qū)域軌跡,采用預先設定的針對序列模式的挖掘算法,統(tǒng)計各所述用戶的最頻繁的重復軌跡模式軌跡特征屬性;
采用預先設定的聚類方法,對統(tǒng)計出的各所述用戶的所述最頻繁的出行起始時間段軌跡特征屬性、所述最頻繁的結(jié)束行程時間段軌跡特征屬性、所述最經(jīng)常停留的區(qū)域列表軌跡特征屬性和所述最頻繁的重復軌跡模式軌跡特征屬性進行聚類,得到多個群體用戶;
其中,所述根據(jù)確定出的各所述用戶的停留區(qū)域列表,統(tǒng)計各所述用戶的最經(jīng)常停留的區(qū)域列表,具體包括:
確定各所述用戶的停留區(qū)域列表中的各停留區(qū)域的停留時間;
將停留時間滿足預設時長的各所述停留區(qū)域統(tǒng)計為各所述用戶的最經(jīng)常停留的區(qū)域列表。
2.如權(quán)利要求1所述的挖掘方法,其特征在于,所述將各所述用戶每天的停留點歸類為多個公共停留區(qū)域,具體包括:
采用基于密度的聚類算法P-DBSCAN將各所述用戶每天的停留點歸類為多個公共停留區(qū)域。
3.如權(quán)利要求1所述的挖掘方法,其特征在于,所述為各所述公共停留區(qū)域賦予語義信息,并根據(jù)各所述公共停留區(qū)域和所述語義信息,統(tǒng)計各所述用戶的公共停留區(qū)域列表,具體包括:
通過信息點POI數(shù)據(jù)庫,為各所述公共停留區(qū)域賦予語義信息,并將賦予語義信息的各所述公共停留區(qū)域構(gòu)成各所述用戶的公共停留區(qū)域列表。
4.如權(quán)利要求1-3任一項所述的挖掘方法,其特征在于,所述采用預先設定的聚類方法,對統(tǒng)計出的各所述用戶的所述最頻繁的出行起始時間段軌跡特征屬性、所述最頻繁的結(jié)束行程時間段軌跡特征屬性、所述最經(jīng)常停留的區(qū)域列表軌跡特征屬性和所述最頻繁的重復軌跡模式軌跡特征屬性進行聚類,得到多個群體用戶,具體包括:
采用快速聚類的方法,對統(tǒng)計出的各所述用戶的所述最頻繁的出行起始時間段軌跡特征屬性、所述最頻繁的結(jié)束行程時間段軌跡特征屬性、所述最經(jīng)常停留的區(qū)域列表軌跡特征屬性和所述最頻繁的重復軌跡模式軌跡特征屬性進行聚類,得到多個群體用戶。
5.如權(quán)利要求1-3任一項所述的挖掘方法,其特征在于,在所述采用預先設定的聚類方法,對統(tǒng)計出的各所述用戶的所述最頻繁的出行起始時間段軌跡特征屬性、所述最頻繁的結(jié)束行程時間段軌跡特征屬性、所述最經(jīng)常停留的區(qū)域列表軌跡特征屬性和所述最頻繁的重復軌跡模式軌跡特征屬性進行聚類,得到多個群體用戶之后,還包括:
結(jié)合詞云獲取各所述群體用戶的特征;其中,所述詞云為以下之一或組合:用戶簽到信息,用戶調(diào)查問卷,用戶注冊信息;所述群體用戶的特征為以下之一或組合:性別,年齡段,職業(yè),長期偏好,短期需求,消費習慣,主要活動的地理區(qū)域。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國移動通信有限公司研究院;中國移動通信集團公司,未經(jīng)中國移動通信有限公司研究院;中國移動通信集團公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710099962.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





