[發(fā)明專利]一種群體用戶的挖掘方法及裝置有效
| 申請?zhí)枺?/td> | 201710099962.0 | 申請日: | 2017-02-23 |
| 公開(公告)號: | CN108509434B | 公開(公告)日: | 2020-12-25 |
| 發(fā)明(設(shè)計)人: | 呂廣娜;鮑媛媛 | 申請(專利權(quán))人: | 中國移動通信有限公司研究院;中國移動通信集團公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06K9/62 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 朱琳愛義 |
| 地址: | 100032 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 群體 用戶 挖掘 方法 裝置 | ||
本發(fā)明公開了一種群體用戶的挖掘方法及裝置,根據(jù)由軌跡點組成的多個用戶的歷史軌跡數(shù)據(jù),將各用戶的每天滿足預(yù)設(shè)的時間閾值、距離閾值和方向變化閾值條件的軌跡點構(gòu)成各用戶每天的停留點,并將各用戶每天的停留點歸類為多個具有語義信息的公共停留區(qū)域;再基于滿足預(yù)設(shè)時間閾值、距離閾值和方向變化閾值條件的停留點,以及具有語義信息的公共停留區(qū)域,統(tǒng)計各用戶最頻繁的出行起始時間段軌跡特征屬性、最頻繁的結(jié)束行程時間段軌跡特征屬性、最經(jīng)常停留的區(qū)域列表軌跡特征屬性和最頻繁的重復(fù)軌跡模式軌跡特征屬性;采用預(yù)設(shè)聚類方法將各用戶的上述四個軌跡特征屬性聚類為多個群體用戶,從而實現(xiàn)了基于歷史軌跡數(shù)據(jù),更全面地對群體用戶的挖掘。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,尤其涉及一種群體用戶的挖掘方法及裝置。
背景技術(shù)
移動智能設(shè)備和移動互聯(lián)網(wǎng)的飛速發(fā)展,使得獲取用戶位置信息越來越方便。與此同時智能汽車的發(fā)展,使得汽車不僅僅是一個代步工具,更是互聯(lián)網(wǎng)的一個節(jié)點,是產(chǎn)生歷史軌跡數(shù)據(jù)的重要來源。
由于對歷史軌跡數(shù)據(jù)的深度挖掘?qū)a(chǎn)生很多有價值的知識,從而催生新的商業(yè)應(yīng)用和商業(yè)價值,例如:交通流量管理,基于日程提醒的路徑規(guī)劃,好友發(fā)現(xiàn),個性化廣告推動服務(wù)等,因此,對歷史軌跡數(shù)據(jù)的挖掘受到越來越多的關(guān)注。現(xiàn)有技術(shù)中,已開展的基于歷史軌跡數(shù)據(jù)的挖掘工作,主要是對軌跡數(shù)據(jù)進行分類、聚類或頻繁模式挖掘。但現(xiàn)有技術(shù)中僅從單一方面對歷史軌跡數(shù)據(jù)進行挖掘,并未對歷史軌跡數(shù)據(jù)的挖掘進行整體考慮,而且并未根據(jù)歷史軌跡數(shù)據(jù)深度挖掘群體用戶。
因此,如何基于歷史軌跡數(shù)據(jù),更全面地實現(xiàn)對群體用戶的挖掘,是目前亟需解決的技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種群體用戶的挖掘方法及裝置,用以解決現(xiàn)有技術(shù)中存在的如何基于歷史軌跡數(shù)據(jù),更全面地實現(xiàn)對群體用戶的挖掘的問題。
本發(fā)明實施例提供一種群體用戶的挖掘方法,包括:
根據(jù)由軌跡點組成的多個用戶的歷史軌跡數(shù)據(jù),將各所述用戶的每天滿足預(yù)設(shè)的時間閾值、距離閾值和方向變化閾值條件的軌跡點構(gòu)成各所述用戶每天的停留點,并將各所述用戶每天的停留點按時間順序排列構(gòu)成各所述用戶每天的停留點序列;
根據(jù)各所述用戶每天的停留點序列,統(tǒng)計各所述用戶的最頻繁的出行起始時間段軌跡特征屬性和最頻繁的結(jié)束行程時間段軌跡特征屬性;
將各所述用戶每天的停留點歸類為多個公共停留區(qū)域;為各所述公共停留區(qū)域賦予語義信息,并根據(jù)各所述公共停留區(qū)域和所述語義信息,統(tǒng)計各所述用戶的公共停留區(qū)域列表;將各所述用戶符合所述公共停留區(qū)域列表的停留點對應(yīng)的公共停留區(qū)域作為該用戶的停留區(qū)域列表;根據(jù)確定出的各所述用戶的停留區(qū)域列表,統(tǒng)計各所述用戶的最經(jīng)常停留的區(qū)域列表軌跡特征屬性;
根據(jù)各所述用戶每天的停留點序列和各所述用戶的停留區(qū)域列表,確定各所述用戶每天的停留區(qū)域軌跡;根據(jù)確定出的各所述用戶每天的停留區(qū)域軌跡,采用預(yù)先設(shè)定的針對序列模式的挖掘算法,統(tǒng)計各所述用戶的最頻繁的重復(fù)軌跡模式軌跡特征屬性;
采用預(yù)先設(shè)定的聚類方法,對統(tǒng)計出的各所述用戶的所述最頻繁的出行起始時間段軌跡特征屬性、所述最頻繁的結(jié)束行程時間段軌跡特征屬性、所述最經(jīng)常停留的區(qū)域列表軌跡特征屬性和所述最頻繁的重復(fù)軌跡模式軌跡特征屬性進行聚類,得到多個群體用戶。
在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述挖掘方法中,所述將各所述用戶每天的停留點歸類為多個公共停留區(qū)域,具體包括:
采用基于密度的聚類算法P-DBSCAN將各所述用戶每天的停留點歸類為多個公共停留區(qū)域。
在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述挖掘方法中,所述為各所述公共停留區(qū)域賦予語義信息,并根據(jù)各所述公共停留區(qū)域和所述語義信息,統(tǒng)計各所述用戶的公共停留區(qū)域列表,具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國移動通信有限公司研究院;中國移動通信集團公司,未經(jīng)中國移動通信有限公司研究院;中國移動通信集團公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710099962.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





