[發明專利]一種挖掘稀有均衡軌跡數據的方法及裝置有效
| 申請號: | 201310456801.4 | 申請日: | 2013-09-29 |
| 公開(公告)號: | CN104516905B | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 李曼;胡衛松 | 申請(專利權)人: | 日電(中國)有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 張耀光 |
| 地址: | 100191 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 挖掘 稀有 均衡 軌跡 數據 方法 裝置 | ||
本發明公開了一種挖掘稀有均衡序列的方法及裝置,屬于計算機領域。所述方法包括:從原始序列集合中選擇支持度小于預設支持度閾值的序列作為稀有序列并組成稀有序列集合;獲取所述稀有序列的均衡系數,所述均衡系數用于反映所述稀有序列分布的均衡程度;選擇均衡系數小于預設均衡系數閾值的稀有序列作為稀有均衡序列。所述裝置包括:第一選擇模塊、第一獲取模塊和第二選擇模塊。本發明能夠提高挖掘稀有均衡序列的精度。
技術領域
本發明涉及計算機領域,特別涉及一種挖掘稀有均衡軌跡數據的方法及裝置。
背景技術
序列是被排成一列的數據元素,近年來在很多領域中出現大量的序列,例如,軌跡數據、DNA(Deoxyribonucleicacid,脫氧核糖核酸)序列數據和Web(網絡)訪問日志等。如在導航領域中,用戶的軌跡數據可以組成序列,序列包括的數據元素為用戶停留的位置點,如用戶從家到工作地點所停留的位置點構成了一個序列。
在大量的序列中往往具有一類出現頻率低且分布均衡的序列,這類序列被稱為稀有均衡序列;例如,用戶在某個時間段裝修房子,該用戶的序列中出現了從家到建材市場的裝修序列,裝修序列只有在該時間段內出現,所以出現頻率低,但裝修序列不是該用戶獨有,很多其他用戶也有裝修序列,因此裝修序列分布均衡,所以該用戶的裝修序列為稀有均衡序列。稀有均衡序列所反應的規律不易被人們發現,但其具有較高的價值;例如,可以通過稀有均衡序列進行信息推送,如當發現某個用戶出現裝修序列,可以將建材市場的促銷信息發送給該用戶,或將其他用戶常去的建材市場所在的位置發送給該用戶。所以,基于稀有均衡序列具有較高的價值,使得如何挖掘出稀有均衡序列的技術越來越被人們所重視。
目前,現有技術提供了一種挖掘稀有均衡序列的技術,可以為:第一步:從數據庫包括的原始序列中選擇長度最長的序列,其中,由于同一長度的原始序列可能有多個,所以選擇的長度最長的序列也可能是多個;第二步:計算選擇的長度最長的序列中的每個序列的支持度,序列的支持度用于反映該序列在數據庫中出現的頻率;第三步:從選擇的長度最長的序列中獲取支持度小于預設閾值的序列,將獲取的序列作為稀有均衡序列;第四步:從選擇的長度最長的序列中的每個序列中減去一個數據元素,此時,數據庫中包括未選擇的原始序列和被減去數據元素的序列,然后再從數據庫中選擇長度最長的序列,并返回執行第二步,直到將數據庫中的每個原始序列包括的數據元素減為1時為止。
在實現本發明的過程中,發明人發現現有技術至少存在以下問題:
現有技術挖掘出來的稀有均衡序列中包括大量分布不均衡的序列,而這些分布不均衡的序列并非稀有均衡序列,所以現有技術挖掘稀有均衡序列的精度較低。
發明內容
為了提高挖掘稀有均衡序列的精度,本發明提供了一種挖掘稀有均衡序列的方法及裝置。所述技術方案如下:
一種挖掘稀有均衡序列的方法,所述方法包括:
從原始序列集合中選擇支持度小于預設支持度閾值的序列作為稀有序列并組成稀有序列集合;
獲取所述稀有序列的均衡系數,所述均衡系數用于反映所述稀有序列分布的均衡程度;
選擇均衡系數小于預設均衡系數閾值的稀有序列作為稀有均衡序列。
一種挖掘稀有均衡序列的裝置,所述裝置包括:
第一選擇模塊,用于從原始序列集合中選擇支持度小于預設支持度閾值的序列作為稀有序列并組成稀有序列集合;
第一獲取模塊,用于獲取所述稀有序列的均衡系數,所述均衡系數用于反映所述稀有序列分布的均衡程度;
第二選擇模塊,用于選擇均衡系數小于預設均衡系數閾值的稀有序列作為稀有均衡序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于日電(中國)有限公司,未經日電(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310456801.4/2.html,轉載請聲明來源鉆瓜專利網。





