[發明專利]一種數據挖掘方法及裝置有效
| 申請號: | 201710030749.4 | 申請日: | 2017-01-16 |
| 公開(公告)號: | CN108319600B | 公開(公告)日: | 2021-01-08 |
| 發明(設計)人: | 赫彩鳳;潘璐伽;褚令洋;雷鳴濤;裴健 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;H04L12/24 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 馮艷蓮 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 挖掘 方法 裝置 | ||
1.一種數據挖掘方法,其特征在于,應用于終端設備,包括:
根據預設的路徑長度集合中的路徑長度L,從原始節點集合中確定(L+1)個節點,所述原始節點集合中的每個節點包括至少一個元素,L取遍所述路徑長度集合中的各個值,且L為正整數;所述原始節點集合包括網絡系統中用于數據通信的節點;
分別從所述(L+1)個節點中每個節點包括的至少一個元素中抽取一個元素,得到采樣元素序列τ,并確定所述采樣元素序列τ的第一支持度,所述第一支持度用于指示所述采樣元素序列τ在全量元素序列集合中所占的比重,所述全量元素序列由所述原始節點集合中的節點包括的元素組成;所述每個節點包括的至少一個元素是從該節點獲取到的;
確定所述采樣元素序列τ包括的至少一個子元素序列;
確定每個采樣元素序列中包括的各個子元素序列分別對應的第二支持度,其中,每一子元素序列的第二支持度是根據各個包含該子元素序列的采樣元素序列分別對應第一支持度確定的;
根據各個子元素序列分別對應的第二支持度,從多個子元素序列中選擇出至少一個子元素序列。
2.如權利要求1所述的方法,其特征在于,根據預設的路徑長度集合中的路徑長度L,從原始節點集合中確定(L+1)個節點,包括:
分別確定(w-m)個節點中各個節點在所述路徑長度為L的路徑中第m個位置的采樣概率,w為所述原始節點集合中節點的總個數,(w-m)個節點為所述原始節點集合中不包括已確定的前m個位置上的節點,m取遍集合{m|0≤m≤L}中的各個非負整數;
根據所述(w-m)個節點分別對應的第m個位置的采樣概率,從所述(w-m)個節點中確定所述第m個位置上的節點。
3.如權利要求2所述的方法,其特征在于,分別確定(w-m)個節點中各個節點在路徑長度為L的路徑中第m個位置的采樣概率Pr(vj):
其中,Vw為所述原始節點集合,V(w-m)為(w-m)個節點的集合,V(w-m)中不包括已確定的前m個位置上的節點,dL(vn)為Vw中距離節點vn為L的節點的個數,vn取遍Vw中的各個節點,dL-m+1(vm-1)為Vw中距離第(m-1)個位置上的節點為(L-m+1)的節點的個數,dL-m(vj)為Vw中距離節點vj為(L-m+1)的節點的個數,vj取遍V(w-m)中的各個節點。
4.如權利要求1至3任一所述的方法,其特征在于,確定所述采樣元素序列τ的第一支持度,包括:
分別確定所述(L+1)個節點中每個節點包括的元素的總個數;
根據確定的所述(L+1)個節點中每個節點包括的元素的總個數,確定所述采樣元素序列τ的第一支持度,所述采樣元素序列τ的第一支持度為所述(L+1)個節點中每個節點包括的元素的總個數的乘積。
5.如權利要求1至3任一所述的方法,其特征在于,分別從所述(L+1)個節點中每個節點包括的至少一個元素中抽取一個元素,包括:
針對所述(L+1)個節點中在路徑長度為L的路徑中第K個位置上的節點,根據所述第K個位置上的節點的元素抽樣概率,從所述第K個位置上的節點包括的至少一個元素中抽取一個元素,所述第K個位置上的節點的元素抽樣概率為1/MK,MK為所述第K個位置上的節點包括的元素的總個數,K取遍集合{K|0≤K≤L}中的各個非負整數。
6.如權利要求1至3任一所述的方法,其特征在于,確定每個采樣元素序列中包括的各個子元素序列分別對應的第二支持度,包括:
針對任一子元素序列,確定包含所述子元素序列的采樣元素序列;
將包含所述子元素序列的采樣元素序列分別對應的第一支持度相加,得到與所述子元素序列的第二支持度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710030749.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種人機對話的方法和裝置
- 下一篇:信息獲取方法和裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





