[發(fā)明專利]基于關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘方法和裝置在審
| 申請?zhí)枺?/td> | 201810903048.1 | 申請日: | 2018-08-09 |
| 公開(公告)號: | CN109213801A | 公開(公告)日: | 2019-01-15 |
| 發(fā)明(設(shè)計)人: | 梁琛;劉子奇 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 北京博思佳知識產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 關(guān)聯(lián)關(guān)系 連通 數(shù)據(jù)挖掘 子集 目標(biāo)類型 關(guān)聯(lián)關(guān)系建立 方法和裝置 挖掘 | ||
本說明書提供一種基于關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘方法,所述關(guān)聯(lián)關(guān)系建立在若干個主體之間;所述主體包括至少兩種類型,其中至少一種類型為挖掘目標(biāo)類型;所述方法包括:根據(jù)主體之間的關(guān)聯(lián)關(guān)系,將所有主體劃分為若干個連通子集;所述連通子集包括至少一個成員主體,一個連通子集中包括與每個成員主體具有關(guān)聯(lián)關(guān)系的所有主體;采用包含至少兩個屬于挖掘目標(biāo)類型的成員主體的連通子集進行數(shù)據(jù)挖掘。
技術(shù)領(lǐng)域
本說明書涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種基于關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘方法和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)的發(fā)展和普及,各種基于網(wǎng)絡(luò)進行的活動都在源源不斷的產(chǎn)生數(shù)據(jù),許多企業(yè)、政府甚至個人等都掌握著大量的用戶數(shù)據(jù)。數(shù)據(jù)挖掘技術(shù)能夠從大量的數(shù)據(jù)中發(fā)現(xiàn)有價值的知識、模式、規(guī)則等信息,為科學(xué)研究、商業(yè)決策、過程控制等提供輔助支持,成為數(shù)據(jù)利用的重要方式。
在一些應(yīng)用場景中,用于挖掘的數(shù)據(jù)記錄能夠體現(xiàn)相同或者不同類型的主體之間的關(guān)聯(lián)關(guān)系。例如,可以通過轉(zhuǎn)賬記錄在付款方與收款方之間建立關(guān)聯(lián)關(guān)系;在賬戶登錄記錄中,賬戶與登錄時所使用的設(shè)備之間具有關(guān)聯(lián)關(guān)系。基于關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘廣泛應(yīng)用于網(wǎng)絡(luò)安全、商業(yè)營銷等領(lǐng)域,這些領(lǐng)域的數(shù)據(jù)挖掘需求通常隨業(yè)務(wù)發(fā)展不斷變化,提高數(shù)據(jù)挖掘的速度對及時滿足業(yè)務(wù)要求具有重要的意義。
發(fā)明內(nèi)容
有鑒于此,本說明書提供一種基于關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘方法,所述關(guān)聯(lián)關(guān)系建立在若干個主體之間;所述主體包括至少兩種類型,其中至少一種類型為挖掘目標(biāo)類型;所述方法包括:
根據(jù)主體之間的關(guān)聯(lián)關(guān)系,將所有主體劃分為若干個連通子集;所述連通子集包括至少一個成員主體,一個連通子集中包括與每個成員主體具有關(guān)聯(lián)關(guān)系的所有主體;
采用包含至少兩個屬于挖掘目標(biāo)類型的成員主體的連通子集進行數(shù)據(jù)挖掘。
本說明書還提供了一種基于關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘裝置,所述關(guān)聯(lián)關(guān)系建立在若干個主體之間;所述主體包括至少兩種類型,其中至少一種類型為挖掘目標(biāo)類型;所述裝置包括:
連通子集單元,用于根據(jù)主體之間的關(guān)聯(lián)關(guān)系,將所有主體劃分為若干個連通子集;所述連通子集包括至少一個成員主體,一個連通子集中包括與每個成員主體具有關(guān)聯(lián)關(guān)系的所有主體;
挖掘執(zhí)行單元,用于采用包含至少兩個屬于挖掘目標(biāo)類型的成員主體的連通子集進行數(shù)據(jù)挖掘。
本說明書提供的一種計算機設(shè)備,包括:存儲器和處理器;所述存儲器上存儲有可由處理器運行的計算機程序;所述處理器運行所述計算機程序時,執(zhí)行上述基于關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘方法所述的步驟。
本說明書還提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器運行時,執(zhí)行上述基于關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘方法所述的步驟。
由以上技術(shù)方案可見,本說明書的實施例中,將所有具有關(guān)聯(lián)關(guān)系的主體劃分至一個連通子集中,在所有連通子集中以包含至少兩個屬于挖掘目標(biāo)類型的成員主體的連通子集作為數(shù)據(jù)源進行數(shù)據(jù)挖掘;由于不包含或僅包含一個屬于挖掘目標(biāo)類型的成員主體的連通子集對數(shù)據(jù)挖掘結(jié)果的影響幾乎可以忽略不計,本說明書的實施例在基本不影響挖掘效果的前提下,減少了挖掘時需要處理的數(shù)據(jù)量,加快了數(shù)據(jù)挖掘的速度,提高了挖掘效率。
附圖說明
圖1是本說明書實施例中一種基于關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘方法的流程圖;
圖2是本說明書應(yīng)用示例中一種僅包含一個屬于挖掘目標(biāo)類型的節(jié)點的最大連通子圖的結(jié)構(gòu)示例圖;
圖3是本說明書應(yīng)用示例中一種包含兩個及以上屬于挖掘目標(biāo)類型的節(jié)點的最大連通子圖的結(jié)構(gòu)示例圖;
圖4是運行本說明書實施例的設(shè)備的一種硬件結(jié)構(gòu)圖;
圖5是本說明書實施例中一種基于關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘裝置的邏輯結(jié)構(gòu)圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810903048.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種關(guān)聯(lián)關(guān)系的查詢方法及裝置
- 包裝關(guān)聯(lián)關(guān)系建立裝置
- 企業(yè)關(guān)聯(lián)關(guān)系識別系統(tǒng)及其識別方法
- 關(guān)系建立方法
- 用于建立變更風(fēng)險控制措施庫的方法和裝置
- 企業(yè)客戶關(guān)聯(lián)關(guān)系圖譜構(gòu)建方法、裝置、存儲器和計算機
- 關(guān)聯(lián)關(guān)系建立方法
- 基于用戶關(guān)聯(lián)關(guān)系的信息推送方法、裝置及電子設(shè)備
- 確定企業(yè)關(guān)聯(lián)關(guān)系、重名對象判定
- 一種威脅情報關(guān)聯(lián)分析方法、系統(tǒng)、設(shè)備及計算機介質(zhì)
- 數(shù)據(jù)挖掘方法及設(shè)備
- 數(shù)據(jù)挖掘算法動態(tài)插入到數(shù)據(jù)挖掘平臺的方法及系統(tǒng)
- 基于MPP的并行數(shù)據(jù)挖掘系統(tǒng)及其實現(xiàn)方法
- 數(shù)據(jù)挖掘方法和裝置
- 一種解耦WEB客戶端與大數(shù)據(jù)挖掘分析的數(shù)據(jù)挖掘平臺及實現(xiàn)方法
- 大數(shù)據(jù)挖掘方法、裝置及數(shù)據(jù)挖掘服務(wù)器
- 一種數(shù)據(jù)挖掘系統(tǒng)及方法
- 一種大數(shù)據(jù)挖掘系統(tǒng)
- 一種基于數(shù)據(jù)庫的雙向數(shù)據(jù)挖掘方法和裝置
- 一種數(shù)據(jù)挖掘方法和裝置





