[發明專利]一種基于Pregel的實現挖掘商業銀行交易數據的資金圈分布的方法在審
| 申請號: | 202011267511.1 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112256769A | 公開(公告)日: | 2021-01-22 |
| 發明(設計)人: | 龐明宇 | 申請(專利權)人: | 北京海致星圖科技有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06Q40/02;G06Q40/04 |
| 代理公司: | 北京成實知識產權代理有限公司 11724 | 代理人: | 張焱 |
| 地址: | 100089 北京市石景*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 pregel 實現 挖掘 商業銀行 交易 數據 資金 分布 方法 | ||
1.一種基于Pregel的實現挖掘商業銀行交易數據的資金圈分布的方法,其特征在于:包括如下步驟:
步驟1:以轉賬交易數據構建邊,形成一個有向圖,圖中每一條邊都是一個轉賬交易行為,邊的表達形式如下:(a,b,attrs),整個有向圖的數學形式為:[(srcId,srcAttr),(dstId,dstAttr),(attr)];
其中a,b代表企業實體,attrs代表a和b轉賬行為的自有屬性;
其中,srcId為a轉賬方節點id;
其中,srcAttr為a轉賬方節點自身屬性;
其中,dstId為b轉賬方節點id;
其中,dstAttr為b轉賬方節點自身屬性;
其中,attr為轉賬屬性;
步驟2:利用Spark大數據的pregel,設計迭代算法,基于pregel實現,找出成環的資金流向。
2.根據權利要求1所述的一種基于Pregel的實現挖掘商業銀行交易數據的資金圈分布的方法,其特征在于:attrs代表a和b轉賬行為的自有屬性,該自有屬性包括轉賬的時間、轉賬的金額、轉賬設備的ID以及轉賬設備網絡IP地址。
3.根據權利要求1所述的一種基于Pregel的實現挖掘商業銀行交易數據的資金圈分布的方法,其特征在于:srcAttr為a轉賬方節點自身屬性,該自身屬性包括企業屬性以及個人屬性。
4.根據權利要求1所述的一種基于Pregel的實現挖掘商業銀行交易數據的資金圈分布的方法,其特征在于:attr為轉賬屬性,且該轉賬屬性包括轉賬金額、轉賬時間、轉賬類型以及轉賬用途。
5.根據權利要求1所述的一種基于Pregel的實現挖掘商業銀行交易數據的資金圈分布的方法,其特征在于:所述步驟2中的迭代算法設計依據為根據業務需求而定,且業務需求限定為:Attr(x)=F(Attr(x-1)),其中,Attr代表某筆交易的轉賬屬性,Attr(x-1)代表x-1刻的交易,Attr(x)代表第x刻的交易,F代表約束關系,或稱為迭代條件,任何兩筆相鄰的轉賬都符合該種約束關系。
6.根據權利要求5所述的一種基于Pregel的實現挖掘商業銀行交易數據的資金圈分布的方法,其特征在于:當F與轉賬金額,轉賬時間有關時,抽象表達如下:
F~(factor1,factor2,..);
其中,Factor,factor2表示迭代條件的要素,也是一筆轉賬里包含的屬性,在圖中為邊屬性。
7.根據權利要求6所述的一種基于Pregel的實現挖掘商業銀行交易數據的資金圈分布的方法,其特征在于:假設限定迭代條件F~(factor1,factor2,...),迭代算法步驟如下:
S1:對有向圖中所有節點設定初始屬性attr,且attr包含srcId,作為自身節點的初始化屬性id,以及自定義屬性,用自己的節點id作為所屬強連通分支的id,并將所有節點打上初始標記false;
S2:首先做循環,將只有出邊或入邊的節點標記為true,將“只存在單向邊的或者孤立的節點”和“已經確認且打好標記的強連通分量”中的被標記為true的節點從有向圖中去除;
S3:初始化完成自身的屬性后,基于Pregel計算框架,開始分布式進行有向圖的信息傳遞,圖中每一條邊沿著出邊由src節點向dst節點發送自己的屬性id,并且設置如下規則,只允許屬性id小的節點向屬性id大的節點傳遞信息,或者屬性值大的往屬性小的傳遞,取決于實現方法,該種操作會決定哪個節點會作為強連通分量的唯一性標記;
其中,在由src節點向dst節點傳遞的過程中,為了實現兩筆轉賬的約束條件F,需要做如下操作:
在A傳遞到B的時候,需要連帶邊屬性attr傳入給B,作為B的節點屬性,也即自定義屬性,之后B傳遞給C時,B的節點屬性需要與B-C轉賬的邊屬性進行比較,且需要滿足F條件,否則B-C不往下傳遞,抽象表示如下:
F(attrAB,attrBC)=F(srcAttr_B,attrBC)=true;
S4:當深搜結束,Pregel中是人為設置遍歷深度,默認為原圖已被“著色”,有向圖開始反向遍歷,為著色完成的圖中節點反向打標簽以確定是否完成強連通分支id標記,在著色完成的圖中,節點id與節點屬性id相同時,則表明該節點是自身所處強連通分支的root節點,則節點標簽標記為true,之后,有向圖中所有節點沿著入邊由dst節點向src節點發送自身標記情況,只要節點收到true消息,則該節點便標記為true;
S5:反向遍歷同樣深度后,遍歷到的節點完成了強連通分量的標記,然后將該部分節點從原圖中刪除,作為返回結果的一部分,剩下的節點構成新的原圖,重新執行步驟S1-S4,直到整張圖所有節點被刪除干凈;
其中,在由dst節點向src節點傳遞的過程中,需要滿足:
F逆(attrBC,attrAB)=F逆(srcAttr_C,attrBC)=true;
其中,F逆表示F的逆轉條件,即從dst出發去看待F條件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京海致星圖科技有限公司,未經北京海致星圖科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011267511.1/1.html,轉載請聲明來源鉆瓜專利網。





