[發明專利]一種處理實體的方法和設備有效
| 申請號: | 201510845455.8 | 申請日: | 2015-11-26 |
| 公開(公告)號: | CN106803178B | 公開(公告)日: | 2020-09-18 |
| 發明(設計)人: | 周榮旺;李莎;朱樓華;張英 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/00 | 分類號: | G06F16/00;G06Q20/40 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許振新 |
| 地址: | 開曼群島大開曼*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 處理 實體 方法 設備 | ||
本公開公開了一種處理實體的方法和設備,該方法包括:根據起始實體的風險概率以及每一條邊的擴散系數,按照風險傳播的方向進行迭代處理,以確定所述實體網絡關系中的每一個實體的綜合風險概率;根據各實體的綜合風險概率,來處理所述各實體;以此在挖掘隱案時涉及到了所有關聯的實體,擴大了實體的覆蓋率,并且準確率還得到了提高,同時,能夠確定存在隱案的非黑實體是受哪些實體的影響,還能夠支持實時性的隱案挖掘。
技術領域
本公開涉及網絡技術領域,特別是涉及一種處理實體的方法和設備。
背景技術
近些年,各個支付平臺的盜卡和盜帳戶案件已經積累了很多,并形成了相應的黑名單。如何有效的利用這些黑名單是一個很重要的課題。現有的黑名單應用一般是直接做查詢使用,即只是利用黑名單本身,對黑名單中的實體進行處罰動作。
基于黑名單的拓展應用目前一般是挖掘隱藏在其中的作案團伙,研究黑名單中的實體的行為方式等。
基于通過黑名單挖掘隱案,一般是通過反查的方式進行,即從單個黑名單中的實體出發,根據業務邏輯,向非黑實體一層層的進行反查,然后找出隱藏的有過非法行為但是沒有被發現的實體。
另外,隱案挖掘的方式還可以通過標簽擴散算法,進行半監督學習,通過不斷的迭代,在算法穩定后會對非黑實體進行標注,然后選擇標注成有非法行為的實體進行處罰動作。
經過研究,發現現有技術至少存在以下問題:
通過反查進行隱案的挖掘時只對黑名單實體有直接關系的實體進行反查,這樣覆蓋率不高,且會遺漏存在隱案的實體,標簽擴散算法是雙向擴散的,即一個實體的判斷邏輯,會在迭代過程中不斷受到同一個實體的影響,最終結果沒法判別到底是什么原因導致的,結果的準確率不是很高,同時,因為標簽擴散算法是迭代機制的,只適用于離線模型訓練,對于實時性支持不夠。
發明內容
本公開提出了一種處理實體的方法和設備,本公開的技術方案可以有效用于通過黑名單去發現隱案,以及預測非黑實體的作案可能性等。
本公開的技術方案如下:
一種處理實體的方法,應用于包括多個實體的實體網絡關系中,其中相鄰兩個實體之間通過邊進行連接,風險經由所述邊進行傳播是有方向的,所述方法包括:
根據起始實體的風險概率以及每一條邊的擴散系數,按照風險傳播的方向進行迭代處理,以確定所述實體網絡關系中的每一個實體的綜合風險概率;
根據各實體的綜合風險概率,來處理所述各實體。
可選的,所述起始實體為風險概率已知的實體,所述每一條邊的擴散系數是基于所述實體網絡關系確定的,具體的確定過程包括以下步驟:
步驟A、根據所述實體網絡關系確定各所述邊的衰減系數、各所述邊的風險傳播概率,以及各所述邊的邊權重系數;
步驟B、根據各所述邊的衰減系數、各所述邊的風險傳播概率,各所述邊的邊權重系數三者的乘積來確定各所述邊的擴散系數。
可選的,各所述邊的衰減系數是根據各所述邊的業務屬性來確定的;
各所述邊的風險傳播概率是根據各所述邊所連接的相鄰兩個實體的歷史行為而確定的;
各所述邊的邊權重系數是根據各所述邊所連接的相鄰兩個實體發生的歷史行為的次數來確定的。
可選的,所述根據起始實體的風險概率以及每一條邊的擴散系數,按照風險傳播的方向進行迭代處理,以確定所述實體網絡關系中的每一個實體的綜合風險概率,具體包括以下步驟:
步驟1、以多個起始實體中的第N個起始實體為起點,確定與所述第N個起始實體相關聯的多條風險傳播路徑,N為大于0的正整數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510845455.8/2.html,轉載請聲明來源鉆瓜專利網。





