[發明專利]可疑數據識別方法、裝置、電子設備、介質和計算機程序有效
| 申請號: | 202110939789.7 | 申請日: | 2021-08-16 |
| 公開(公告)號: | CN113869904B | 公開(公告)日: | 2022-09-20 |
| 發明(設計)人: | 汪美玲 | 申請(專利權)人: | 工銀科技有限公司;中國工商銀行股份有限公司 |
| 主分類號: | G06Q20/40 | 分類號: | G06Q20/40;G06Q40/04;G06K9/62;G06F16/28 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 趙婷 |
| 地址: | 071700 河北省保定市中國(河北)自由貿易試驗*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 可疑 數據 識別 方法 裝置 電子設備 介質 計算機 程序 | ||
本公開提供了一種基于知識圖譜和標簽傳播的可疑數據識別方法、可疑數據識別裝置、電子設備、計算機可讀存儲介質和計算機程序。可疑數據識別方法和裝置可用于人工智能技術領域。基于知識圖譜和標簽傳播的可疑數據識別方法包括:獲取交易表;確定可疑客戶標簽表;根據交易表和可疑客戶標簽表建立知識圖譜;根據知識圖譜提取第一連通子圖列表;針對第一連通子圖列表中節點數量大于等于第一閾值的第一連通子圖,根據節點屬性計算第一連通子圖中每個節點的點特征值,根據邊屬性計算第一連通子圖中每個邊的邊特征值;根據標簽號、點特征值和邊特征值計算更新每個節點的標簽號得到第二連通子圖列表;以及根據第二連通子圖列表輸出可疑數據列表。
技術領域
本公開涉及人工智能技術領域,可用于金融領域,更具體地,涉及一種基于知識圖譜和標簽傳播的可疑數據識別方法、可疑數據識別裝置、電子設備、計算機可讀存儲介質和計算機程序。
背景技術
相關技術中,有使用基于監督模型的可疑數據識別方法識別可疑數據,該類方法基于預先確定的可疑數據和非可疑數據構造正負樣本,之后利用監督式分類模型進行二分類訓練,最后對于新的數據使用訓練得到的模型進行可疑性的預測。
相關技術中,也有使用基于無監督聚類的可疑數據識別方法識別可疑數據,該類方法首先基于客戶的交易關系構建圖結構,之后在圖結構上按照特定特征維度運行無監督聚類算法生成聚類,之后聚類的結果融入客戶可疑性信息,進行聚類的合并、打分、排序等,輸出可疑數據。
發明內容
有鑒于此,本公開提供了一種簡便、效率高并且識別準確的基于知識圖譜和標簽傳播的可疑數據識別方法、可疑數據識別裝置、電子設備、計算機可讀存儲介質和計算機程序。
本公開的一個方面提供了一種基于知識圖譜和標簽傳播的可疑數據識別方法,包括:獲取交易表,所述交易表包括交易信息;確定可疑客戶標簽表,所述可疑客戶標簽表中的每個客戶具有標簽號,其中,所述可疑客戶標簽表中的部分客戶具有可疑標簽號,另一部分客戶具有非可疑標簽號;根據所述交易表和所述可疑客戶標簽表建立知識圖譜,其中,所述可疑客戶標簽表中的客戶為所述知識圖譜中的節點,所述節點具有節點屬性,所述交易信息為連接至少部分所述節點的邊,所述邊具有邊屬性。
根據所述知識圖譜提取第一連通子圖列表,其中,所述第一連通子圖列表為至少一個第一連通子圖的集合,所述第一連通子圖包括彼此之間有連接關系的所有節點和連接所述節點的邊;針對所述第一連通子圖列表中所述節點數量大于等于第一閾值的所述第一連通子圖,根據所述節點屬性計算所述第一連通子圖中每個所述節點的點特征值,根據所述邊屬性計算所述第一連通子圖中每個邊的邊特征值;根據所述標簽號、所述點特征值和所述邊特征值計算更新每個節點的標簽號,其中,具有更新后的所述標簽號的所述第一連通子圖為第二連通子圖,所述第二連通子圖的集合為第二連通子圖列表;以及根據所述第二連通子圖列表輸出可疑數據列表。
根據本公開實施例的基于知識圖譜和標簽傳播的可疑數據識別方法,與相關技術中的基于監督模型的可疑數據識別方法相比,本公開基于可疑客戶標簽表和交易表識別可疑數據,無需可疑數據訓練數據。與現有技術中的基于無監督聚類的可疑數據識別方法相比,本公開將客戶的可疑標簽號作為監督信號進行可疑標簽傳播,以半監督方式發現潛在的可疑客戶、剔除誤識別的可疑客戶;另外,本公開基于圖數據庫構造知識圖譜,在此基礎上運行第一連通子圖和第二連通子圖生成、可疑標簽傳播等聚類算法,效率更高;而且針對現有技術中的基于無監督聚類的可疑數據識別方法后處理復雜的技術問題,本公開經過知識圖譜聚類計算后,只需根據第二連通子圖中的新標簽號為可疑標簽號的節點個數是否大于等于第二閾值進行篩選,無需復雜的后處理。
在一些實施例中,所述確定可疑客戶標簽表包括:獲取客戶表;獲取可疑客戶表;以及將所述客戶表和所述可疑客戶表進行連接,對所述客戶表中的且出現在所述可疑客戶表中的客戶設置可疑標簽號,對所述客戶表中的且未出現在所述可疑客戶表中的客戶設置非可疑標簽號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于工銀科技有限公司;中國工商銀行股份有限公司,未經工銀科技有限公司;中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110939789.7/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





