[發明專利]區塊鏈地址分類的方法和裝置在審
| 申請號: | 202110692274.1 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113535847A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 穆長春;呂遠;卿蘇德;王艷輝;張凌云;吳浩 | 申請(專利權)人: | 中國人民銀行數字貨幣研究所 |
| 主分類號: | G06F16/27 | 分類號: | G06F16/27;G06F16/26;G06F16/28;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 張效榮;韓黎捷 |
| 地址: | 100070 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 區塊 地址 分類 方法 裝置 | ||
本發明公開了區塊鏈地址分類的方法和裝置,涉及計算機技術領域。該方法的一具體實施方式包括:獲取區塊鏈的賬本交易數據,根據所述賬本交易數據構建異質圖網絡;根據所述異質圖網絡確定待分類地址的表征向量;將所述待分類地址的表征向量輸入預訓練的分類模型,確定所述待分類地址的分類結果。該實施方式通過將區塊鏈的賬本交易數據構建成異質圖網絡,不僅能夠將海量交易數據的隱式業務規則特點充分表達,挖掘地址之間的復雜內在交易關聯,還能夠節省內存消耗、提高計算效率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種區塊鏈地址分類的方法和裝置。
背景技術
區塊鏈從本質上講,它是一個分布式共享數據庫,存儲于其中的數據或信息具有“不可偽造”、“全程留痕”、“可以追溯”、“公開透明”、“集體維護”等特征。區塊鏈UTXO(Unspent Transaction Outputs,未花費交易輸出)賬戶模型的合法交易通常包括多個發起方、多個接收方和交易明細。在區塊鏈系統中,鏈上所有參與節點維護一個共同的賬本。由于區塊鏈代幣去中心化且未實名的特點,需要將區塊鏈地址進行分類,以便識別非法地址。但現有的UTXO區塊鏈地址分類主要是基于規則、經典聚類算法等方法,不能充分挖掘地址之間的復雜內在交易關聯。
發明內容
有鑒于此,本發明實施例提供一種區塊鏈地址分類的方法和裝置,通過將區塊鏈的賬本交易數據構建成異質圖網絡,不僅能夠將海量交易數據的隱式業務規則特點充分表達,挖掘地址之間的復雜內在交易關聯,還能夠節省內存消耗、提高計算效率。
為實現上述目的,根據本發明實施例的一個方面,提供了一種區塊鏈地址分類的方法,包括:
獲取區塊鏈的賬本交易數據,根據所述賬本交易數據構建異質圖網絡;
根據所述異質圖網絡確定待分類地址的表征向量;
將所述待分類地址的表征向量輸入預訓練的分類模型,確定所述待分類地址的分類結果。
可選地,根據所述賬本交易數據構建異質圖網絡,包括:
將所述賬本交易數據對應的所有區塊鏈地址分別作為一個地址頂點,將所述賬本交易數據對應的交易標識分別作為一個交易頂點;
對于每條所述交易記錄,將所述交易記錄的交易標識對應的交易頂點分別與所述交易記錄的每個區塊鏈地址對應的地址頂點連接成邊,形成所述異質圖網絡。
可選地,根據所述異質圖網絡確定所述待分類地址的表征向量,包括:
使用metapath2vec算法在所述異質圖網絡上進行游走采樣,將采樣得到的編碼序列作為訓練數據;
根據已構建的地址標識對應地址的映射詞表,對每個待分類地址進行獨熱編碼,得到待分類地址的稀疏矩陣;
根據所述訓練數據和所述稀疏矩陣,使用Skip-Gram模型進行模型訓練,得到每個所述待分類地址的表征向量。
可選地,使用metapath2vec算法在所述異質圖網絡上進行游走采樣,包括:
使用metapath2vec算法,在所述異質圖網絡上根據元路徑進行游走采樣,得到海量不等長的編碼序列。
可選地,所述元路徑為:任一地址頂點→相連的交易頂點→交易相連的其他地址頂點。
可選地,從區塊鏈的所有地址中篩選多個地址,包括:
根據所述異質圖網絡確定所述區塊鏈中每個地址對應邊的數量,篩選對應邊的數量大于等于預設閾值的地址。
可選地,將所述待分類地址的表征向量輸入預訓練的分類模型之前,還包括:采用XGBoost算法訓練所述分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民銀行數字貨幣研究所,未經中國人民銀行數字貨幣研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110692274.1/2.html,轉載請聲明來源鉆瓜專利網。





