[發(fā)明專利]一種基于改進(jìn)隨機(jī)森林的比特幣地址分類方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010560006.X | 申請(qǐng)日: | 2020-06-18 |
| 公開(公告)號(hào): | CN111754345B | 公開(公告)日: | 2022-03-18 |
| 發(fā)明(設(shè)計(jì))人: | 王勁松;陶峰;張洪瑋;趙澤寧;石凱 | 申請(qǐng)(專利權(quán))人: | 天津理工大學(xué) |
| 主分類號(hào): | G06Q40/04 | 分類號(hào): | G06Q40/04;G06Q20/38;G06Q20/06;G06K9/62 |
| 代理公司: | 天津才智專利商標(biāo)代理有限公司 12108 | 代理人: | 龐學(xué)欣 |
| 地址: | 300384 天津市南*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改進(jìn) 隨機(jī) 森林 比特 地址 分類 方法 | ||
一種基于改進(jìn)隨機(jī)森林的比特幣地址分類方法。其包括構(gòu)建特征集、構(gòu)成數(shù)據(jù)集、獲得帶有標(biāo)簽的樣本集、初始化學(xué)習(xí)器的參數(shù)、迭代學(xué)習(xí)器及獲取關(guān)鍵特征等步驟。本發(fā)明從比特幣市場監(jiān)管角度將判斷用戶是否參與非法交易問題轉(zhuǎn)變成比特幣地址分類問題,有助于完善市場監(jiān)管;直接通過區(qū)塊鏈歷史交易記錄獲取樣本集,這樣就大大降低了數(shù)據(jù)的收集難度;能夠以84%左右的準(zhǔn)確率對(duì)比特幣地址進(jìn)行分類,僅僅只需要很少的統(tǒng)計(jì)特征;不僅能很好的對(duì)地址進(jìn)行分類,同時(shí)對(duì)構(gòu)建的大量統(tǒng)計(jì)特征進(jìn)行去冗余,當(dāng)學(xué)習(xí)器完成最終的訓(xùn)練之后,就能獲得最終需要提取的關(guān)鍵特征,這對(duì)于一個(gè)需要進(jìn)行識(shí)別的地址而言,既減少了數(shù)據(jù)收集時(shí)間,也降低了地址分類的時(shí)間開銷。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,特別是涉及一種基于改進(jìn)隨機(jī)森林的比特幣地址分類方法。
背景技術(shù)
隨著數(shù)字貨幣市場的不斷發(fā)展,比特幣作為數(shù)字貨幣中的典型代表,應(yīng)用越來越廣泛。比特幣地址是用戶參與服務(wù)的唯一身份標(biāo)識(shí),但是由于比特幣本身具有匿名性特點(diǎn),這也為諸如洗錢等非法活動(dòng)提供了便利。在這種情況下,為了更好地了解比特幣的用途,通過比特幣地址來說明用戶交易行為顯得至關(guān)重要,但比特幣的匿名性卻為此帶來了挑戰(zhàn),因此如何在系統(tǒng)中快速對(duì)一個(gè)比特幣地址進(jìn)行分類,即利用較少的統(tǒng)計(jì)特征,從而判斷該地址是被非法用戶所有還是屬于正常交易地址,是解決比特幣市場難于監(jiān)管的一個(gè)重要方法。
目前,比特幣地址的分類方法包括以下幾種:
交易圖分析法:目前最常用的比特幣地址分類方法就是交易圖分析法,常見的一種構(gòu)圖方法是將交易視為圖的點(diǎn)集,圖的邊表示兩筆交易間經(jīng)過某一地址所流通的比特幣數(shù)量,利用歷史交易記錄,從而能夠構(gòu)建出整個(gè)交易圖,從交易圖中能夠提取比特幣地址的一系列統(tǒng)計(jì)特征,利用常用的機(jī)器學(xué)習(xí)分類算法就能以較高的準(zhǔn)確率對(duì)地址進(jìn)行分類,一般情況下交易圖越完善,即越接近實(shí)際所有的交易,分類的準(zhǔn)確率會(huì)越高,通常準(zhǔn)確率都在90%以上,實(shí)際上不同的研究者出于不同的目的會(huì)選擇不一樣的構(gòu)圖方式,但無疑最終都會(huì)形成一張超大的圖。
啟發(fā)式地址聚類法:啟發(fā)式地址聚類在一定程度上也能夠識(shí)別一個(gè)比特幣地址,該方法基于一個(gè)經(jīng)典的假設(shè):在同一筆交易中,所有的輸入地址都是由一個(gè)用戶所掌握的。由于比特幣系統(tǒng)協(xié)議會(huì)在交易的過程中自動(dòng)生成找零地址,用于接收交易中的找零資金,因此進(jìn)一步的地址聚類方法會(huì)將找零地址與輸入地址折疊成一個(gè)更大的交易實(shí)體,只要其中的一個(gè)地址類別暴露就可以對(duì)該交易實(shí)體所有的地址進(jìn)行識(shí)別。
機(jī)器學(xué)習(xí)分類方法:目前一部分研究人員著力于直接從交易歷史記錄中提取相關(guān)地址的統(tǒng)計(jì)特征,區(qū)別于交易圖分析法大大減少了構(gòu)圖工作量,利用經(jīng)典的機(jī)器學(xué)習(xí)分類方法也能夠以較高的準(zhǔn)確率對(duì)地址進(jìn)行識(shí)別,通常準(zhǔn)確率在80%以上。
但現(xiàn)有的交易圖分析法收集數(shù)據(jù)方法過于繁復(fù),需要先利用比特幣歷史交易記錄根據(jù)自己定義的構(gòu)圖規(guī)則形成一張圖,再從中提取特征,往往不同的研究者構(gòu)圖的方法各不相同,但無疑最終都會(huì)形成一張超大的圖,同時(shí)現(xiàn)有的多分類方法中對(duì)于地址提取的特征較多,使數(shù)據(jù)收集的難度過大,耗費(fèi)時(shí)間過長,這為快速分類一個(gè)比特幣地址制造了難度。
現(xiàn)有的基于啟發(fā)式的地址聚類方法存在兩個(gè)缺陷:一是該方法只針對(duì)特定類型交易地址有效,如多個(gè)交易輸入可以被聚成一類,但是對(duì)于單一輸入的交易,當(dāng)該輸入地址在未來交易記錄中從未出現(xiàn)過時(shí),將無法歸類到任何一類。二是基于找零地址的啟發(fā)式聚類方法由于受到比特幣協(xié)議的變化,如找零地址使用比特幣錢包自動(dòng)生成的新地址或用戶指定的新地址,因此該方法不能完全聚類出交易輸入用戶控制的地址群。
現(xiàn)有的機(jī)器學(xué)習(xí)分類方法對(duì)于從交易歷史記錄中提取什么特征,提取多少特征尚未形成一致觀點(diǎn),因此不同的研究人員會(huì)提取到不同數(shù)量和不同種類的特征,事實(shí)上這種盲選特征會(huì)造成實(shí)際特征中有很多的冗余特征,增加了學(xué)習(xí)器的訓(xùn)練開銷,無法為一個(gè)需要分類的地址的特征提取提供參考。
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明的目的在于提供了一種基于改進(jìn)隨機(jī)森林的比特幣地址分類方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津理工大學(xué),未經(jīng)天津理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010560006.X/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險(xiǎn);稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計(jì)算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險(xiǎn),例如,風(fēng)險(xiǎn)分析或養(yǎng)老金
- 隨機(jī)數(shù)生成設(shè)備及控制方法、存儲(chǔ)器存取控制設(shè)備及通信設(shè)備
- 隨機(jī)接入方法、用戶設(shè)備、基站及系統(tǒng)
- 真隨機(jī)數(shù)檢測裝置及方法
- 隨機(jī)元素生成方法及隨機(jī)元素生成裝置
- 數(shù)據(jù)交互方法、裝置、服務(wù)器和電子設(shè)備
- 一種隨機(jī)數(shù)發(fā)生器的多隨機(jī)源管理方法
- 用于彩票行業(yè)的隨機(jī)數(shù)獲取方法及系統(tǒng)
- 隨機(jī)接入方法、裝置及存儲(chǔ)介質(zhì)
- 偽隨機(jī)方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 模型訓(xùn)練方法、裝置和計(jì)算設(shè)備





