[發(fā)明專利]用于提高分類精度的交互式可視數(shù)據(jù)挖掘在審
申請?zhí)枺?/td> | 201210366772.8 | 申請日: | 2012-09-28 |
公開(公告)號: | CN103699541A | 公開(公告)日: | 2014-04-02 |
發(fā)明(設(shè)計(jì))人: | 陳弢;陳繼東 | 申請(專利權(quán))人: | 伊姆西公司 |
主分類號: | G06F17/30 | 分類號: | G06F17/30 |
代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 王茂華 |
地址: | 美國馬*** | 國省代碼: | 美國;US |
權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 用于 提高 分類 精度 交互式 可視 數(shù)據(jù) 挖掘 | ||
1.一種方法,包括:
從高維數(shù)據(jù)集合生成至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu);
生成包括所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)的復(fù)合數(shù)據(jù)結(jié)構(gòu),所述復(fù)合數(shù)據(jù)結(jié)構(gòu)基于在所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)之間計(jì)算的相關(guān)性被生成;
將所述復(fù)合數(shù)據(jù)結(jié)構(gòu)可視化在顯示器上;以及
經(jīng)由與所述顯示器上的所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的所述可視化的交互,允許對所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的修改。
2.根據(jù)權(quán)利要求1所述的方法,其中所述復(fù)合數(shù)據(jù)結(jié)構(gòu)是隨機(jī)森林?jǐn)?shù)據(jù)結(jié)構(gòu)。
3.根據(jù)權(quán)利要求1所述的方法,其中生成所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的步驟進(jìn)一步包括:計(jì)算所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)之間的距離。
4.根據(jù)權(quán)利要求3所述的方法,其中所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)之間的所述距離被計(jì)算為在所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)之間計(jì)算的所述相關(guān)性的倒數(shù)。
5.根據(jù)權(quán)利要求3所述的方法,其中生成所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的步驟進(jìn)一步包括:基于在所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)之間計(jì)算的距離,計(jì)算所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)中每一個(gè)的坐標(biāo)軸。
6.根據(jù)權(quán)利要求5所述的方法,其中所述坐標(biāo)軸是二維軸。
7.根據(jù)權(quán)利要求5所述的方法,其中可視化所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的步驟進(jìn)一步包括:基于計(jì)算出的所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)的坐標(biāo)軸,在所述顯示器上繪制所述復(fù)合數(shù)據(jù)結(jié)構(gòu)。
8.根據(jù)權(quán)利要求1所述的方法,其中所述復(fù)合數(shù)據(jù)結(jié)構(gòu)中的每個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)被可視化,使得分裂屬性被可視地表示為樹枝。
9.根據(jù)權(quán)利要求1所述的方法,其中所述復(fù)合數(shù)據(jù)結(jié)構(gòu)中的每個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)被可視化,使得不同的類別標(biāo)記被可視地表示為不同的樹葉形狀。
10.根據(jù)權(quán)利要求1所述的方法,其中可視化所述復(fù)合數(shù)據(jù)結(jié)構(gòu)中的每個(gè)決策樹數(shù)據(jù)結(jié)構(gòu),使得與所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)中給定的一個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)相關(guān)聯(lián)的記錄的數(shù)量被可視化地表示為樹干半徑。
11.根據(jù)權(quán)利要求1所述的方法,還包括:計(jì)算所述復(fù)合數(shù)據(jù)結(jié)構(gòu)中每個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)的分類精度。
12.根據(jù)權(quán)利要求11所述的方法,其中所述復(fù)合數(shù)據(jù)結(jié)構(gòu)中的每個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)被可視化,使得所述分類精度被可視地表示為樹干高度。
13.根據(jù)權(quán)利要求1所述的方法,其中經(jīng)由與所述顯示器上的所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的所述可視化的交互來允許對所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的修改的步驟進(jìn)一步包括允許以下至少一個(gè):從所述復(fù)合數(shù)據(jù)結(jié)構(gòu)中移除至少一個(gè)決策樹數(shù)據(jù)結(jié)構(gòu);以及向所述復(fù)合數(shù)據(jù)結(jié)構(gòu)添加至少一個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)。
14.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括:使用所述復(fù)合數(shù)據(jù)結(jié)構(gòu)對新數(shù)據(jù)記錄進(jìn)行分類。
15.一種包括處理器可讀存儲介質(zhì)的計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)可讀存儲介質(zhì)具有編碼于其中的一個(gè)或多個(gè)軟件程序的可執(zhí)行代碼,其中當(dāng)所述一個(gè)或多個(gè)軟件程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)根據(jù)權(quán)利要求1所述的方法的步驟。
16.一種裝置,包括:
存儲器;以及
處理器,可操作地耦合到高存儲器的,并且被配置為:
從高維數(shù)據(jù)集合生成至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu);
生成包括所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)的復(fù)合數(shù)據(jù)結(jié)構(gòu),所述復(fù)合數(shù)據(jù)結(jié)構(gòu)基于在所述至少兩個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)之間計(jì)算的相關(guān)性被生成;
將所述復(fù)合數(shù)據(jù)結(jié)構(gòu)可視化在顯示器上;以及
經(jīng)由與所述顯示器上的所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的所述可視化的交互,允許對所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的修改。
17.根據(jù)權(quán)利要求16所述的裝置,其中所述復(fù)合數(shù)據(jù)結(jié)構(gòu)是隨機(jī)森林?jǐn)?shù)據(jù)結(jié)構(gòu)。
18.根據(jù)權(quán)利要求16所述的裝置,其中經(jīng)由與所述顯示器上的所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的所述可視化的交互來允許對所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的修改進(jìn)一步包括允許從所述復(fù)合數(shù)據(jù)結(jié)構(gòu)移除至少一個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)。
19.根據(jù)權(quán)利要求16所述的裝置,其中經(jīng)由與所述顯示器上的所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的所述可視化的交互來允許對所述復(fù)合數(shù)據(jù)結(jié)構(gòu)的修改進(jìn)一步包括允許向所述復(fù)合數(shù)據(jù)結(jié)構(gòu)添加至少一個(gè)決策樹數(shù)據(jù)結(jié)構(gòu)。
20.根據(jù)權(quán)利要求16所述的裝置,其中所述處理器還被配置為使用所述復(fù)合數(shù)據(jù)結(jié)構(gòu)對新數(shù)據(jù)記錄進(jìn)行分類。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于伊姆西公司,未經(jīng)伊姆西公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210366772.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)