[發明專利]基于非均勻分段映射的平行坐標改進方法有效
| 申請號: | 201711271757.4 | 申請日: | 2017-12-06 |
| 公開(公告)號: | CN107918597B | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 李慧;馬楠;何勤 | 申請(專利權)人: | 北京聯合大學 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100101 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 均勻 分段 映射 平行 坐標 改進 方法 | ||
1.一種基于非均勻分段映射的平行坐標改進方法,包含如下步驟:
步驟1:針對數據集的每一維數據,從數據的最小值至最大值的數據范圍均分為多個分段;分段數由用戶設定,同一數據集中的不同數據維的分段數量不同;
以第i維數據為例,該維數據的最小值為mini,最大值為maxi,設定該維數據分段數量為Ni,則每個分段的大小為segi=(maxi-mini)/Ni,第i維數據的第j分段的范圍如公式(1)所示,
Rangei,j=[mini+segi*(j-1),mini+segi*j) (1)
最大值包含在最后一分段中;
步驟2:針對數據集的每一維數據,統計該維數據在每一分段中出現的次數,簡稱為數據分段頻次;
步驟3:針對數據集的每一維數據,基于數據分段頻次,建立描述當前維的數據分段頻次直方圖;直方圖的橫坐標為數據分段,縱坐標為數據分段頻次;
根據直方圖的定義,每一維數據所對應的直方圖,可表示該維數據的分布規律;
步驟4:基于數據集中的每一維數據的數據分段頻次直方圖,將直方圖信息融入平行坐標系的相應坐標軸中,建立分段平行坐標系;分段平行坐標系的具體建立方法為:針對數據集中的每一維數據,將其對應的數據分段頻次直方圖,進行橫縱坐標交換,即以數據分段為縱坐標,以數據分段頻次為橫坐標,進行橫坐標放縮后,與該維數據對應的坐標軸結合;
通過分段平行坐標系,能快速觀察各維數據的數據分布情況;
步驟5:調整分段平行坐標系中的坐標軸各分段的高度占比,建立非均勻分段映射平行坐標系;
調整的原則是為了使數據頻次較大的分段擁有較大的高度占比,而使數據頻次較小的分段占據較小的高度占比;經過調整后的分段平行坐標系,每一維數據對應的坐標軸中的各個分段其映射比例不同,調整后的分段平行坐標系稱為非均勻分段映射平行坐標系;
步驟6:針對數據集中的每一條數據,計算其在非均勻分段映射平行坐標系中各坐標軸上的映射位置;
針對一條數據,計算其在第i個坐標軸上的映射高度的計算方法為:
步驟6.1:針對該條數據,取其第i維的數據值,命名該數據值為d;
步驟6.2:根據步驟1中的分段范圍,獲知數據d在第i維的分段中所屬的分段,命名該分段為s,并獲取該分段所對應的數值范圍[VsL,VsH);
步驟6.3:根據分段s在當前維的所有分段中的順序號和步驟5中獲得的各分段在坐標軸上的高度范圍,獲得分段s的坐標軸高度范圍
步驟6.4:根據公式(2)計算該條數據中第i維的數據值d在分段平行坐標系中的當前坐標軸上的映射高度值,
其中,d為步驟6.1中該條數據第i維的數據值,VsL和VsH為步驟6.2中數據d所屬分段的數值范圍低值和高值,和是步驟6.3中獲得的分段s的坐標軸高度范圍低值和高值;
步驟6.5:針對該條數據的其他維數據值,執行步驟6.1至步驟6.4得到該條數據所有維的數據值在相應坐標軸上的映射高度值;
步驟6.6:針對該條數據的每一維數據值在相應坐標軸上的映射高度值,與相應坐標軸共同組成該條數據在各坐標軸上的映射位置;
步驟6.7:針對數據集中的所有數據,執行步驟6.1至步驟6.6,計算每條數據在非均勻分段映射平行坐標系中各坐標軸上的映射位置;
步驟7:繪制改進后的基于非均勻分段映射的平行坐標可視化結果;
針對數據集中的每一條數據,連接其在各坐標軸上的映射位置,即可獲得改進后的基于非均勻分段映射的平行坐標可視化結果,連接線使用折線或其他曲線。
2.如權利要求1所述的一種基于非均勻分段映射的平行坐標改進方法,其特征在于,其中調整分段平行坐標系中的坐標軸各分段的高度占比,建立非均勻分段映射平行坐標系,其特征如下:
針對某一維數據對應的坐標軸中,某一數據分段的調整后高度占比的計算方法如公式(3)所示:
其中,Hi是調整后的分段高度;k是調整系數,其取值范圍為0≤k≤1,k值越大則調整越明顯,反之k值越小則調整越不明顯;當k為最小值0時各分段高度不調整,當k為最大值1時各分段的高度占比與對應分段的數據頻次比例相同;Hd是當前維對應坐標軸的總高度,n是當前維的分段數量,Fi是當前分段的數據頻次;
調整后,當前維對應的坐標軸的n個分段中,第1個分段在坐標軸上的高度范圍為[0,H1],第2至n個分段中第i個分段在坐標軸上的高度范圍為
經過調整后的分段平行坐標系,每一維數據對應的坐標軸中的各個分段其映射比例不同,調整后的分段平行坐標系稱為非均勻分段映射平行坐標系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聯合大學,未經北京聯合大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711271757.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于酸性氣體去除的工藝設計
- 下一篇:切削加工輔助潤滑材料和切削加工方法





