[發明專利]用于呈現數據的方法和裝置有效
| 申請號: | 201310104829.1 | 申請日: | 2013-03-28 |
| 公開(公告)號: | CN104077303B | 公開(公告)日: | 2017-07-28 |
| 發明(設計)人: | 張超;嚴駿馳;王瑜;趙乾坤;張欣;田春華 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/08 |
| 代理公司: | 北京市金杜律師事務所11256 | 代理人: | 酆迅,李崢宇 |
| 地址: | 美國紐*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 呈現 數據 方法 裝置 | ||
技術領域
本發明的各實施方式涉及數據處理,更具體地,涉及用于將高維數據轉換為低維數據并以可視化方式進行呈現的方法和裝置。
背景技術
隨著計算機硬件技術以及軟件技術的發展,越來越多的行業已經實現了基于計算機的自動化處理。隨著辦公自動化的普及,業務處理期間涉及的各種數據可以以諸如二維表格等方式存儲在數據存儲系統中。通常,根據行業的不同,這些數據通常會涉及方方面面的數據,并且以相當高的維度表示。
具體地,僅以電子產品行業為例,當電子產品提供商建立數據庫時,需要采集關于客戶的諸多方面的信息。在本發明的上下文中,可以將這些方面稱為“維度”。例如,在描述客戶屬性時,可以包括但不限于如下維度,姓名、年齡、血型、職業、婚姻狀況、收入等方面的信息;例如,對于出售的各種商品而言,可能會涉及商品名稱、型號、價格、折扣、銷量、生產日期、保修期等方面的信息。當記錄購買事件的內容時,則需要包括客戶屬性、商品屬性以及購買發生的時間、地點等等更多維度。在上文中僅以示例方式示出了數據中可能涉及的多個維度的示例,應當理解,在實際應用環境中,數據的維度可能會達到數十甚至上百的數量級。
目前的常規處理是,以二維表格的形式將數據的各個維度打印在諸如紙張上或者在顯示器上顯示。當數據維度較低(例如,小于5維)時,可以較為方便地以二維表格形式呈現,然而當數據的維度達到一定數量級時,根本不能以常規方式來呈現這些數據。
數據立方體技術是數據處理領域中的一種新型的技術方案,立方體可以以更為直觀的方式存儲和顯示多維數據。該技術方案可以將高維的原始數據轉換為三維數據并進行顯示。目前,如何基于數據立方體技術來以更有效的方式將高維數據轉換為低維數據,并進行可視化顯示已經成為一個研究重點。
盡管目前已經開發出一些基于數據立方體技術來對降低數據維度的技術方案,然而實現這些技術方案的基礎是,假定待處理數據可以全面地反映所在領域的數據分布規律,即,只有當待處理數據能夠展示原始數據在整個樣本空間內的常規分布規律時,才能夠準確地降低這些待處理數據的維度。
然而目前所面臨的問題在于,在許多領域中實現辦公自動化的時間并不長,所采集到的原始數據在數量上并不充分,并且有可能不能夠全面反映該領域中的一般分布規律。例如,僅以電子產品行業為例,電子產品在A國還屬于新興行業,并且根據目前在A國市場中所采集到的數據,客戶可能主要集中在20-40歲的年齡段;然而根據發達國家的統計數據,電子產品的主要客戶可能會集中在例如15-50歲的年齡區間。
應當注意,待處理數據本身會隨著時間而逐漸豐富,并且逐漸趨向于反映數據自身的真實分布規律,如果在初始時基于所采集到的“非典型”數據來開發數據立方體模型,則很可能會因為該數據模型不夠準確等原因,造成該數據模型不再適用于處理未來的數據,甚至造成必須放棄已經付出勞動并重新構造數據模型等不良結果。另一方面,新興行業中的技術人員的專業素質有待提高,無法以有效的方式處理數據。因而,面對從不成熟數據源采集到的并不能準確反映數據的一般分布規律的原始數據,如何以適當方式進行處理成為一項亟待解決的問題。
發明內容
因而,期望開發出一種數據轉換的技術方案,期望該技術方案能夠對來自不成熟數據源的原始數據進行合理處理,進而將該原始數據從復雜的高維數據轉換為較低維度的數據,并且還期望可以以易于識別的方式向用戶呈現該數據的可視化表現。
在本發明的一個實施方式中,提供了一種用于呈現數據的方法,包括:從數據源的第一數據集合獲取第一原始數據、以及轉換自第一原始數據的第一三維數據;提取將第一原始數據轉換為第一三維數據的轉換規則;響應于從數據源的第二數據集合獲取第二原始數據,基于轉換規則將第二原始數據轉換為第二三維數據;以及呈現第二三維數據的可視化表示;其中第一原始數據和第二原始數據的維度大于三維。
在本發明的一個實施方式中,呈現第二三維數據的可視化表示包括:根據第二三維數據的三個維度,將第二三維數據劃分為多個空間;以及在第二三維數據的三個維度中呈現多個空間。
在本發明的一個實施方式中,在第二三維數據的三個維度中呈現多個空間包括:將多個空間之一內的一部分第二三維數據聚類為多個類別;以及在空間內呈現多個類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310104829.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于云端的學習系統及其方法
- 下一篇:一種從文檔集中抽取熱詞短語的方法和裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





