[發明專利]一種數據處理方法及裝置有效
| 申請號: | 201710840495.2 | 申請日: | 2017-09-15 |
| 公開(公告)號: | CN110019353B | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 趙健;張珍心 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/2455 | 分類號: | G06F16/2455;G06F16/2457;G06F16/248 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 趙曉榮;王寶筠 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 | ||
本發明公開一種數據處理方法及裝置,其中,所述方法包括:將待劃分區間的t個數據按照大小排序形成數組arr;獲取數組arr的中位數m和t個數據的平均數a;根據m和a將t個數據劃分為N個區間;N個區間包括第一組區間和第二組區間;將數組arr中最小值到a之間的數據進行第一組區間劃分,將a到數組arr中最大值之間的數據進行第二組區間劃分;當a減去m的差值大于第一預定值,第一組區間個數大于第二組區間個數;當m減去a的差值大于第一預定值,第一組區間個數小于第二組區間個數。通過該種數據處理方法進行區間劃分,可以根據數據分布的密度,相應地進行區間劃分,使得所劃分出各個區間的數據量分配均勻。
技術領域
本發明涉及大數據技術領域,尤其涉及一種數據處理方法及裝置。
背景技術
數據可視化主要是借助圖形化手段,清晰有效地傳達與溝通信息。在司法領域,尤其是民事案件中,往往會出現判決金額,而判決金額的判決是否合理是群眾和法官都關心的問題。
針對案件判決金額的數據可視化,某些判決金額細項的金額跨度過大,進行可視化展示的時候,區間劃分成了一個影響展示效果的關鍵因素。
現有技術中,針對數據區間劃分一般包括兩種,一種是固定區間,另一種是不固定區間,下面分別來介紹。
第一種:采取固定區間寬度。
例如,采用固定區間寬度為1000時各個區間為:1-1000,1000-2000,2000-3000等。
第二種:采取不固定區間寬度。
例如,采用不固定區間寬度時各個區間為:1-1000,1000-10000,10000-100000等。
但是,無論采用固定區間寬度還是不固定區間寬度均會出現某一區間的數據數量眾多,而其他區間數據數量較少甚至沒有的情況,這樣將導致最終的圖表展示效果較差。
發明內容
為了解決現有技術中存在的以上技術問題,本發明提供一種數據處理的方法及裝置,能夠對數據進行區間劃分,使劃分出的各個區間中的數據個數分配均勻。
本發明實施例提供了一種數據處理方法,包括:將待劃分區間的t個數據按照大小排序形成數組arr;獲取所述數組arr的中位數m和所述t個數據的平均數a;根據所述m和a將所述t個數據劃分為N個區間;所述N個區間包括第一組區間和第二組區間;將所述數組arr中最小值到a之間的數據進行第一組區間劃分,將a到數組arr中最大值之間的數據進行第二組區間劃分;當所述a減去m的差值大于第一預定值,所述第一組區間個數大于所述第二組區間個數;當所述m減去a的差值大于第一預定值,所述第一組區間個數小于所述第二組區間個數。
優選的,根據權利要求1所述的數據處理方法,還包括:判斷所述a和m差值的絕對值比所述數組arr的最大值小預定數量級,則按照預定區間寬度對所述數組arr進行N個區間平均劃分。
所述按照預定區間寬度對所述數組arr進行N個區間平均劃分,具體可以包括:將所述數組arr中最大值和所述數組arr中最小值的差值除以所述N,將所得的商作為所述預定區間寬度;按照所述預定區間寬度對所述數組arr進行N個區間平均劃分。
根據所述m和a將所述t個數據劃分為N個區間;所述N個區間包括第一組區間和第二組區間;將所述數組arr中最小值到a之間的數據進行第一組區間劃分,將a到數組arr中最大值之間的數據進行第二組區間劃分;具體可以包括:將所述數組arr劃分為兩個區間,所述兩個區間分別為:所述數組arr中最小值到a和a到數組arr中最大值;記錄所述兩個區間中數據個數較少的區間的數據的數目S1;將所述兩個區間中數據個數較多的區間作為新的數組按照對所述數組arr劃分為兩個區間的方式進行再次劃分,獲得新的數組劃分的兩個區間的數據的數目分別為S2和S3;將所述S1、S2和S3最大數目對應的區間作為新的數組繼續劃分,以此類推,直到劃分的區間的個數為N。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710840495.2/2.html,轉載請聲明來源鉆瓜專利網。





