[發明專利]大數據的非精準排序方法在審
| 申請號: | 201810192740.8 | 申請日: | 2018-03-09 |
| 公開(公告)號: | CN108416025A | 公開(公告)日: | 2018-08-17 |
| 發明(設計)人: | 李凌瑤;張業嶺;蔣可安;張菁菁;王寧駿;胡天然 | 申請(專利權)人: | 王寧駿;張菁菁;胡天然;張業嶺;蔣可安;李凌瑤 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海驍象知識產權代理有限公司 31315 | 代理人: | 林煒 |
| 地址: | 200233 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數組 樣本 目標數據庫 頻數 排序 目標數據 大數據 構建 海量數據檢索 數據處理技術 計算目標 排列位置 排序結果 排序位置 數組記錄 參考 段數據 截取 查詢 場景 檢測 優化 | ||
1.一種大數據的非精準排序方法,其特征在于,具體步驟如下:
1)從目標數據庫中隨機截取一段包含有N個數據的數據樣本Y,并設定一個計算精度α,1E+8<N<1E+10,1E-6≤α≤1E-4;
2)令m等于1/α的整數部分;
3)構建一個m維的樣本值數組Lv,為樣本值數組Lv中的每個元素賦值,賦值計算公式為:
Lv(i)=Vmin+i×(Vmax-Vmin)/m
其中,Lv(i)為樣本值數組Lv中的第i個元素,Vmax為數據樣本Y中的數據最大值,Vmin為數據樣本Y中的數據最小值,0<i≤m;
4)構建一個m維的樣本頻數數組Ln,為樣本頻數數組Ln中的每個元素賦值,賦值方法為:統計數據樣本Y中的大于Lv(i)并且小于Lv(i+1)的數據的數量,并將統計的數量值賦給Ln(i);
其中,Ln(i)為樣本頻數數組Ln中的第i個元素,Lv(i)為樣本值數組Lv中的第i個元素,Lv(i+1)為Lv(i)后序相鄰的元素;
5)按照規則A、規則B優化樣本值數組Lv及樣本頻數數組Ln,直到樣本頻數數組Ln中的所有元素都不滿足規則A,并且也不滿足規則B;
規則A:對于樣本頻數數組Ln中的任意一個元素Ln(i),如果Ln(i)<η×N/m,則令令N=N-Ln(i)/2,令m=m-1,并刪除樣本值數組Lv中的第i個元素Lv(i),并刪除樣本頻數數組Ln中的第i個元素Ln(i),η的取值為0.1;
規則B:對于樣本頻數數組Ln中的任意一個元素Ln(i),如果Ln(i)>λ×N/m,則在樣本值數組Lv的第i個元素Lv(i)及第i+1個元素Lv(i+1)之間插入T個元素,在樣本頻數數組Ln的第i個元素Ln(i)及第i+1個元素Ln(i+1)之間插入T個元素,并為樣本值數組Lv中所插入的T個元素賦值,為樣本頻數數組Ln中所插入的T個元素賦值,并令m=m+T;其中,λ的取值為10;
樣本值數組Lv中所插入的T個元素的賦值公式為:
Lv'(i+t)=Lv(i)+(Lv(i+1)-Lv(i))/T
其中,Lv'(i+t)為插入樣本值數組Lv中的第t個元素,Lv(i)、Lv(i+1)分別是未插入T個元素時的樣本值數組Lv中的第i個元素、第i+1個元素;
樣本頻數數組Ln中所插入的T個元素的賦值方法為:統計數據樣本Y中的大于Lv'(i+t)并且小于Lv'(i+t+1)的數據的數量,并將統計的數量值賦給Ln'(i+t);
其中,Ln'(i+t)為插入樣本頻數數組Ln中的第t個元素,Lv'(i+t)為插入樣本值數組Lv中的第t個元素,Lv'(i+t+1)為Lv'(i+t)后序相鄰的元素;
6)構建一個m維的累計值數組ALn,為累計值數組ALn中的每個元素賦值,賦值計算公式為:
其中,ALn(i)為累計值數組ALn中的第i個元素;
7)獲取待排序的目標數據Y(k),在樣本值數組Lv中查找滿足條件Lv(i)<Y(k)<Lv(i+1)的兩個相鄰元素Lv(i)、Lv(i+1),再根據所找到的元素Lv(i)在樣本值數組Lv中的位置i,從累計值數組ALn中找到處于位置i處的元素ALn(i),再根據所找到的元素ALn(i),計算目標數據Y(k)在目標數據庫中的排序百分比值,從而得出目標數據Y(k)在目標數據庫中的排序位置,排序百分比值的具體計算公式為:
Res(k)=100×ALn(i)/N
其中,Res(k)為目標數據Y(k)在目標數據庫中的排序百分比值。
2.根據權利要求1所述的大數據的非精準排序方法,其特征在于:α的取值為1E-5。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于王寧駿;張菁菁;胡天然;張業嶺;蔣可安;李凌瑤,未經王寧駿;張菁菁;胡天然;張業嶺;蔣可安;李凌瑤許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810192740.8/1.html,轉載請聲明來源鉆瓜專利網。





