[發明專利]一種業務變量的數值的分段方法及裝置有效
| 申請號: | 201610289143.8 | 申請日: | 2016-05-04 |
| 公開(公告)號: | CN107346367B | 公開(公告)日: | 2020-09-18 |
| 發明(設計)人: | 邵明旭;潘浩源;錢劭立 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 黨曉林;李輝 |
| 地址: | 英屬開曼*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 業務 變量 數值 分段 方法 裝置 | ||
本申請涉及數據分析技術領域,特別涉及一種業務變量的數值的分段方法及裝置。其中方法包括對業務變量的各個數值排序形成數值隊列,并對所述數值隊列進行初始分段;計算每個初始分段中數值的集中程度;嘗試合并相鄰分段,計算新分段中數值的集中程度,若該集中程度符合預定條件,則形成新的分段結果;輸出所述新的分段結果。通過本申請實施例的方案,可以動態的對網絡中以連續變量形式發生的業務進行分段,該動態分段后的枚舉變量可以更加準確的分析出出現異常的原因,而且由于本申請的分段手段可以大量的減少分段數量,從而減少消耗的系統資源。
技術領域
本申請涉及數據分析技術領域,特別涉及一種業務變量的數值的分段方法及裝置。
背景技術
隨著互聯網的發展,網絡中的謠言、不利輿論可能會對互聯網公司的形象造成負面影響,從而會影響互聯網公司發布的產品,并且造成損失。以往商業智能軟件(BI)分析筆數類信息時,是根據經驗來進行分段,以支付寶中對”我要付款”業務進行舉例來說,現有技術中對用戶當天累計筆數的信息根據經驗來進行分段,一天之內進行“我要付款”業務的次數=3筆時是正常用戶,3-5筆的為高頻用戶,5筆的為當日異常用戶。現有技術中的上述分析監控可能會存在以下問題,盡管該方法能對數值型變量進行分段,但是忽略了數值分布的集中性,并且主要以經驗進行分段,認為參與過多,針對實時變化的業務可能產生滯后或者不合理的情況,不能夠動態的調整分段。
發明內容
為了解決現有技術中對于連續出現的業務或者事件不能夠動態的分段,并且現有的分段算法不能表達出事件出現的集中程度,因此本申請的發明人提供了一種業務變量的數值的分段方法及裝置,針對連續出現的業務或者事件可以動態的分段,并且能夠根據業務或者事件出現的集中程度進行分段,可以更加準確的分析出連續出現的業務或者事件出現異常的原因,而且由于本申請的分段手段可以大量的減少分段數量,從而減少消耗的系統資源。
本申請實施例提供了一種業務變量的數值的分段方法,包括:
對業務變量的各個數值排序形成數值隊列,并對所述數值隊列進行初始分段;
計算每個初始分段中數值的集中程度;
嘗試合并相鄰分段,計算新分段中數值的集中程度,若該集中程度符合預定條件,則形成新的分段結果;
輸出所述新的分段結果。
本申請實施例還提供了一種業務變量的數值的分段裝置,包括:
初始分段單元,用于對業務變量的各個數值排序形成數值隊列,并對所述數值隊列進行初始分段;
計算單元,用于計算每個初始分段中數值的集中程度;
處理單元,用于嘗試合并相鄰分段,計算新分段中數值的集中程度,若該集中程度符合預定條件,則形成新的分段結果;
輸出單元,用于輸出所述新的分段結果。
由以上本申請實施例提供的技術方案可見,可以動態的對網絡中以連續變量形式發生的事件或者業務進行分段,該動態分段后的枚舉變量可以更加準確的分析出出現異常的原因,而且由于本申請的分段手段可以大量的減少分段數量,從而減少消耗的系統資源。
當然實施本申請的任一產品或者方法必不一定需要同時達到以上所述的所有優點。
附圖說明
為了更清楚地說明本申請實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請中記載的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1所示為本申請實施例一種業務變量的數值的分段方法的流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610289143.8/2.html,轉載請聲明來源鉆瓜專利網。





