[發明專利]一種樣本屬性的動態分布數據獲取方法及系統有效
| 申請號: | 201310351587.6 | 申請日: | 2013-08-13 |
| 公開(公告)號: | CN104133824A | 公開(公告)日: | 2014-11-05 |
| 發明(設計)人: | 張尚良;王旭新 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 唐華明 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 樣本 屬性 動態 分布 數據 獲取 方法 系統 | ||
技術領域
本發明涉及數據處理技術領域,更具體地說,涉及一種樣本屬性的動態分布數據獲取方法及系統。
背景技術
樣本屬性是指樣本中具有統計價值且處于動態變化的屬性,樣本屬性可以如用戶手機的流量,農林養殖中的樣本(樣本可如雞、鴨、豬等家禽)體重,游戲中玩家的戰斗力等;對應的樣本則為用戶手機,農林養殖中的樣本,游戲中的玩家等。目前,當存在大規模的樣本時,獲取大規模樣本的樣本屬性的動態分布數據成為一個困擾技術人員的問題,樣本屬性的動態分布數據是指大規模樣本中各樣本的樣本屬性的動態分布情況,比如某一區域(如某市,某基站)內的用戶手機的流量使用情況,某一游戲中的玩家的戰斗力分布情況等。通過獲取樣本屬性的動態分布數據,可以直觀的了解大規模樣本中的樣本狀況,比如通過獲取某一區域內的用戶手機的使用流量,可以直觀的了解該區域內各用戶手機的流量使用情況,從而為該區域內的基站建設、信道優化提供指導意見等;又如通過獲取農林養殖中的家禽的體重,可以直觀的了解所養家禽的體重情況,從而進行養殖策略的調整等。
目前,大規模樣本中各樣本的樣本屬性一般會定期更新后存儲在數據庫中,為獲取樣本屬性的動態分布數據,服務器一般會定時遍歷數據庫,讀取數據庫中所有樣本的樣本屬性,從而整理得到大規模樣本的樣本屬性的動態分布數據。本發明的發明人在研究和實踐過程中發現,現有技術至少存在以下的技術問題:現有技術需要遍歷數據庫,讀取數據庫中所有樣本的樣本屬性才能得到樣本屬性的動態分布數據,所需要的計算量較大,樣本屬性的動態分布數據的獲取較為費時。
發明內容
有鑒于此,本發明實施例提供一種樣本屬性的動態分布數據獲取方法及系統,以解決現有樣本屬性的動態分布數據的獲取方式的計算量較大,較為費時的問題。
為實現上述目的,本發明實施例提供如下技術方案:
一種樣本屬性的動態分布數據獲取方法,包括:
獲取大規模樣本中的任一樣本的樣本屬性;
確定所獲取的樣本屬性在預先維持的樣本屬性隊列中的更新位置,在所述更新位置上更新入所獲取的樣本屬性;
保持所述樣本屬性隊列中的樣本屬性的有序排列,得到樣本屬性的動態分布數據;
其中,所述樣本屬性隊列中存儲有所述大規模樣本中的樣本的樣本屬性,樣本屬性在所述樣本屬性隊列中有序的排列,所述樣本屬性隊列的長度為設定數值N,N小于所述大規模樣本中的總樣本數。
其中,所述確定所獲取的樣本屬性在預先維持的樣本屬性隊列中的更新位置包括:
判斷所獲取的樣本屬性對應的樣本與所述樣本屬性隊列所對應的樣本是否相匹配;
若所獲取的樣本屬性對應的樣本與所述樣本屬性隊列所對應的樣本相匹配,則確定所述樣本屬性隊列中與所獲取的樣本屬性對應的樣本的位置為所述更新位置;
若所獲取的樣本屬性對應的樣本與所述樣本屬性隊列所對應的樣本不相匹配,則根據所獲取的樣本屬性的大小與所述樣本屬性隊列中存儲的樣本屬性的大小確定更新位置。
其中,在所獲取的樣本屬性對應的樣本與所述樣本屬性隊列所對應的樣本相匹配時,所述在所述更新位置上更新入所獲取的樣本屬性包括:
將所述樣本屬性隊列中與所獲取的樣本屬性對應的樣本的位置上的樣本屬性替換為所獲取的樣本屬性;
所述保持所述樣本屬性隊列中的樣本屬性的有序排列包括:
根據所述更新位置上所更新的樣本屬性,調整所述樣本屬性隊列中樣本屬性的排列順序,以保持所述樣本屬性隊列中的樣本屬性的有序排列。
其中,所述根據所獲取的樣本屬性的大小與所述樣本屬性隊列中存儲的樣本屬性的大小確定更新位置包括:
判斷所述樣本屬性隊列的長度是否達到設定數值N;
若所述樣本屬性隊列的長度達到設定數值N,且所獲取的樣本屬性介于所述樣本屬性隊列中存儲的樣本屬性的最大值和最小值之間,確定所述樣本屬性隊列中樣本屬性小于所獲取的樣本屬性的最大樣本屬性,及樣本屬性不小于所獲取的樣本屬性的最小樣本屬性,等概率隨機的將所述最大樣本屬性或最小樣本屬性對應的位置確定為所述更新位置;
若所述樣本屬性隊列的長度達到設定數值N,且所獲取的樣本屬性小于所述樣本屬性隊列中存儲的樣本屬性的最小值,則等概率隨機的將所述最小值的位置確定為所述更新位置或剔除所獲取的樣本屬性;
若所述樣本屬性隊列的長度達到設定數值N,且所獲取的樣本屬性大于所述樣本屬性隊列中存儲的樣本屬性的最大值,則等概率隨機的將所述最大值的位置確定為所述更新位置或剔除所獲取的樣本屬性;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310351587.6/2.html,轉載請聲明來源鉆瓜專利網。





