[發明專利]一種電信運營商用戶號碼采集的方法有效
| 申請號: | 200610116140.0 | 申請日: | 2006-09-18 |
| 公開(公告)號: | CN101150822A | 公開(公告)日: | 2008-03-26 |
| 發明(設計)人: | 蔣乃華;劉偉;施洋 | 申請(專利權)人: | 上海欣泰通信技術有限公司 |
| 主分類號: | H04Q7/34 | 分類號: | H04Q7/34;H04B17/00;H04L12/26 |
| 代理公司: | 上海申匯專利代理有限公司 | 代理人: | 翁若瑩 |
| 地址: | 200437上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電信 運營商 用戶 號碼 采集 方法 | ||
技術領域
本發明涉及一種電信運營商用戶號碼采集的方法,該方法涉及電信運營商獲取異網用戶數據和本網用戶流失信息的一種手段,從中獲取不同電信運營商的用戶號碼,并根據最后使用的時間,判斷用戶是否在網的方法,特別適合于分析各個電信運營商的用戶數量,并能記錄號碼信息的動態變化過程,屬于電通信技術領域。
背景技術
對電信運營商而言,用戶號碼是其最寶貴的資源之一,由于目前各個運營商間相對獨立和市場競爭,各自的號碼資源不能充分共享,這樣不利于充分利用號碼資源,也不利于監管機構對電信運營商的監管。
目前獲取號碼資源的方法是從電信運營商的號碼資源庫中讀取記錄,這種方式注重了本運營商的號碼占用情況,對其他運營商的號碼占用情況了解不多,在競爭過程中處于不利地位,不能有針對性的提高用戶服務質量,擴大用戶群。
采集用戶號碼,一般需要區分本地網和運營商,并記錄每天各自的新增用戶、退網用戶即超過三個月未使用的號碼、總用戶數,以及對應的用戶號碼列表。要得到這些數據,就需要記錄每個本地網及運營商所有號碼、號碼最先出現日期,用于分析每天新增用戶、最后出現日期,用于分析退網用戶。
一般處理系統對于數據的比較分析都在計算機內存中進行,處理過程方便快捷。但用戶號碼是海量數據,例如,一個具有一億號碼的大本地網,如果將號碼排序置入內存中進行,以平均每個號碼占10字節計算,就需要大約1G內存,再加上與號碼相關的信息,總體需要約3G大小的內存,這超出了目前32位計算機的處理能力,如果監測范圍有多個本地網,則占用的內存空間還需更大。
發明內容
本發明的目的是提供一種能夠提高分析效率、運行在普通32位PC機上的電信運營商用戶號碼采集的方法。
為實現以上目的,本發明的技術方案是提供一種電信運營商用戶號碼采集的方法,其特征在于,利用散列文件記錄號碼的信息,通過對散列文件的分析,得出各運營商的用戶號碼信息,其方法為:
步驟1:初始化散列文件
在監測范圍內,根據號碼的本地網和運營商從已建立的七號信令監測系統獲取呼叫記錄,以號碼的后六位數字作為散列鍵,組合生成一批散列文件,每個散列文件每行固定字節數,為200字節,共1000000行,每行的行號就是號碼的后六位數字,再生成一個空的溢出文件;
步驟2:分析呼叫記錄,提取呼叫中的主被叫信息
等待從七號信令監測系統中獲取呼叫記錄,并根據呼叫記錄的有效性,提取有效呼叫記錄中的主被叫號碼,并分析其所在本地網和所屬運營商,查找、修改或創建號碼散列文件中的數據;
根據號碼的本地網和運營商,找到所屬散列文件,取號碼的后6位,組成一個整數,作為散列文件的檢索索引,不足6位,就以該號碼對應的整數作為號碼散列文件的檢索索引,即:
首先,對號碼散列文件讀取指針進行偏移,偏移量為檢索索引×每行字節數;然后,讀取該行數據,根據分隔符的位置,判斷是否有對應用戶號碼,如果有對應的用戶號碼,修改該號碼的最后出現日期,如果沒有對應用戶號碼,在分隔符后添加該號碼,并注明第一次出現日期和最后出現日期;步驟3:重復步驟1、2直至軟件退出或呼叫記錄處理完畢;
步驟4:處理散列文件
以定時處理或按需處理的方式,讀取號碼散列文件,根據每個號碼的第一次出現日期和最后出現日期得出每天的新增用戶和退網用戶。
目前,各地主要運營商均建立了七號信令監測系統,該系統的一個重要作用是產生監測范圍內的所有呼叫記錄。本發明就是從七號信令監測系統獲取呼叫記錄,從中提取用戶號碼,并利用散列文件記錄號碼的相關信息,通過對散列文件的分析,得出各運營商的用戶號碼信息。
為了克服分析海量號碼帶來的計算機內存問題,又能提高分析速度,本發明利用散列文件方式進行號碼處理,以號碼的后六位數字作為散列鍵,建立一個ASCII文件即稱為散列文件,該方法首先按本地網和運營商的組合,建立一批散列文件,每個散列文件每行固定字節數,通常為200字節,共1000000行,每行的行號就是號碼的后六位數字。整個文件的大小通常約200M,這樣每行可以記錄6個號碼的信息,文件大小合適便于讀取,且不會造成太多的存儲空間浪費,另外,為了防止一行不夠記錄所有相同散列鍵的號碼即稱為溢出,還需生成一個溢出文件,溢出文件每行的格式與散列文件相同,但行數按需生成,按照現有的一個省網的號碼量計算,溢出總行數不會超過一千萬行,即總大小不會超過2G,在目前32位計算機的處理能力之內。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海欣泰通信技術有限公司,未經上海欣泰通信技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610116140.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:含貝類燒結粉末的乳霜及其制備方法
- 下一篇:協議適配器動態裝載的系統與方法





