[發(fā)明專利]一種基于海量數(shù)據(jù)的位置信息提取方法和裝置在審
| 申請?zhí)枺?/td> | 201611145679.9 | 申請日: | 2016-12-13 | 
| 公開(公告)號: | CN108614835A | 公開(公告)日: | 2018-10-02 | 
| 發(fā)明(設(shè)計)人: | 蘭燁;劉立蘭;王濤;劉卓;王海磊;王正偉;王會娟;田川;焦林 | 申請(專利權(quán))人: | 北京銳安科技有限公司 | 
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 | 
| 代理公司: | 北京君尚知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11200 | 代理人: | 司立彬 | 
| 地址: | 100192 北京市海*** | 國省代碼: | 北京;11 | 
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關(guān)鍵詞: | 原始數(shù)據(jù) 位置信息提取 方法和裝置 海量數(shù)據(jù) 提取規(guī)則 字段 規(guī)則數(shù)據(jù)庫 全文數(shù)據(jù)庫 提取位置 應(yīng)用信息 用戶代理 有效數(shù)據(jù) 網(wǎng)民 網(wǎng)站 存儲 查詢 民警 監(jiān)督 | ||
1.一種基于海量數(shù)據(jù)的位置信息提取方法,其步驟為:
1)從全文數(shù)據(jù)庫系統(tǒng)中提取原始數(shù)據(jù),并從提取的原始數(shù)據(jù)中提取公共字段和用戶代理User-Agent內(nèi)容;
2)根據(jù)所述User-Agent內(nèi)容中的應(yīng)用信息在預先設(shè)定的規(guī)則數(shù)據(jù)庫中查詢對應(yīng)的提取規(guī)則,然后根據(jù)所述提取規(guī)則從所述原始數(shù)據(jù)中提取位置信息;
3)將每一原始數(shù)據(jù)的所述位置信息與所述公共字段作為一有效數(shù)據(jù)進行存儲。
2.如權(quán)利要求1所述的方法,其特征在于,根據(jù)所述User-Agent內(nèi)容中的應(yīng)用信息計算出提取規(guī)則編號;然后在預先設(shè)定的規(guī)則數(shù)據(jù)庫中提取該提取規(guī)則編號對應(yīng)的提取規(guī)則。
3.如權(quán)利要求2所述的方法,其特征在于,原始數(shù)據(jù)中的每一記錄對應(yīng)一提取規(guī)則,記錄與提取規(guī)則之間通過編號對應(yīng)。
4.如權(quán)利要求1或2或3所述的方法,其特征在于,當所述預先設(shè)定的規(guī)則數(shù)據(jù)庫中不包含與所述應(yīng)用信息對應(yīng)的提取規(guī)則時,使用公知通用規(guī)則從所述原始數(shù)據(jù)中提取位置信息。
5.如權(quán)利要求1或2或3所述的方法,其特征在于,將所述位置信息與所述公共字段以數(shù)組的形式合并為一對多有效數(shù)據(jù);所述公共字段包括:數(shù)據(jù)ID、設(shè)備ID、目的端口和時間戳。
6.一種基于海量數(shù)據(jù)的位置信息提取裝置,其特征在于,包括原始數(shù)據(jù)提取模塊,用于從全文數(shù)據(jù)庫系統(tǒng)中提取原始數(shù)據(jù);應(yīng)用信息獲取模塊,用于從提取的原始數(shù)據(jù)中提取公共字段和用戶代理User-Agent內(nèi)容,并從所述User-Agent內(nèi)容獲取應(yīng)用信息;位置信息提取模塊,用于根據(jù)所述應(yīng)用信息在預先設(shè)定的規(guī)則數(shù)據(jù)庫中提取與所述應(yīng)用信息對應(yīng)的提取規(guī)則,并根據(jù)所述提取規(guī)則從所述原始數(shù)據(jù)中提取位置信息;有效數(shù)據(jù)合并模塊,用于將所述位置信息與所述公共字段合并為有效數(shù)據(jù)。
7.如權(quán)利要求6所述的裝置,其特征在于,所述應(yīng)用信息獲取模塊根據(jù)所述User-Agent內(nèi)容中的應(yīng)用信息計算出提取規(guī)則編號;然后在預先設(shè)定的規(guī)則數(shù)據(jù)庫中提取該提取規(guī)則編號對應(yīng)的提取規(guī)則。
8.如權(quán)利要求6或7所述的裝置,其特征在于,原始數(shù)據(jù)中的每一記錄對應(yīng)一提取規(guī)則,記錄與提取規(guī)則之間通過編號對應(yīng)。
9.如權(quán)利要求6或7所述的裝置,其特征在于,當所述預先設(shè)定的規(guī)則數(shù)據(jù)庫中不包含與所述應(yīng)用信息對應(yīng)的提取規(guī)則時,所述位置信息提取模塊使用公知通用規(guī)則從所述原始數(shù)據(jù)中提取位置信息。
10.如權(quán)利要求6或7所述的裝置,其特征在于,所述有效數(shù)據(jù)合并模塊將所述位置信息與所述公共字段以數(shù)組的形式合并為一對多有效數(shù)據(jù);所述公共字段包括:數(shù)據(jù)ID、設(shè)備ID、目的端口和時間戳。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京銳安科技有限公司,未經(jīng)北京銳安科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611145679.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 原始數(shù)據(jù)處理裝置、原始數(shù)據(jù)處理方法和成像設(shè)備
 - 信息監(jiān)控方法及裝置
 - 一種數(shù)據(jù)存儲方法、數(shù)據(jù)查詢方法及相關(guān)設(shè)備
 - 醫(yī)學圖像處理系統(tǒng)及其數(shù)據(jù)管理方法
 - 一種用于IT系統(tǒng)運維監(jiān)控數(shù)據(jù)的存儲系統(tǒng)
 - 使用復合數(shù)據(jù)類型顯示數(shù)據(jù)的裝置、方法及存儲介質(zhì)
 - 基于加密算法的模型構(gòu)建方法及相關(guān)設(shè)備
 - 一種數(shù)據(jù)處理系統(tǒng)、方法、電子設(shè)備及存儲介質(zhì)
 - 一種數(shù)據(jù)生成方法、裝置和用于數(shù)據(jù)生成的裝置
 - 一種知識產(chǎn)權(quán)圖形識別中增強分類模型抗背景變化能力的方法
 
- 功能命令系統(tǒng)、功能命令裝置、功能命令分析系統(tǒng)、演示系統(tǒng)及計算機可讀介質(zhì)
 - 導航設(shè)備和評估值設(shè)置方法
 - 圖像處理裝置、圖像處理方法、圖像處理程序和圖像處理系統(tǒng)
 - 通知裝置、通知系統(tǒng)、通知裝置的控制方法、控制程序以及存儲有該程序的計算機可讀取存儲介質(zhì)
 - 一種行車環(huán)境特征目標信息提取方法
 - 信息顯示方法及其顯示系統(tǒng)
 - 基于人工智能的車牌識別方法、裝置、設(shè)備及介質(zhì)
 - 一種信息提取方法、裝置及系統(tǒng)
 - 基于RPA及AI的信息提取方法、裝置、設(shè)備及介質(zhì)
 - 一種面向文本的相對位置信息提取方法
 
- 一種數(shù)據(jù)庫海量數(shù)據(jù)比對的方法
 - 基于云計算的海量數(shù)據(jù)訪問處理系統(tǒng)
 - 一種海量矢量切片數(shù)據(jù)云存儲方法及系統(tǒng)
 - 一種海量數(shù)據(jù)的清洗方法和系統(tǒng)
 - 一種多源海量數(shù)據(jù)處理系統(tǒng)及方法
 - 快速實現(xiàn)海量數(shù)據(jù)準實時全量統(tǒng)計的方法、裝置及系統(tǒng)
 - 一種海量數(shù)據(jù)分析系統(tǒng)及方法
 - 一種海量點數(shù)據(jù)聚合渲染方法、裝置、設(shè)備及存儲介質(zhì)
 - 一種海量不確定XML數(shù)據(jù)存儲方法
 - 一種海量并發(fā)性雷達數(shù)據(jù)存儲方法
 





