[發明專利]一種網絡信息采集方法在審
| 申請號: | 201711308167.4 | 申請日: | 2017-12-11 |
| 公開(公告)號: | CN110020160A | 公開(公告)日: | 2019-07-16 |
| 發明(設計)人: | 王雅文 | 申請(專利權)人: | 鎮江共遠軟件開發有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 212000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡信息 判斷模塊 網絡賬號 篩選 數據存儲模塊 網絡信息采集 網絡信息技術 關聯 關鍵詞查找 關注信息 實時性 存儲 查找 | ||
1.一種網絡信息采集方法,其特征在于,采用一個判斷模塊對多個網絡賬號進行篩選,隨后采用所述判斷模塊對被篩選出的所述網絡賬號所關聯的網絡信息進行篩選;
采用一個數據存儲模塊存儲被篩選出的所述網絡賬號以及所關聯的所述網絡信息;
所述判斷模塊與所述數據存儲模塊連接,;
所述網絡信息采集方法具體包括:
步驟1,獲取多個網絡賬號,以作為所述關注賬號并保存;
步驟2,獲取多個所述關注賬號所發布的多條所述網絡信息,以作為所述關注信息并保存;
步驟3,返回本次信息獲取的所述網絡信息的發布序號的最大值,并作為最大序號信息,并保存;
步驟4,經過一預設的第一時間間隔后,返回所述步驟1。
2.如權利要求1所述的網絡信息采集方法,其特征在于,在所述數據存儲模塊內設置多個第一存儲空間;采用所述判斷模塊對多個所述網絡賬號進行篩選,并以被篩選出的所述網絡賬號作為關注賬號;
每個所述第一存儲空間用于保存一個所述關注賬號。
3.如權利要求2所述的網絡信息采集方法,其特征在于,所述步驟1中,將多個所述關注賬號所關聯的所述網絡賬號作為所述關注賬號,并保存入所述第一存儲空間內。
4.如權利要求3所述的網絡信息采集方法,其特征在于,在所述數據存儲模塊內設置多個第二存儲空間,采用所述判斷模塊對多個所述關注賬號所關聯的多條所述網絡信息進行篩選,并以被篩選出的所述網絡信息作為關注信息;
每個所述第二存儲空間包括多個獨立的存儲塊,每個所述存儲塊用于保存一個所述關注信息;每個所述第二存儲空間對應一個所述第一存儲空間。
5.如權利要求4所述的網絡信息采集方法,其特征在于,采用一個刪除模塊去除保存于多個所述第一存儲空間中的所述關注賬號;
所述刪除模塊連接所述數據存儲模塊;
若所述關注賬號超過一預設的第二時間間隔未發布所述網絡信息,則將所述關注賬號從所述第一存儲空間中去除。
6.如權利要求3所述的網絡信息采集方法,其特征在于,所述步驟1中,獲取多個網絡賬號,以作為所述關注賬號并保存的具體步驟包括:
步驟11,獲取每個所述網絡賬號已經發布的所述網絡信息;
步驟12,將每條所述網絡信息與多個預設的關鍵詞信息進行匹配;
若匹配成功,則轉至步驟13;
若匹配失敗,則退出;
步驟13,判斷匹配成功的所述網絡信息的出現頻率;
若一個所述網絡賬號中,匹配成功的所述網絡信息出現的頻率大于一預設的頻率時,則將所述網絡賬號作為所述關注賬號并保存入所述第一存儲空間中;隨后轉至步驟14;
若一個所述網絡賬號中,匹配成功的所述網絡信息出現的頻率小于一預設的頻率時,則退出;
步驟14,將多個所述關注賬號所關聯的所述網絡賬號作為所述關注賬號,并保存入所述第一存儲空間中。
7.如權利要求6所述的網絡信息采集方法,其特征在于,在所述數據存儲模塊中設置多個第三存儲空間,每個所述第三存儲空間中保存有一個所述預設的關鍵詞信息。
8.如權利要求7所述的網絡信息采集方法,其特征在于,所述步驟2中,獲取多個所述關注賬號所發布的多條所述網絡信息,以作為所述關注信息并保存的具體步驟包括:
步驟21,獲取每個所述關注賬號發布的所述網絡信息;
步驟22,獲取每條所述網絡信息的發布序號,并根據所述發布序號判斷所述網絡信息是否已經被獲取;
若所述網絡信息已經被獲取,則退出;
若所述網絡信息未被獲取,則轉至步驟b3;
步驟23,以多個所述預設的關鍵詞信息對所述網絡信息進行匹配;
若匹配成功,則轉至步驟24;
若匹配不成功,則退出;
步驟24,將所述網絡信息作為所述關注信息并保存入所述第二存儲空間內。
9.如權利要求8所述的網絡信息采集方法,其特征在于,所述步驟22中,根據所述發布序號判斷所述網絡信息是否曾經被獲取的過程具體包括:
將每個所述發布序號與上一次信息獲取的所述最大序號信息進行匹配;
若所述發布序號大于所述最大序號信息,則判斷所述網絡信息未被獲取;
若所述發布序號小于所述最大序號信息,則判斷所述網絡信息已經被獲取。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鎮江共遠軟件開發有限公司,未經鎮江共遠軟件開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711308167.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于數據特征的輿情分析方法和系統
- 下一篇:數據處理方法、日志處理方法和終端





