[發明專利]基于微信群信息的數據分析系統在審
| 申請號: | 201810403059.3 | 申請日: | 2018-04-28 |
| 公開(公告)號: | CN108880980A | 公開(公告)日: | 2018-11-23 |
| 發明(設計)人: | 劉春陽;張旭;梁汝鋒;張傳新;劉正陽;李雄;劉巨安;王菲 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心;北京藍光匯智網絡科技有限公司 |
| 主分類號: | H04L12/58 | 分類號: | H04L12/58;H04L12/18;H04L29/08;H04W4/08 |
| 代理公司: | 北京遠大卓悅知識產權代理事務所(普通合伙) 11369 | 代理人: | 史霞 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信群 哈希 數據分析系統 信息采集模塊 消息屬性 預設 直觀 關鍵詞提取模塊 采集 緩存 對象存儲模塊 數據分析模塊 多媒體提取 消息庫模塊 哈希運算 順序采集 消息刪除 消息數據 重復 去重 解析 發送 監測 展示 統計 分析 | ||
1.基于微信群信息的數據分析系統,其特征在于,包括:
信息采集模塊,其每隔預設時間按發送順序采集一批預設數量的微信群消息的html標簽;
數據分析模塊,其將信息采集模塊采集到的html標簽通過正則解析得出其中包含的每條群消息的屬性,所述群消息屬性包括群編號、群消息編號、群消息類型、群消息發送時間和群消息主體,所述數據分析模塊將不同的群消息類型賦予不同的數值;
緩存去重模塊,其將每條群消息屬性包含的群編號和群消息編號進行哈希運算得到哈希值,再將相鄰兩批次中的每條群消息的哈希值對比,若有重復部分,則將后一批次中哈希值重復的群消息刪除;
多媒體提取模塊,其根據群消息類型的數值識別出不同類型的群消息,并將群消息主體中包含多媒體文件鏈接的多媒體文件內容進行下載,再以每條群消息的哈希值為鍵,以每條群消息主體的內容為值生成鍵值對;
對象存儲模塊,其存儲每條群消息的鍵值對;
關鍵詞提取模塊,其對包含文字內容的群消息主體進行關鍵詞提取運算提取出其中的關鍵詞;
群消息庫模塊,其存儲除群消息主體以外的每條群消息的屬性和哈希值,若群消息主體中包含文字內容,所述群消息庫模塊還繼續存儲該群消息的關鍵詞。
2.如權利要求1所述的基于微信群信息的數據分析系統,其特征在于,還包括:
定時請求模塊,其每隔預設時間從群消息庫模塊中獲取所有群消息主體中包含文字內容的群消息的關鍵詞;
垃圾詞庫模塊,其存儲預先設定的垃圾詞或垃圾短語;
分析過濾模塊,其將定時請求模塊中每條群消息主體包含文字內容的群消息的關鍵詞與垃圾詞庫模塊中的垃圾詞或垃圾短語進行對比,若發現關鍵詞中有垃圾詞或垃圾短語,則將關鍵詞中的垃圾詞或垃圾短語進行刪除,保留剩余的關鍵詞。
3.如權利要求2所述的基于微信群信息的數據分析系統,其特征在于,所述群消息屬性還包括群消息發送時間、群消息發送人編號;
群消息統計模塊,其將每日發送的群消息總量進行統計,將每日發送群消息的群消息發送人總量進行統計,將每日發送的群消息的關鍵詞的出現次數進行統計,并篩選出出現次數排名前三的關鍵詞。
4.如權利要求3所述的基于微信群信息的數據分析系統,其特征在于,還包括:
群成員統計模塊,其采集每日發送消息的群消息發送人編號,并統計當日內每位群消息發送人發送群消息的總量。
5.如權利要求3所述的基于微信群信息的數據分析系統,其特征在于,還包括:
群消息統計庫模塊,其存儲群消息統計模塊得到的每日的群消息總量、每日的群消息發送人總量、每日發送的群消息中出現次數排名前三的關鍵詞,所述群消息統計庫模塊的數據保存時間為七天。
6.如權利要求4所述的基于微信群信息的數據分析系統,其特征在于,還包括:
群成員統計庫模塊,其存儲每日所有的群消息發送人編號、當日內每位群消息發送人發送群消息的總量,所述群成員統計庫模塊的數據保存時間為七天。
7.如權利要求1所述的基于微信群信息的數據分析系統,其特征在于,還包括:
全文檢索模塊,其從關鍵詞提取模塊獲取每條包含文字內容的群消息主體的關鍵詞作為相應的群消息的索引。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心;北京藍光匯智網絡科技有限公司,未經國家計算機網絡與信息安全管理中心;北京藍光匯智網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810403059.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:通信控制方法
- 下一篇:一種基于物聯網的智能機器人提醒系統





