[發明專利]一種微信數據獲取方法和系統有效
| 申請號: | 201510363826.9 | 申請日: | 2015-06-26 |
| 公開(公告)號: | CN105162676B | 公開(公告)日: | 2017-08-11 |
| 發明(設計)人: | 沙灜;包秀國;程工;陳學敏;賀敏;梁棋;馬宏遠;王卿;龐琳;李雄;劉瑋 | 申請(專利權)人: | 中國科學院信息工程研究所;國家計算機網絡與信息安全管理中心 |
| 主分類號: | H04L12/58 | 分類號: | H04L12/58;H04L29/08 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙)11200 | 代理人: | 馮藝東 |
| 地址: | 100093 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 獲取 方法 系統 | ||
技術領域
本發明涉及社交網絡數據采集領域,涉及一種微信數據獲取方法和系統,具體涉及基于安卓平臺應用測試組件和瀏覽器測試組件相結合的微信數據獲取方法和系統。
背景技術
據統計,中國手機用戶超過9億,截至2011年12月底,中國網民規模達到3.56億,智能手機網民達1.9億,同時隨著3G時代的到來和智能手機的普及,使用智能手機上網的用戶數量呈現出超過使用電腦上網的用戶數量的明顯趨勢。結合快速的3G/4G網絡,手機具有高速度、多媒體、個性化的特點,成為人們隨身攜帶便于溝通的交互式工具。
Web2.0技術下的信息傳播由于網絡的聚合作用而大大加強,促進了新的媒介生態環境的出現。媒體信息也從傳統平臺轉戰新媒體,媒體信息發布者對網絡和手機的利用也無所不用其極,手機短信、手機微博等媒體信息處處可見。基于手機即時通訊(IM)的媒體信息傳播還處于起步發展階段,但是已經被諸多媒體以及組織個人等關注。
2011年1月21日,騰訊正式推出基于QQ用戶的微信。這款通過網絡快速發送語音短信、視頻、圖片和文字,支持多人群聊的手機聊天軟件,使用戶可以通過微信與好友進行形式上更加豐富的類似于短信、彩信等方式的聯系。微信可以說是介于手機QQ和微博之間的第三種社交關系,它正在改變著人們的社交生活方式。在累計經過40多個版本升級后,微信自身形成了一個三維溝通矩陣:X坐標是語音、文字、圖片、視頻;Y坐標是手機通訊錄、智能手機客戶端、QQ、微博、郵箱;Z坐標是LBS定位、漂流瓶、搖一搖、二維碼識別。縱橫交錯立體化的社交鏈,覆蓋了工作、生活的多層次需求面,并且在這個三維空間里,各溝通鏈條完全交叉、各平臺互通共享,這是其他IM工具所無法比擬的。
現在面向微信平臺的數據獲取技術主要有:(1)人工破解客戶端,包括通信協議破解,能夠快速獲取數據,但是同時客戶端破解需要較強的逆向工程技術,同時伴隨微信版本升級,其安全機制不斷升級,存在失效的可能性。破解難度較大,成本過高。(2)Web協議模擬,通過抓包等方式分析網頁版微信的通信協議,通過協議模擬達到數據獲取的目的,但是從長期實用角度考慮,伴隨微信版本升級,存在協議升級改動,協議模擬失效的可能性,長期維護投入成本較大。同時,此方法無法避開人工二維碼掃描登陸,在大規模數據采集環境下,需要額外頻繁的人工開銷。
由于傳統的對社交網絡數據獲取的技術主要是面向PC端社交網絡媒體的數據采集,而微信僅提供移動設備平臺的客戶端和包含基本聊天功能的web方式(其中macOSX平臺微信客戶端為web方式封裝,功能僅包括基本聊天功能),所以對于用戶歷史消息和資料等信息以及長遠考慮更多的消息的獲取只能從微信移動設備端出發。
綜上,微信由于其安全機制及其本身生態圈的封閉性,對于微信客戶端的破解或通信協議的破解成本投入過大且伴隨版本升級破解成果難以確保長久有效。
發明內容
為了實現面向微信平臺的數據獲取,同時保證其數據的相對完整性以及即時性,此外考慮到避免純網頁版獲取方式的人工操作,本發明提出了一種微信數據獲取方法和系統,通過安卓平臺應用測試組件和瀏覽器測試組件相結合來實現。
需要說明的是,安卓平臺應用測試組件最初是面向安卓平臺app的自動化功能測試,通過安卓開放的接口實現安卓控件的定位和操作。因為app應用可解析為不同控件組成的樹狀結構。而瀏覽器測試組件最初面向桌面瀏覽器的自動化功能測試或壓力測試。
為了實現上述目的,本發明通過以下技術方案來實現:
一種微信數據獲取方法,是通過將安卓平臺應用測試組件和瀏覽器測試組件相結合分別獲取微信非即時數據和即時數據實現的。
考慮到單個app只能同時操作一個界面,故微信非即時數據和即時數據的獲取是分別進行的。
獲取微信非即時數據包括以下步驟:
1-1)通過任務分配調度機制獲取目標公眾賬號(即欲獲取數據的微信公共賬號),并進行關注。
1-2)通過安卓平臺應用測試組件模擬用戶行為操作微信客戶端,進入公眾賬號資料界面,獲取賬號資料信息。
1-3)由微信公眾賬號資料界面進入歷史消息界面,點擊轉發,選擇發送給朋友,隨機選擇任意好友,進入確認轉發界面,通過定位轉發界面的安卓控件,提取歷史消息頁面地址。
1-4)通過瀏覽器測試組件打開步驟1-3)提取的歷史消息頁面地址,加載后獲得相應的頁面消息數據。
1-5)將上述歷史消息頁面地址和相應的頁面消息數據進行分析和請求鏈接拼接,獲取該微信公眾賬號所有歷史消息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院信息工程研究所;國家計算機網絡與信息安全管理中心,未經中國科學院信息工程研究所;國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510363826.9/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





