[發(fā)明專利]指定地域微博數(shù)據(jù)收集與處理方法有效
| 申請?zhí)枺?/td> | 201410254030.5 | 申請日: | 2014-06-09 |
| 公開(公告)號: | CN104133834B | 公開(公告)日: | 2018-05-04 |
| 發(fā)明(設計)人: | 任福繼;劉寧;全昌勤;華磊 | 申請(專利權)人: | 合肥工業(yè)大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 安徽合肥華信知識產(chǎn)權代理有限公司34112 | 代理人: | 余成俊 |
| 地址: | 230009 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 指定 地域 數(shù)據(jù) 收集 處理 方法 | ||
1.指定地域微博數(shù)據(jù)收集與處理方法,其特征在于:包括以下步驟:
(1)、GEO地理信息種子點選取:
設目標種子點數(shù)量為N,對指定城市區(qū)域使用矩形切割,確定城市邊緣;做矩形區(qū)域對角線,以地圖比例尺長度10公里間距做平行線,分割矩形區(qū)域;在各條分割平行線上,以地圖比例尺長度5公里為半徑做圓形區(qū)域依次覆蓋矩形區(qū)域,各圓形區(qū)域不重疊;分隔線上不足5公里的區(qū)域按實際情況采用合適圓形區(qū)域覆蓋;對于各圓形區(qū)域結合處,以比例尺半徑為R公里的圓形區(qū)域覆蓋該區(qū)域,R≤5,要求做到重疊區(qū)域不超過3%;覆蓋指定地域的各圓形區(qū)域的圓心即為候選GEO地理信息種子點,候選GEO地理信息種子點總數(shù)量記為N',根據(jù)公式(1)確定最后種子點數(shù)量:
公式(1)中,f表示種子點數(shù)量,當候選GEO地理信息種子點數(shù)量N'小于目標種子點數(shù)量N時,取候選GEO地理信息種子點作為最終種子點;當候選GEO地理信息種子點數(shù)量N'大于目標種子點數(shù)量N時,調(diào)整候選GEO地理信息種子點圓形區(qū)域的位置及半徑大小,使覆蓋矩形區(qū)域的圓形區(qū)域數(shù)量為N以內(nèi)的整數(shù),此時選擇調(diào)整后的圓形區(qū)域的為最終種子點區(qū)域;
根據(jù)上述獲得的最終種子點,即f所代表的種子點,定位地圖信息,導出經(jīng)緯度數(shù)據(jù),即可得到種子點的GEO地理信息;
(2)、微博數(shù)據(jù)獲取;
根據(jù)步驟(1)獲取的種子點GEO地理信息數(shù)據(jù),調(diào)用微博第三方API接口,獲取指定區(qū)域內(nèi)的微博數(shù)據(jù);微博數(shù)據(jù)包括微博創(chuàng)建時間、微博信息內(nèi)容、地理信息字段;獲取的微博數(shù)據(jù)通過UTF-8格式的TXT文本文件保存在本地,記為DGEO;
(3)、微博數(shù)據(jù)處理:
將步驟(2)中獲取的微博文本文件DGEO按照微博創(chuàng)建時間及對應的地理信息成對提取出來,并以UTF_8格式的文本文件保存在本地,記為Dt×geo;從微博文本文件DGEO中提取出微博信息內(nèi)容,并本地以UTF-8格式的文本保存,記為Dcont。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業(yè)大學,未經(jīng)合肥工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410254030.5/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





