[發明專利]一種利用社交媒體挖掘人類活動時空模式的方法在審
| 申請號: | 201710883260.1 | 申請日: | 2017-09-26 |
| 公開(公告)號: | CN107908636A | 公開(公告)日: | 2018-04-13 |
| 發明(設計)人: | 王艷東;高露妹;王騰 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62;G06Q50/00 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙)42222 | 代理人: | 嚴彥 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 社交 媒體 挖掘 人類 活動 時空 模式 方法 | ||
技術領域
本發明涉及人類移動規律挖掘技術領域,尤其涉及一種利用社交媒體挖掘人類活動時空 模式的方法。
背景技術
時間地理學是一種研究在各種制約條件下人的行為的時空特征的研究方法,以時空地理 框架的方式展示出來,該框架整合了時間(t)和空間(x,y)三個維度??臻g維度展示了人 類移動在位置上的變化,時間維度展示了人類移動在時間上的序列性。
包含于時間地理框架中的時空路徑概念是將人類的活動序列點以線段的方式連接起來, 生成一條在三維空間中的路徑。每個活動點代表了一個活動,活動的位置信息由時間地理框 架中的空間維度標識,活動發生的時間信息由時間維度標識。時空路徑清晰的展示了用戶活 動隨時間的變化規律,包括相鄰活動的時間間隔,活動發生變化的時間點,進行同一活動的 頻率等信息。人類短時間的活動點連接表示人的活動在短時間內的變化規律,當活動點是人 的習慣性活動時,由活動點連接起來的時空路徑代表了人大致的活動模式。可以根據人的活 動頻率提取人類每個時段的習慣性活動,生成時空路徑,獲取人類的活動主要的時空模式。
社交媒體是人們用來創作、分享、交流的虛擬化社區和網絡平臺。隨著手機的普及和定位 技術的發展,手機對地理位置的識別和記錄越來越細致、準確,地理位置慢慢成為社交媒體 用戶比較流行的分享內容。雖然人們每天登錄社交媒體的時間以及頻率很不固定,但是社交 媒體對人們的生活記錄是長期的,這種長期的記錄形成了面向個人的龐大的數據源,可以從 這些龐大的數據源中提取用戶的時空路徑,獲取人類長期的活動模式。
從時空路徑日間穩定點、晚間穩定點可以獲得用戶單位和家的位置。時空路徑的形狀取決 于日間穩定點出現與持續的時間,日間位置波動的情況,以及日間、晚間穩定點之間的距離 (通勤距離)??梢钥疾炖眠@些特征對用戶時空路徑進行分類。
而如何將經緯度坐標不同、形狀各異的時空路徑從三維空間(x,y,t)映射到二維平面 空間(通勤距離,t),并進行類別的劃分是當前本領域的一大挑戰。
發明內容
針對現有技術缺陷,本發明提出一種利用社交媒體挖掘人類活動時空模式的方法。
本發明技術方案提供一種利用社交媒體挖掘人類活動時空模式的方法,包括以下步驟:
步驟1,面向用戶個體提取時空路徑,并確定主要時空路徑,包括以下子步驟,
步驟1.1,面向用戶個體進行社交媒體數據提取;
步驟1.2,以每條社交媒體數據作為一個活動,以社交媒體數據的位置信息作為活動位置;
步驟1.3,根據社交媒體數據的時間信息將活動劃分為不同的時間段,設有n個時間段;
步驟1.4,對每個時間段的活動分別進行聚類;
步驟1.5,根據聚類包含的活動位置點數量,計算每個時段中各個聚類的比重值;
步驟1.6,根據各個聚類的比重值,提取每個時段的代表性聚類;
步驟1.7,基于代表性聚類生成多條時空路徑,生成方式為,在每個時段從代表性聚類中選擇 一個聚類,將所有時段的選擇結果連接生成一條時空路徑;
步驟1.8,計算步驟1.7所得每條時空路徑的出現概率,確認主要時空路徑;
步驟1.9,根據主要時空路徑提取用戶的日間穩定點和晚間穩定點;
步驟2,根據主要時空路徑將用戶劃分為不同類別,包括以下子步驟,
步驟2.1,將各用戶的主要時空路徑從三維空間映射到二維空間,對任一條時空路徑的映射實 現如下,
以時空路徑包含的每個聚類的中心作為聚類位置,聚類中心使用每個聚類的外接圓圓心;
把在預定時間段內的聚類位置的經緯度坐標取平均值,作為原點位置;
計算時空路徑包含的各時段的聚類位置與原點位置的通勤距離;
以橫軸為時間,縱軸為通勤距離將時空路徑繪制到二維平面;
步驟2.2,將參與聚類的每條時空路徑作為一個擁有n個維度的對象,每個維度為相應時段的 通勤距離,對時空路徑進行分類;
步驟2.3,通過不同類別用戶的通勤距離獲取各類別的時間模式特征和空間模式特征。
而且,步驟1.4中,
使用基于密度的DBSCAN聚類方法對每個時間段的活動分別進行聚類。
而且,步驟1.3中,設每個時間段的長度為1小時,n=24。
而且,步驟1.5中,計算每個時段中各個聚類的比重值,包括用聚類包含的活動位置點數 量計算各聚類所占比重,計算公式如下,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710883260.1/2.html,轉載請聲明來源鉆瓜專利網。





