[發明專利]基于wifi探測技術的樞紐換乘區域旅客走行路徑識別方法及設備有效
| 申請號: | 202011503692.3 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112672379B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 周正全;李昱瑾;趙慧 | 申請(專利權)人: | 北京市市政工程設計研究總院有限公司 |
| 主分類號: | H04W24/08 | 分類號: | H04W24/08;G06F18/23213;G06Q50/26;G06F18/24;G06F17/18;G06F18/22 |
| 代理公司: | 北京萬科園知識產權代理有限責任公司 11230 | 代理人: | 杜澄心;張亞軍 |
| 地址: | 100082 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 wifi 探測 技術 樞紐 換乘 區域 旅客 行路 識別 方法 設備 | ||
1.一種基于wifi探測技術的樞紐換乘區域旅客走行路徑識別方法,包括以下步驟:
(1)wifi探測設備參數配置;
在采集數據之前需要配置wifi探測設備的相關參數,包括時間設置和數據上傳參數設置兩部分;
將wifi探測設備時間設置成與時鐘一致的時間,即本地時間;
在數據上傳參數設置部分,設置采集數據的周期,將采集到的數據實時保存至sd儲存卡內,并設置儲存文件大小,超過后計入下一個文件;
(2)在wifi探測設備采集的原數據基礎上剔除錯誤數據樣本;
記錄每臺wifi探測設備發射信號覆蓋范圍內所有打開了wifi信號的手機信息,記錄內容包括其手機mac地址,記錄時間,rssi信號強度范圍;wifi設備采集的原始數據按照數據大小分成若干文件夾,以txt格式儲存;
對于亂碼和不滿足以上數據格式的數據條目,在本階段分析中被認為是錯誤數據,予以剔除,原始數據為M0,剔除錯誤數據之后的數據集為M1;
其中,i為不同mac地址的個數,k為同一個mac地址的數據個數;
(3)基于統計學分析過濾偽數據樣本;
采用統計學分析的方法,即根據數據的出現頻次進行分析,對于瞬時多頻次出現的數據進行過濾;
基于剔除錯誤數據后的數據集合M1,其中共包含有I個mac地址,分別為{mac1,mac2,…,maci,…,macI},其中有效mac地址J個,偽數據G個,且J+G=I;按照mac地址的不同計算第i個mac地址的出現頻次,即{α1,α2,…,αi,…,αI},定義一個閾值β作為判定是否為偽數據的條件,依據統計學的分析,可得到βi≥αi的累計頻率為γi,不同的βi對應的γi不同,γi的推薦值定義為γg,γg取值10%-15%,與γg對應的數據集為偽數據集,記為M1g,
按照以上條件對數據進行清洗,去除偽數據之后的數據樣本記為M2;
其中,j為剔除偽數據之后的不同mac地址的個數,k為同一個mac地址的數據個數;
(4)利用K-means聚類分析算法,根據rssi絕對值的大小將數據樣本聚類;
K-means算法描述為:假設給定一個整數Z以及一個具有n個數據對象的樣本集合目標是選擇Z個聚類中心C使目標函數F達到最小,其中目標函數F的計算公式為:
其中,s代表與mac地址對應的rssi的值,c代表中心點的rssi值;
在數據集M2中,隨機選取Z個中心,集合中其他數據對象被劃分到與中心最近的數據集合中去,形成了Z個初始的數據集合,也稱為簇,對于每個數據集合計算新的中心,然后根據新的中心重新分配其他數據集合,不斷迭代,指導數據中心不再變化;
在樣本數據M2的基礎上,設置初始簇Z值為3個,初始的中心為c11,c12,c13,經過迭代計算后,得到新的中心為c21,c22,c23,其中c21對應的數據集為S1,包含m個數據樣本{s11,s12,s13,…,s1m,},樣本個數的累計頻率即為pm;c22對應的數據集為S2,包含n個數據樣本{s21,s22,s23,…,s2n,},樣本個數的累計頻率即為pn;c23對應的數據集為S3,包含個數據樣本{s3k(1),s3k(2),s3k(3),…,s3k(x),},樣本個數的累計頻率即為pχ,假設px=max(pm、pn、pχ),那么pχ對應的集合為有效數據,即該數據集是在wifi探測設備有效距離內的數據;
按照以上條件對數據進行清洗后的數據樣本記為M3,
其中,χ為rssi符合條件要求的不同mac地址的個數,k為同一個mac地址的數據個數;
(5)基于K-means聚類分析算法確定換乘區域內旅客動態位置;
經過以上步驟篩選得到的不同mac地址代表不同的旅客,對各檢測器檢測到的mac地址進行分類處理后,明確了旅客在換乘區域內的位置;根據wifi探測設備捕獲得到的rssi的強弱不同,對數據樣本進一步篩選,得到的M3是包括mac地址實時位置信息的數據集;
(6)識別換乘區域內客流類型;
根據最初捕獲時間和最后一次捕獲時間的差值可以甄別出行旅客;
假設tχ1為首次捕獲時間,tχ2為末次捕獲時間,tχ為移動設備在換乘區域內的滯留時間,tχ=tχ2-tχ1,tχ≥Tχ1的概率為θ1,tχ≤Tχ2的概率為θ2;根據滯留時間的分布特征給予θ1和θ2特定的閾值,θ1值為1%-5%,θ2值為10%-20%;假設1%≤θq1≤5%,10%≤θq2≤20%,對應的數據集為M4;
其中,q為滯留時間符合條件要求的不同mac地址的個數,k為同一個mac地址的數據個數;
(7)匹配樞紐換乘區域各檢測點之間的數據樣本,獲取旅客動態位置信息,識別旅客走行路徑;
針對同一個mac地址,識別在每個檢測位置rssi最大絕對值出現的時刻,并按照時間順序進行串聯,進而得到該旅客的走行路徑;假設樞紐換乘區域檢測點共N個,每個檢測點檢測到的數據集為M4n,M4由{M41,M42,…,M4n…,M4N}組成;M4n內的mac地址為mac4n,mac4n在同一個檢測點可能被檢測到k次,即M4n={mac4n1,mac4n2,mac4n3,…,mac4nk},對比以上k個數據的rssi值,rssi絕對值最大的為保留用于匹配的最終數據,記為mac4nq,M4nq={mac41q,mac42q,mac43q,…,mac4nq},即選取rssi最大絕對值對應的數據集作為該mac地址在此檢測點最為有效的數據;
將每個檢測點的mac4nq與檢測位置進行匹配,匹配之后的數據形成數據集M5={M41q,M42q,…,M4nq…,M4Nq};
此數據集中均帶有各個檢測位置的rssi信息和與其對應的time信息,按照time時間順序將mac地址對應的檢測點進行串聯,獲取該旅客在樞紐換乘區域內的動態位置信息,為樞紐旅客出行特征分析提供依據。
2.一種基于wifi探測技術的樞紐換乘區域旅客走行路徑識別設備,其特征在于,包括:
1)、數據采集模塊:
經過本地時鐘、采集數據周期的設置,將采集到的數據實時保存至sd儲存卡內,并設置儲存文件大小,超過后計入下一個文件的wifi探測設備;
2)、數據預處理模塊:
首先,在wifi探測設備采集的原數據基礎上剔除錯誤數據樣本;
記錄每臺wifi探測設備發射信號覆蓋范圍內所有打開了wifi信號的手機信息,記錄內容包括其手機mac地址,記錄時間,rssi信號強度范圍;wifi設備采集的原始數據按照數據大小分成若干文件夾,以txt格式儲存,
對于亂碼和不滿足以上數據格式的數據條目,在本階段分析中被認為是錯誤數據,予以剔除,原始數據為M0,剔除錯誤數據之后的數據集為M1;
其中,i為不同mac地址的個數,k為同一個mac地址的數據個數;
其次,基于統計學分析過濾偽數據樣本;
采用統計學分析的方法,即根據數據的出現頻次進行分析,對于瞬時多頻次出現的數據進行過濾;
基于剔除錯誤數據后的數據集合M1,其中共包含有I個mac地址,分別為{mac1,mac2,…,maci,…,macI},其中有效mac地址J個,偽數據G個,且J+G=I;按照mac地址的不同計算第i個mac地址的出現頻次,即{α1,α2,…,αi,…,αI},定義一個閾值β作為判定是否為偽數據的條件,依據統計學的分析,可得到βi≥αi的累計頻率為γi,,不同的βi對應的γi不同,γi的推薦值定義為γg,γg取值10%-15%,與γg對應的數據集為偽數據集,記為M1g,
按照以上條件對數據進行清洗,去除偽數據之后的數據樣本記為M2;
其中,j為剔除偽數據之后的不同mac地址的個數,k為同一個mac地址的數據個數;
第三,利用K-means聚類分析算法,根據rssi絕對值的大小將數據樣本聚類;
K-means算法描述為:假設給定一個整數Z以及一個具有n個數據對象的樣本集合目標是選擇Z個聚類中心C使目標函數F達到最小,其中目標函數F的計算公式為:
其中,s代表與mac地址對應的rssi的值,c代表中心點的rssi值;
在數據集M2中,隨機選取Z個中心,集合中其他數據對象被劃分到與中心最近的數據集合中去,形成了Z個初始的數據集合,也稱為簇,對于每個數據集合計算新的中心,然后根據新的中心重新分配其他數據集合,不斷迭代,指導數據中心不再變化;
在樣本數據M2的基礎上,設置初始簇Z值為3個,初始的中心為c11,c12,c13,經過迭代計算后,得到新的中心為c21,c22,c23,其中c21對應的數據集為S1,包含m個數據樣本{s11,s12,s13,…,s1m,},樣本個數的累計頻率即為pm;c22對應的數據集為S2,包含n個數據樣本{s21,s22,s23,…,s2n,},樣本個數的累計頻率即為pn;c23對應的數據集為S3,包含個數據樣本{s3k(1),s3k(2),s3k(3),…,s3k(x),},樣本個數的累計頻率即為pχ,假設px=max(pm、pn、pχ),那么pχ對應的集合為有效數據,即該數據集是在wifi探測設備有效距離內的數據;
按照以上條件對數據進行清洗后的數據樣本記為M3,
其中,χ為rssi符合條件要求的不同mac地址的個數,k為同一個mac地址的數據個數;
第四,基于K-means聚類分析算法確定換乘區域內旅客動態位置;
經過以上步驟篩選得到的不同mac地址代表不同的旅客,對各檢測器檢測到的mac地址進行分類處理后,明確了旅客在換乘區域內的位置;根據wifi探測設備捕獲得到的rssi的強弱不同,對數據樣本進一步篩選,得到的M3是包括mac地址實時位置信息的數據集;
第五,識別換乘區域內客流類型:根據最初捕獲時間和最后一次捕獲時間的差值可以甄別出行旅客;
假設tχ1為首次捕獲時間,tχ2為末次捕獲時間,tχ為移動設備在換乘區域內的滯留時間,tχ=tχ2-tχ1,tχ≥Tχ1的概率為θ1,tχ≤Tχ2的概率為θ2;根據滯留時間的分布特征給予θ1和θ2特定的閾值,θ1值為1%-5%,θ2值為10%-20%;假設1%≤θq1≤5%,10%≤θq2≤20%,對應的數據集為M4;
其中,q為滯留時間符合條件要求的不同mac地址的個數,k為同一個mac地址的數據個數;
3)、數據匹配模塊:
匹配樞紐換乘區域各檢測點之間的數據樣本,獲取旅客動態位置信息,識別旅客走行路徑;針對同一個mac地址,識別在每個檢測位置rssi最大絕對值出現的時刻,并按照時間順序進行串聯,進而得到該旅客的走行路徑;假設樞紐換乘區域檢測點共N個,每個檢測點檢測到的數據集為M4n,M4由{M41,M42,…,M4n…,M4N}組成;M4n內的mac地址為mac4n,mac4n在同一個檢測點可能被檢測到k次,即M4n={mac4n1,mac4n2,mac4n3,…,mac4nk},對比以上k個數據的rssi值,rssi絕對值最大的為保留用于匹配的最終數據,記為mac4nq,M4nq={mac41q,mac42q,mac43q,…,mac4nq},即選取rssi最大絕對值對應的數據集作為該mac地址在此檢測點最為有效的數據;
將每個檢測點的mac4nq與檢測位置進行匹配,匹配之后的數據形成數據集M5={M41q,M42q,…,M4nq…,M4Nq};
此數據集中均帶有各個檢測位置的rssi信息和與其對應的time信息,按照time時間順序將mac地址對應的檢測點進行串聯,獲取該旅客在樞紐換乘區域內的動態位置信息,為樞紐旅客出行特征分析提供依據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市市政工程設計研究總院有限公司,未經北京市市政工程設計研究總院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011503692.3/1.html,轉載請聲明來源鉆瓜專利網。





