[發明專利]一種基于多標簽的室內人群聚類方法有效
| 申請號: | 201711280844.6 | 申請日: | 2017-12-06 |
| 公開(公告)號: | CN107944498B | 公開(公告)日: | 2021-08-31 |
| 發明(設計)人: | 戚榮志;李水艷;安紀存;毛鶯池;平萍;黃倩 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;H04L29/12 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 李玉平 |
| 地址: | 210098 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 標簽 內人 群聚 方法 | ||
1.一種基于多標簽的室內人群聚類方法,其特征在于:通過AP設備采集每一秒鐘進入區域內的MAC地址,針對每個MAC地址,根據其當日的所有狀態數據計算出對應的多類標簽數值;任意選取一個MAC地址,計算它與其他MAC地址的加權余弦距離,如果加權余弦距離小于預定義閾值K即歸為一類,如果該區域內半數以上的MAC地址與待比較的MAC地址相似,那么也歸為一類,最后得到多個不同的群體;
包括以下步驟:
步驟1:通過AP設備探測當前區域內擁有Wi-Fi模塊的移動終端設備的MAC地址、信號強度RSSI和采集時間;
步驟2:AP設備將采集到的數據發送給服務器,服務器程序將每個MAC地址在當日是否處于區域內的狀態序列按照時間升序進行存儲;
步驟3:針對每個MAC地址,根據其狀態序列得到停留該區域時間最長的一個時段的訪問時間;
步驟4:針對每個MAC地址,根據其狀態序列得到每次駐留該區域的平均時間;
步驟5:針對每個MAC地址,根據其狀態序列得到回訪周期的平均值;
步驟6:規定預定義閾值K,任選一個MAC地址與其他所有MAC地址對應的多類標簽數值依次計算加權余弦距離,重復選擇所有的MAC地址進行上述計算,使所有的MAC地址之間都有一個加權余弦距離;
步驟7:根據預定義閾值K和加權余弦距離對所有MAC地址進行群體劃分。
2.如權利要求1所述的基于多標簽的室內人群聚類方法,其特征在于:步驟1中AP設備采集到區域內所有的移動終端的MAC地址和RSSI值,每隔一秒采集一次然后發送到服務器中。
3.如權利要求1所述的基于多標簽的室內人群聚類方法,其特征在于:步驟2中服務器程序根據RSSI的強弱判斷該移動終端的是否在區域內,如果在區域內則狀態為1,不在區域內狀態為0,如果采集不到數據也為0,然后將狀態序列進行存儲。
4.如權利要求1所述的基于多標簽的室內人群聚類方法,其特征在于:步驟3中針對每個MAC地址計算其停留該區域時間最長的一個時段的訪問時間,在狀態序列中,取出連續的由“1”組成的最長序列的起始時間即為停留該區域時間最長的一個時段的訪問時間。
5.如權利要求1所述的基于多標簽的室內人群聚類方法,其特征在于:步驟4中針對每個MAC地址計算其每次駐留該區域的平均時間,在狀態序列中,過濾掉小于30秒的訪問時間,其余訪問時長取平均值得到每次駐留該區域的平均時間。
6.如權利要求1所述的基于多標簽的室內人群聚類方法,其特征在于:步驟5中針對每個MAC地址計算其回訪周期的平均值,在狀態序列中,獲取狀態為連續0的序列的時長,去掉第一個連續0序列和最后一個連續0序列,剩余的0序列取平均值得到回訪周期的平均值。
7.如權利要求1所述的基于多標簽的室內人群聚類方法,其特征在于:步驟6中,手動設置預定義閾值K,根據具體場景進行調整,加權余弦距離權重A、B、C也為人工設定,每個MAC地址對應的停留該區域時間最長的一個時段的訪問時間、每次駐留該區域的平均時間、回訪周期的平均值的數值分別為
8.如權利要求7所述的基于多標簽的室內人群聚類方法,其特征在于:步驟7中,根據預定義閾值K和二維數組
步驟S1:
步驟S2:
步驟S3:將第
步驟S4:
步驟S5:重復步驟S2-S4直到
步驟S6:
步驟S7:將第
步驟S8:
步驟S9:重復步驟S6-S8直到第一次遍歷完未歸類的下標;
步驟S10:設置
步驟S11:設置
步驟S12:重復步驟S2-S9,直到所有的數值計算完成,或者只留下一個未歸類的下標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711280844.6/1.html,轉載請聲明來源鉆瓜專利網。





