[發明專利]用戶軌跡識別方法、裝置、設備及存儲介質有效
| 申請號: | 202110732370.4 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113177101B | 公開(公告)日: | 2021-11-12 |
| 發明(設計)人: | 張霖;徐賽奕;朱磊;趙文婕 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G06F16/35;G06F16/901;G06F40/216;G06F40/242;G06F40/289;G06K9/62;G06N3/04;G06N3/08;H04W4/029;G01S19/14;G06F16/215 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 軌跡 識別 方法 裝置 設備 存儲 介質 | ||
本發明涉及數據處理領域,公開了一種用戶軌跡識別方法、裝置、設備及存儲介質,該方法包括:獲取用戶在待識別時間段的原始wifi數據和gps信息;對原始wifi數據進行數據預處理,得到待識別數據;根據專家規則詞典,對待識別數據進行一次識別,得到一次識別結果,若一次識別結果為識別失敗,則將待識別數據輸入至wifi識別模型中,得到二次識別結果,根據一次識別結果或二次識別結果,生成用戶在待識別時間段的用戶位置標注信息;根據用戶位置標注信息、原始wifi數據和gps信息,生成用戶的用戶軌跡。本方法通過預先建立的專家規則詞典和模型,可以自動化識別用戶的用戶軌跡。此外,本發明還涉及區塊鏈技術,wifi數據可存儲于區塊鏈中。
技術領域
本發明涉及數據處理領域,尤其涉及一種用戶軌跡識別方法、裝置、設備及存儲介質。
背景技術
智能終端及定位技術的迅猛發展極大的推動了基于位置服務應用的普及,如今,用戶是很多企業提供服務的核心基礎,通過分析用戶的位置變化可以對用戶行為進行描述,對于優化用戶推薦系統、提升企業的服務質量、助力智慧城市布局等方面有著重大意義,考慮到用戶的日常移動軌跡中包含了用戶在時間與空間上的信息,與用戶的日常行為有著密切關聯,對于用戶軌跡的研究一直受到學者們的關注。
目前應用于用戶軌跡識別的主要方法是手機GPS識別、手機基站識別。目前通過手機GPS和基站識別用戶軌跡存在以下不足。第一,由于現有GPS和基站因為信號質量的原因存在0-100米的誤差,造成用戶軌跡判斷錯誤。第二,同一個地址或者位置,會存在多個POI(Point of Interest,),無法精確判斷用戶實際軌跡。
發明內容
本發明的主要目的在于解決現有的用戶軌跡識別方式識別用戶實際軌跡精度低的技術問題。
本發明第一方面提供了一種用戶軌跡識別方法,包括:獲取用戶在待識別時間段的原始wifi數據和gps信息,所述原始wifi數據包括wifi連接時間;對所述原始wifi數據進行數據預處理,得到待識別數據;根據預設的專家規則詞典,對所述待識別數據進行一次識別,得到一次識別結果;若所述一次識別結果為識別成功,則得到所述待識別數據的地點類別;若所述一次識別結果為識別失敗,則將所述待識別數據輸入至預先訓練好的wifi識別模型中,得到二次識別結果,其中,所述二次識別結果包括所述待識別數據的地點類別;根據所述wifi連接時間將所述待識別段進行切片劃分,得到至少一段wifi連接時間段,并根據所述待識別數據的地點類別對所述wifi連接時間段進行標注,得到用戶位置標注信息;根據所述用戶位置標注信息、所述原始wifi數據和所述gps信息,生成所述用戶的用戶軌跡。
可選的,在本發明第一方面的第一種實現方式中,所述原始wifi數據包括wifi名稱數據,所述對所述原始wifi數據進行數據預處理,得到待識別數據包括:對所述wifi名稱數據進行數據清洗處理,得到數據清洗結果;將所述數據清洗結果中的wifi名稱數據進行分詞處理,得到wifi分詞數組;將所述wifi分詞數組中的停用詞進行剔除,得到待識別數據。
可選的,在本發明第一方面的第二種實現方式中,所述將所述數據清洗結果中的wifi名稱數據進行分詞處理,得到wifi分詞數組包括:對所述數據清洗結果中的wifi名稱數據進行單字切分,得到序列數組;根據預設的前綴詞典,構建所述序列數組的有向無回圖,并分別計算所述有向無回圖中各路徑的概率;根據所述有向無回圖中最大概率對應的路徑,得到最優分詞結果,并根據所述最優分詞結果對所述數據清洗結果中的wifi名稱數據進行分詞,得到wifi分詞數組。
可選的,在本發明第一方面的第三種實現方式中,所述根據預設的專家規則詞典,對所述待識別數據進行一次識別,得到一次識別結果包括:將所述待識別數據與所述專家規則詞典中的地點單詞進行匹配;若匹配成功,則將所述待識別數據匹配成功的地點單詞對應的地點類別作為一次識別結果;若匹配失敗,則將所述一次識別結果設為識別失敗。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110732370.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種建筑回收骨料篩分裝置
- 下一篇:一種塑料制品注塑成型后自動化修整處理設備





