[發(fā)明專利]基于位置信息的數(shù)據(jù)分析方法、裝置、設(shè)備及介質(zhì)有效
| 申請?zhí)枺?/td> | 202110416584.0 | 申請日: | 2021-04-19 |
| 公開(公告)號: | CN112819593B | 公開(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計)人: | 張莉;任杰;吳志成;喬延柯;袁雅云 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F17/11 | 分類號: | G06F17/11;G06Q30/06;G06Q40/08;G06F16/9537 |
| 代理公司: | 深圳市賽恩倍吉知識產(chǎn)權(quán)代理有限公司 44334 | 代理人: | 劉麗華;楊毅玲 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 位置 信息 數(shù)據(jù) 分析 方法 裝置 設(shè)備 介質(zhì) | ||
1.一種基于位置信息的數(shù)據(jù)分析方法,其特征在于,所述方法包括:
啟動預(yù)設(shè)采集裝置,并利用所述預(yù)設(shè)采集裝置采集至少一個用戶在預(yù)設(shè)時間范圍內(nèi)的地理位置服務(wù)數(shù)據(jù);
從采集的地理位置服務(wù)數(shù)據(jù)中提取出每個用戶的目標(biāo)地理位置服務(wù)數(shù)據(jù);
對每個用戶的目標(biāo)地理位置服務(wù)數(shù)據(jù)進(jìn)行轉(zhuǎn)碼,得到每個用戶的地理位置服務(wù)編碼;
根據(jù)每個用戶的地理位置服務(wù)編碼構(gòu)建初始關(guān)系圖;
對所述初始關(guān)系圖進(jìn)行清洗,得到目標(biāo)關(guān)系圖,包括:獲取所述初始關(guān)系圖中每個用戶的地理位置服務(wù)編碼的第一前預(yù)設(shè)位字符構(gòu)建每個用戶的子編碼;獲取所述初始關(guān)系圖中用戶的總?cè)藬?shù),及每個子編碼所屬的用戶的人數(shù);根據(jù)每個子編碼所屬的用戶的人數(shù)與所述總?cè)藬?shù)獲取每個子編碼的覆蓋率;獲取所述覆蓋率大于或者等于配置覆蓋率的子編碼作為備選子編碼;根據(jù)所述總?cè)藬?shù)及每個子編碼所屬的用戶的人數(shù)獲取每個備選子編碼的IDF值;將每個備選子編碼按照所述IDF值由高到低的順序進(jìn)行排序,并獲取排在第二前預(yù)設(shè)位的備選子編碼作為目標(biāo)子編碼;在所述初始關(guān)系圖中保留帶有所述目標(biāo)子編碼的用戶,并刪除其他用戶,得到所述目標(biāo)關(guān)系圖;
計算所述目標(biāo)關(guān)系圖中每兩個用戶間的地理位置服務(wù)行為相似度,包括:獲取所述目標(biāo)關(guān)系圖中每個用戶的地理位置服務(wù)編碼;統(tǒng)計每個用戶的地理位置服務(wù)編碼出現(xiàn)的頻率;對每個用戶的地理位置服務(wù)編碼出現(xiàn)的頻率按照由高到低的順序進(jìn)行排序;獲取排在第三前預(yù)設(shè)位的地理位置服務(wù)編碼作為每個用戶的第一編碼;計算每個用戶的第一編碼在所述目標(biāo)子編碼中出現(xiàn)的次數(shù);根據(jù)每個用戶的第一編碼在所述目標(biāo)子編碼中出現(xiàn)的次數(shù)構(gòu)建每個用戶的序列;根據(jù)每個用戶的序列計算每兩個用戶間的余弦距離作為每兩個用戶間的地理位置服務(wù)行為相似度;
獲取待預(yù)測用戶,并識別所述目標(biāo)關(guān)系圖中職業(yè)已知的用戶作為標(biāo)簽用戶;
基于改進(jìn)的標(biāo)簽傳播算法,根據(jù)每兩個用戶間的地理位置服務(wù)行為相似度從所述標(biāo)簽用戶中檢測目標(biāo)用戶,并獲取所述目標(biāo)用戶的職業(yè)作為所述待預(yù)測用戶的預(yù)測職業(yè),所述改進(jìn)的標(biāo)簽傳播算法是根據(jù)已標(biāo)記的節(jié)點(diǎn)標(biāo)簽信息預(yù)測未標(biāo)記的節(jié)點(diǎn)標(biāo)簽信息,并利用樣本間的關(guān)系建立完全圖模型。
2.如權(quán)利要求1所述的基于位置信息的數(shù)據(jù)分析方法,其特征在于,所述從采集的地理位置服務(wù)數(shù)據(jù)中提取出每個用戶的目標(biāo)地理位置服務(wù)數(shù)據(jù)包括:
從所述采集的地理位置服務(wù)數(shù)據(jù)中篩選出每個用戶的地理位置服務(wù)數(shù)據(jù);
計算每個地理位置服務(wù)數(shù)據(jù)在對應(yīng)用戶的地理位置服務(wù)數(shù)據(jù)中出現(xiàn)的頻次;
從每個用戶的地理位置服務(wù)數(shù)據(jù)中提取出所述出現(xiàn)的頻次大于或者等于預(yù)設(shè)頻次的地理位置服務(wù)數(shù)據(jù);
將提取出的地理位置服務(wù)數(shù)據(jù)確定為每個用戶的目標(biāo)地理位置服務(wù)數(shù)據(jù)。
3.如權(quán)利要求1所述的基于位置信息的數(shù)據(jù)分析方法,其特征在于,所述根據(jù)每個用戶的地理位置服務(wù)編碼構(gòu)建初始關(guān)系圖包括:
獲取每兩個用戶間的地理位置服務(wù)編碼所包含的公共字符串的數(shù)量;
當(dāng)檢測到有兩個用戶間的地理位置服務(wù)編碼所包含的公共字符串的數(shù)量大于或者等于配置數(shù)量時,連接檢測到的兩個用戶,得到所述初始關(guān)系圖。
4.如權(quán)利要求1所述的基于位置信息的數(shù)據(jù)分析方法,其特征在于,所述基于改進(jìn)的標(biāo)簽傳播算法,根據(jù)每兩個用戶間的地理位置服務(wù)行為相似度從所述標(biāo)簽用戶中檢測目標(biāo)用戶包括:
根據(jù)每兩個用戶間的地理位置服務(wù)行為相似度計算所述目標(biāo)關(guān)系圖中每條邊的權(quán)重;
根據(jù)每條邊的權(quán)重構(gòu)建概率轉(zhuǎn)移矩陣;
根據(jù)所述概率轉(zhuǎn)移矩陣計算每個標(biāo)簽用戶到所述待預(yù)測用戶的傳播概率;
根據(jù)所述傳播概率執(zhí)行傳播,并更新每個標(biāo)簽用戶的概率分布;
當(dāng)每個標(biāo)簽用戶的概率分布均收斂時,停止傳播,并從傳播后得到的每個標(biāo)簽用戶的概率分布中識別最高概率,將所述最高概率對應(yīng)的標(biāo)簽用戶確定為所述目標(biāo)用戶。
5.如權(quán)利要求4所述的基于位置信息的數(shù)據(jù)分析方法,其特征在于,采用下述公式根據(jù)每兩個用戶間的地理位置服務(wù)行為相似度計算所述目標(biāo)關(guān)系圖中每條邊的權(quán)重:
其中,wij表示用戶i與用戶j間邊的權(quán)重,表示配置參數(shù),Sij表示用戶i與用戶j間的地理位置服務(wù)行為相似度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110416584.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





