[發明專利]地址畫像的生成方法、裝置、設備及存儲介質在審
| 申請號: | 202010947614.6 | 申請日: | 2020-09-10 |
| 公開(公告)號: | CN112559652A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 陳玉芬;夏揚;李培吉 | 申請(專利權)人: | 上海東普信息科技有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G06F16/2458;G06Q10/08;G06Q30/02 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 201700 上海市青浦區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地址 畫像 生成 方法 裝置 設備 存儲 介質 | ||
1.一種地址畫像的生成方法,其特征在于,所述地址畫像的生成方法包括:
獲取終端發送的原始數據,所述原始數據包括所述終端采集得到的地址數據;
通過預置的日志分析器對所述原始數據進行分析,得到基礎數據,所述基礎數據為結構化的數據;
調用預置的特征提取器讀取所述基礎數據,并對所述基礎數據進行特征提取,生成中間數據;
基于預置的標簽規則庫,確定所述中間數據對應的標簽,得到目標數據,所述預置的標簽規則庫為地址專有特征標簽庫;
調用預置的地址畫像生成器對所述目標數據進行處理,生成多維度地址畫像,并將所述多維度地址畫像發送至所述終端。
2.根據權利要求1所述的地址畫像的生成方法,其特征在于,所述調用預置的地址畫像生成器對所述目標數據進行處理,生成多維度地址畫像,并將所述多維度地址畫像發送至所述終端包括:
調用預置的地址畫像生成器讀取所述目標數據;
基于預置的地址畫像生成器,將所述目標數據輸入決策樹模型中,得到最終數據;
基于所述最終數據生成多維度地址畫像,所述多維度地址畫像包括地址描述維度、樓盤信息維度、便利性維度和人口維度;
將所述多維度地址畫像發送至所述終端。
3.根據權利要求2所述的地址畫像的生成方法,其特征在于,所述基于預置的地址畫像生成器,將所述目標數據輸入決策樹模型中,得到最終數據包括:
從根結點開始,對所述根結點計算所述目標數據的特征信息增益,選擇信息增益最大的特征作為結點特征;
基于所述結點特征建立子結點,將所述子結點按照遞歸的方式劃分,生成決策樹模型;
對所述決策樹模型進行剪枝處理,得到剪枝后的決策樹模型;
將所述目標數據輸入所述剪枝后的決策樹模型,得到最終數據。
4.根據權利要求2所述的地址畫像的生成方法,其特征在于,所述基于所述最終數據生成多維度地址畫像,所述多維度地址畫像包括地址描述維度、樓盤信息維度、便利性維度和人口維度包括:
將所述最終數據按照預置的四個維度進行劃分,得到四個維度數據集,所述預置的四個維度包括地址描述、樓盤信息、便利性和人口,其中,所述地址描述包括五級地址、區劃、地址組成、坐標、三段碼和地址標簽,所述樓盤信息包括基本信息、價格信息、樓盤詳情和樓盤類型,所述便利性包括吃住、交通、娛樂、商務辦公、學校和服務,所述人口包括基本特征、重點監控和重點服務人群;
基于所述四個維度數據集生成多維度平臺畫像。
5.根據權利要求1所述的地址畫像的生成方法,其特征在于,所述通過預置的日志分析器對所述原始數據進行分析,得到基礎數據,所述基礎數據為結構化的數據包括:
調用預置的日志分析器讀取所述原始數據;
對所述原始數據進行特征字符分析和數據過濾處理,得到結構化的基礎數據;
將所述基礎數據傳輸到預置的消息隊列。
6.根據權利要求1所述的地址畫像的生成方法,其特征在于,所述調用預置的特征提取器讀取所述基礎數據,并對所述基礎數據進行特征提取,生成中間數據包括:
調用預置的特征提取器,讀取所述基礎數據;
對所述基礎數據進行歸一化處理,得到標準數據;
基于預置的線性判別分析LDA算法對所述標準數據進行降維處理,生成中間數據。
7.根據權利要求1-6中任意一項所述的地址畫像的生成方法,其特征在于,所述基于預置的標簽規則庫,確定所述中間數據對應的標簽,得到目標數據,所述預置的標簽規則庫為地址專有特征標簽庫包括:
從預置的標簽規則庫獲取預置的標簽,所述預置的標簽規則庫為地址專有特征標簽庫;
按照預置的標簽匹配規則,將所述中間數據與所述預置的標簽進行匹配,確定所述中間數據對應的標簽;
對所述中間數據對應的標簽中的敏感信息進行脫敏處理,得到目標數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海東普信息科技有限公司,未經上海東普信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010947614.6/1.html,轉載請聲明來源鉆瓜專利網。





