[發明專利]用戶屬性獲取方法及裝置有效
| 申請號: | 201710738930.0 | 申請日: | 2017-08-24 |
| 公開(公告)號: | CN107480289B | 公開(公告)日: | 2020-06-30 |
| 發明(設計)人: | 楊陽;黃秀;楊子豪;沈復民;謝寧;申恒濤 | 申請(專利權)人: | 成都澳海川科技有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F16/583;G06F16/35;G06F40/289;G06K9/62;G06Q50/00 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 王術蘭 |
| 地址: | 610000 四川省成都市高*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 屬性 獲取 方法 裝置 | ||
1.一種用戶屬性獲取方法,應用于一電子設備,其特征在于,所述方法包括:
獲取多個微博中的訓練文本和訓練圖像;
獲得所述訓練文本對應的訓練文本輸入矩陣;
獲得所述訓練圖像對應的訓練圖像矩陣;
基于所述訓練文本輸入矩陣及所述訓練圖像矩陣,獲得訓練集輸入矩陣;
設置泊松伽馬信念網絡的最底層的最大主題數;
基于所述訓練集輸入矩陣,隨機為每個所述訓練文本和所述訓練圖像分配主題,獲得初始化矩陣并生成各概率參數的初始值;
基于所述初始化矩陣及各概率參數的初始值,迭代訓練所述泊松伽馬信念網絡,從所述泊松伽馬信念網絡的最底層到外部當前層逐層向上,均對每一層的多個矩陣值進行采樣,逐層采樣和計算概率參數,從外部當前層到最底層逐層向下,均對每一層的剩余矩陣值進行采樣,當所有層的迭代采樣均完成,獲得所述訓練文本和所述訓練圖像中的主題分布情況;
獲取用戶的微博中的文本和圖像;
獲得所述文本對應的文本輸入矩陣;
獲得所述圖像對應的圖像輸入矩陣;
將所述文本輸入矩陣、所述圖像輸入矩陣與預設的訓練集輸入矩陣進行拼接,獲得總輸入矩陣;
基于所述總輸入矩陣,獲得所述文本和所述圖像中的主題分布情況,以及基于所述主題分布情況,獲取所述用戶的屬性。
2.根據權利要求1所述的方法,其特征在于,獲得所述文本對應的文本輸入矩陣,包括:
對所述文本進行分詞處理并統計詞頻,獲得至少一個分詞,及所述至少一個分詞中每個分詞的詞頻;
基于所述至少一個分詞及每個分詞的詞頻,獲得所述文本對應的文本輸入矩陣。
3.根據權利要求1所述的方法,其特征在于,獲得所述圖像對應的圖像輸入矩陣,包括:
對所述圖像進行sift特征提取,獲得所述圖像對應的第一特征向量并基于所述第一特征向量,獲得所述圖像對應的圖像輸入矩陣。
4.根據權利要求1所述的方法,其特征在于,獲得所述訓練圖像對應的訓練圖像矩陣,包括:
對每個所述訓練圖像進行sift特征提取,獲得每個所述訓練圖像對應的第二特征向量;
基于預設的聚類算法及每個所述訓練圖像對應的第二特征向量,獲得每一類的聚類中心及每一類包含的圖像特征;
統計每個所述訓練圖像包含的所述圖像特征的個數,獲得多個所述訓練圖像對應的訓練圖像矩陣。
5.根據權利要求1所述的方法,其特征在于,基于所述總輸入矩陣,獲得所述文本和所述圖像中的主題分布情況,包括:
初始化泊松伽馬信念網絡的第一網絡參數、第二網絡參數及預設的第三網絡參數;
以所述總輸入矩陣作為泊松伽馬信念網絡的輸入,從所述泊松伽馬信念網絡的最底層到最頂層,逐層采樣,迭代更新所述第一網絡參數、所述第二網絡參數及所述第三網絡參數,直到達到預設的迭代數,獲得所述文本和所述圖像中的主題分布情況。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都澳海川科技有限公司,未經成都澳海川科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710738930.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:合同管理方法和系統
- 下一篇:一種銷售數據的對比方法





