[發明專利]一種基于全連接神經網絡實現的移動終端用戶性別預測方法和系統在審
| 申請號: | 202010749181.3 | 申請日: | 2020-07-30 |
| 公開(公告)號: | CN111898738A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 任永亮;李玲;李嘉懿 | 申請(專利權)人: | 北京智能工場科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06N20/00;G06K9/62;G06F40/216 |
| 代理公司: | 北京君莫知識產權代理事務所(普通合伙) 11715 | 代理人: | 王凝 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 連接 神經網絡 實現 移動 終端 用戶 性別 預測 方法 系統 | ||
1.一種移動終端用戶性別預測方法,所述方法基于全連接神經網絡實現,其特征在于,所述方法包括如下步驟:
S1:獲取移動終端樣本數據;
S2:將所述樣本數據進行特征分類,得到連續性特征和離散型特征;
S3:對所述連續性特征和離散型特征分別進行不同的處理后,采用one-shot編碼表示,得到one-shot樣本特征;
S4:將所有one-hot樣本特征進行Embedding映射;
S5:基于Embedding映射后的樣本特征構建全連接神經網絡模型并進行訓練;
S6:采用訓練好的全連接神經網絡模型,輸入移動終端用戶特征,預測用戶性別。
2.如權利要求1所述的移動終端用戶性別預測方法,其特征在于:
所述步驟S1中獲取移動終端樣本數據,具體包括:
獲取移動終端安裝包列表、每個安裝包對應的應用類別、移動終端品牌、移動終端品牌下的型號、移動終端屏幕尺寸、移動終端操作系統、移動終端系統版本及該移動終端標注的用戶的性別和年齡段信息。
3.如權利要求1所述的移動終端用戶性別預測方法,其特征在于:
所述步驟S3中對所述連續性特征和離散型特征分別進行不同的處理,具體包括:
對于連續性特征進行分段處理,并進行可視化分析,獲取連續數據段以及離散數據段,將所述相鄰的離散數據段與所述連續數據段之間的第一空值位段、以及相鄰的離散數據段之間的第二空值位段識別出來;
如果所述第一空值位段的數量小于第一閾值,則利用所述離散數據段的眾數填充所述第一空值位段;
如果所述第二空值位段的數量大于第二閾值,則刪除與所述第二空值位段對應的離散數據段。
4.如權利要求3所述的移動終端用戶性別預測方法,其特征在于:
所述步驟S3中對所述連續性特征和離散型特征分別進行不同的處理,具體包括:
將所述分段處理以及可視化分析之后的所述連續性特征進行one-hot表示。
5.如權利要求1或3所述的移動終端用戶性別預測方法,其特征在于:
所述連續性特征包括移動終端屏幕尺寸、移動終端系統版本。
6.如權利要求1所述的移動終端用戶性別預測方法,其特征在于:
所述離散型特征包括移動終端安裝包列表、每個安裝包對應的應用類別、移動終端品牌、移動終端品牌下的型號、移動終端操作系統及該移動終端標注的用戶的性別和年齡段信息。
7.如權利要求6所述的移動終端用戶性別預測方法,其特征在于:
對于所述離散型特征,直接用用one-hot表示。
8.如權利要求1或6所述的移動終端用戶性別預測方法,其特征在于:
所述步驟S4將所有one-hot樣本特征進行Embedding映射,具體包括:
將移動終端安裝包列表轉化為TF-IDF(詞頻-逆文本頻率)矩陣來表示,并對該移動終端安裝包對應的Embedding進行TF-IDF加權平均。
9.如前述任一項權利要求所述的移動終端用戶性別預測方法,其特征在于:
所述全連接神經網絡模型任意相鄰兩層即n-1層任一神經元節點都與n層的所有神經元節點相連,第n層每個神經元節點在進行計算時,其激活函數的輸入值是n-1層所有神經節點的加權。
10.一種包含全連接神經網絡模型的預測系統,用于實現權利要求1-9任一項所述的移動終端用戶性別預測方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智能工場科技有限公司,未經北京智能工場科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010749181.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:九龍山山脈天然礦石窯變釉及其制備方法
- 下一篇:一種燃氣管線泄漏溯源方法





