[發(fā)明專利]一種移動終端用戶性別的預測方法、服務器和系統有效
| 申請?zhí)枺?/td> | 201611089521.4 | 申請日: | 2016-11-30 |
| 公開(公告)號: | CN106776925B | 公開(公告)日: | 2020-07-14 |
| 發(fā)明(設計)人: | 路瑤;張夏天 | 申請(專利權)人: | 騰云天宇科技(北京)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/906;G06K9/62 |
| 代理公司: | 北京思睿峰知識產權代理有限公司 11396 | 代理人: | 謝建云;趙愛軍 |
| 地址: | 100027 北京市東城區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 移動 終端 用戶 性別 預測 方法 服務器 系統 | ||
1.一種移動終端用戶性別的預測方法,適于在服務器中執(zhí)行,所述服務器中預先存儲有多個移動終端的第一設備信息作為第一模型樣本A1,并根據該第一設備信息創(chuàng)建了用于預測移動終端用戶性別的分類模型,該方法包括:
步驟1:收集多個待測移動終端的第二設備信息作為整體待測樣本B,并從中選取一部分作為第一待測樣本B1;
步驟2:將所述第一模型樣本A1和第一待測樣本B1進行聚類,并從聚類結果中選出所述第一模型樣本A1的移動終端數目占比在一定范圍的類,使選出的類中兩種樣本均勻分布;
步驟3:從所選出的類中取出第一模型子樣本A11和第一待測子樣本B11,并從所述第一模型子樣本A11中分別選取一部分樣本作為訓練樣本和校驗樣本,對構建好的分類模型進行訓練和校驗,所述校驗樣本能夠得到所述第一模型子樣本A11的性別預測準確度,該性別預測準確度近似作為所述第一待測子樣本B11的性別預測準確度;
步驟4:根據所述第一待測子樣本B11的第二設備信息及訓練好的分類模型,預測得到該第一待測子樣本B11中每個移動終端的用戶性別;
步驟5:若所述第一模型子樣本A11的性別預測準確度小于第五閾值,則將該第一待測子樣本B11繼續(xù)保留在整體待測樣本B中,反之則將已經預測過用戶性別的第一待測子樣本B11從整體待測樣本B中剔除,并將其加入到所述第一模型樣本A1中,得到第二模型樣本A2;
步驟6:從剔除了第一待測子樣本B11后的整體待測樣本B中選取第二待測樣本B2;
步驟7:在所述第二模型樣本A2和第二待測樣本B2的基礎上,重復上述步驟2-4,以預測得到第二待測子樣本B22中移動終端的用戶性別;以及
步驟8:重復上述步驟5-7直到處理了整體待測樣本B中的所有移動終端為止;
其中,所述第一模型樣本A1的第一設備信息包括其中每個移動終端的用戶性別和應用信息,所述根據第一模型樣本A1的第一設備信息創(chuàng)建分類模型的方法包括步驟:
通過組合該第一模型樣本A1中每個移動終端的用戶性別和應用信息,生成應用列表;
從所述應用列表中統計每個應用所對應的移動終端的女性用戶數目和男性數目,并計算得到每個應用的性別傾向指數;
將該樣本A1中的所有應用按照性別傾向指數的大小劃分為多個分組,并計算該樣本A1中每個移動終端的應用在各分組內的單組性別維度值;以及
根據所述每個移動終端的用戶性別及其單組性別維度值,構建所述用于預測用戶性別的分類模型。
2.如權利要求1所述的方法,其中,所述構建所述分類模型的步驟包括:
根據所述單組性別維度值計算得到該移動終端的整體性別維度值,所述整體性別維度值包括偏女性維度值和偏男性維度值;以及
根據所述每個移動終端的用戶性別及其整體性別維度值,構建所述分類模型。
3.如權利要求2所述的方法,其中,所述步驟1包括:
計算所述整體待測樣本B中的每個待測移動終端的各個單組性別維度值和整體性別維度值;以及
計算該整體待測樣本B每個待測移動終端的第一置信度和第二置信度,并從該整體待測樣本B中選取第一置信度大于第一閾值且第二置信度大于第二閾值的樣本,作為所述第一待測樣本B1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰云天宇科技(北京)有限公司,未經騰云天宇科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611089521.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:網頁頁面預覽方法及裝置
- 下一篇:改善機器人對話時的應答能力的方法及系統





