[發(fā)明專利]基于用戶昵稱的年齡預(yù)測方法、裝置及電子設(shè)備有效
| 申請?zhí)枺?/td> | 202111053027.3 | 申請日: | 2021-09-09 |
| 公開(公告)號: | CN113535885B | 公開(公告)日: | 2022-03-04 |
| 發(fā)明(設(shè)計)人: | 張猛 | 申請(專利權(quán))人: | 北京輕松籌信息技術(shù)有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/33;G06F16/9535;G06F40/247 |
| 代理公司: | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 11463 | 代理人: | 衡滔 |
| 地址: | 100010 北京市東城*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 用戶 昵稱 年齡 預(yù)測 方法 裝置 電子設(shè)備 | ||
1.一種基于用戶昵稱的年齡預(yù)測方法,其特征在于,包括:
獲取第一用戶昵稱;其中,所述第一用戶昵稱為待預(yù)測年齡的用戶的昵稱;
將所述第一用戶昵稱進(jìn)行編碼,生成第一詞向量;
將所述第一詞向量與預(yù)設(shè)的詞向量庫中的每個第二詞向量進(jìn)行相似度計算,確定出目標(biāo)詞向量;其中,所述目標(biāo)詞向量為所述第二詞向量中與所述第一詞向量相似度最高的詞向量;所述第二詞向量通過對第二用戶昵稱進(jìn)行編碼后獲得;所述第二用戶昵稱為真實年齡已知的用戶的昵稱;
基于預(yù)先構(gòu)建的年齡分組集合,確定出所述目標(biāo)詞向量對應(yīng)的第二用戶昵稱的年齡區(qū)間;其中,所述年齡分組集合包括每個所述第二用戶昵稱各自對應(yīng)的年齡區(qū)間;
將所述目標(biāo)詞向量對應(yīng)的第二用戶昵稱的年齡區(qū)間確定為所述第一用戶昵稱的預(yù)測年齡區(qū)間;
其中,所述將所述第一詞向量與預(yù)設(shè)的詞向量庫中的每個第二詞向量進(jìn)行相似度計算,確定出目標(biāo)詞向量,包括:計算所述第一詞向量的范數(shù)以及每個所述第二詞向量的范數(shù);基于所述第一詞向量、所述第二詞向量、所述第一詞向量的范數(shù)、每個所述第二詞向量的范數(shù)以及余弦相似度算法,計算所述第一詞向量與每個所述第二詞向量的余弦相似度;基于所述第一詞向量與每個所述第二詞向量的余弦相似度,確定出所述目標(biāo)詞向量。
2.根據(jù)權(quán)利要求1所述的年齡預(yù)測方法,其特征在于,所述將所述第一用戶昵稱進(jìn)行編碼,生成第一詞向量,包括:
將所述第一用戶昵稱通過Bert編碼方式進(jìn)行編碼,生成第一詞向量;其中,所述第一詞向量為1*768的數(shù)組;
相應(yīng)的,所述第二詞向量為所述第二用戶昵稱通過Bert編碼方式進(jìn)行編碼獲得的,所述第二詞向量為1*768的數(shù)組。
3.根據(jù)權(quán)利要求1所述的年齡預(yù)測方法,其特征在于,所述將所述第一詞向量與預(yù)設(shè)的詞向量庫中的每個第二詞向量進(jìn)行相似度計算,確定出目標(biāo)詞向量,包括:
基于歐式距離算法,計算所述第一詞向量與每個所述第二詞向量的相似度;
基于所述第一詞向量與每個所述第二詞向量的相似度,確定出所述目標(biāo)詞向量。
4.根據(jù)權(quán)利要求1所述的年齡預(yù)測方法,其特征在于,每個所述第二用戶昵稱包括唯一的索引標(biāo)識;每個所述第二用戶昵稱與自身通過編碼后獲得的第二詞向量具有相同的索引標(biāo)識;
所述基于預(yù)先構(gòu)建的年齡分組集合,確定出所述目標(biāo)詞向量對應(yīng)的第二用戶昵稱的年齡區(qū)間,包括:
基于所述目標(biāo)詞向量的索引標(biāo)識,確定出與所述目標(biāo)詞向量具有相同索引標(biāo)識的第二用戶昵稱;
從所述年齡分組集合確定出與所述目標(biāo)詞向量具有相同索引標(biāo)識的第二用戶昵稱的年齡區(qū)間。
5.根據(jù)權(quán)利要求1所述的年齡預(yù)測方法,其特征在于,所述年齡分組集合的構(gòu)建步驟包括:
獲取所述第二用戶昵稱;
基于預(yù)先劃分的年齡區(qū)間,將所述第二用戶昵稱基于各自對應(yīng)的真實年齡進(jìn)行歸類;
統(tǒng)計每個年齡區(qū)間中,相同的第二用戶昵稱出現(xiàn)的次數(shù);
當(dāng)相同的第二用戶昵稱同時出現(xiàn)在不同的年齡區(qū)間時,將出現(xiàn)次數(shù)多的年齡區(qū)間作為該第二用戶昵稱的年齡區(qū)間;
將每個年齡區(qū)間中重復(fù)的第二用戶昵稱進(jìn)行去重處理,生成所述年齡分組集合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京輕松籌信息技術(shù)有限公司,未經(jīng)北京輕松籌信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111053027.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





