[發(fā)明專利]用戶年齡信息預(yù)測方法、裝置、電子設(shè)備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202010425817.9 | 申請日: | 2020-05-19 |
| 公開(公告)號: | CN111639966A | 公開(公告)日: | 2020-09-08 |
| 發(fā)明(設(shè)計(jì))人: | 許文龍 | 申請(專利權(quán))人: | 上海連尚網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q50/00;G06F16/9535;G06F40/289 |
| 代理公司: | 北京辰權(quán)知識產(chǎn)權(quán)代理有限公司 11619 | 代理人: | 付婧 |
| 地址: | 201306 上海市浦東*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用戶 年齡 信息 預(yù)測 方法 裝置 電子設(shè)備 介質(zhì) | ||
1.一種用戶年齡信息預(yù)測方法,其特征在于,包括:
獲得第一用戶的第一標(biāo)注信息;
對所述第一用戶的第一標(biāo)注信息進(jìn)行歸類操作,獲得所述第一用戶的第二標(biāo)注信息;
根據(jù)所述第二標(biāo)注信息,確定所述第一用戶對應(yīng)的至少一個(gè)年齡特征標(biāo)簽;
在預(yù)設(shè)的年齡概率分布信息集合中,查詢每個(gè)所述年齡特征標(biāo)簽分別對應(yīng)的年齡概率分布信息,所述年齡概率分布信息包括所述年齡特征標(biāo)簽對應(yīng)在各個(gè)年齡段的分布概率;
基于所述第一用戶對應(yīng)的至少一個(gè)所述年齡特征標(biāo)簽及對應(yīng)年齡概率分布信息進(jìn)行年齡偏向加權(quán)計(jì)算,預(yù)測所述第一用戶所處的年齡段。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲得第一用戶的第一標(biāo)注信息,包括:
獲取第一用戶的社交賬號在第二用戶通訊錄中的至少一條自定義標(biāo)注信息;
對獲取的所述自定義標(biāo)注信息進(jìn)行精確標(biāo)注的去重操作,獲得所述第一用戶的第一標(biāo)注信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對獲取的所述自定義標(biāo)注信息進(jìn)行精確標(biāo)注的去重操作,獲得所述第一用戶的第一標(biāo)注信息,包括:
對獲取的所述自定義標(biāo)注信息進(jìn)行分詞處理,得到多個(gè)標(biāo)注分詞;
根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則,對所述多個(gè)標(biāo)注分詞進(jìn)行數(shù)據(jù)清洗,得到所述第一用戶對應(yīng)的標(biāo)準(zhǔn)標(biāo)注分詞;
對所述標(biāo)準(zhǔn)標(biāo)注分詞進(jìn)行去重操作,獲得所述第一用戶的第一標(biāo)注信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述在預(yù)設(shè)的年齡概率分布信息集合中,查詢每個(gè)所述年齡特征標(biāo)簽分別對應(yīng)的年齡概率分布信息之前,還包括:
獲得樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括多個(gè)樣本用戶的社交賬號在其他用戶通訊錄中的自定義標(biāo)注信息,以及所述多個(gè)樣本用戶的實(shí)際年齡信息;
根據(jù)所述自定義標(biāo)注信息確定每個(gè)所述樣本用戶對應(yīng)的年齡特征標(biāo)簽;
根據(jù)所有所述樣本用戶的實(shí)際年齡信息與所述年齡特征標(biāo)簽之間的對應(yīng)關(guān)系,生成年齡概率分布信息集合,所述年齡概率信息集合包括每個(gè)所述年齡特征標(biāo)簽對應(yīng)的年齡概率分布信息。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述自定義標(biāo)注信息確定每個(gè)所述樣本用戶對應(yīng)的年齡特征標(biāo)簽,包括:
對每個(gè)所述樣本用戶對應(yīng)的所述自定義標(biāo)注信息進(jìn)行分詞處理,得到多個(gè)標(biāo)注分詞;
根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則,對所述多個(gè)標(biāo)注分詞進(jìn)行數(shù)據(jù)清洗,得到每個(gè)所述樣本用戶對應(yīng)的標(biāo)準(zhǔn)標(biāo)注分詞;
對所述標(biāo)準(zhǔn)標(biāo)注分詞進(jìn)行去重操作,獲得每個(gè)所述樣本用戶對應(yīng)的第一標(biāo)注信息;
對每個(gè)所述樣本用戶對應(yīng)的第一標(biāo)注信息進(jìn)行歸類操作,獲得每個(gè)所述樣本用戶對應(yīng)的第二標(biāo)注信息;
基于預(yù)設(shè)的第二標(biāo)注信息與年齡特征標(biāo)簽之間的映射關(guān)系,根據(jù)每個(gè)所述樣本用戶對應(yīng)的所述第二標(biāo)注信息確定每個(gè)所述樣本用戶對應(yīng)的年齡特征標(biāo)簽。
6.根據(jù)權(quán)利要求3或5所述的方法,其特征在于,所述根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則,對所述多個(gè)標(biāo)注分詞進(jìn)行數(shù)據(jù)清洗,包括以下至少一項(xiàng):
針對屬于家庭稱謂分詞的標(biāo)注分詞,將所述標(biāo)注分詞替換為標(biāo)準(zhǔn)家庭稱謂分詞;
針對屬于職業(yè)稱謂分詞的標(biāo)注分詞,將所述標(biāo)注分詞替換為標(biāo)準(zhǔn)職業(yè)稱謂分詞;
針對不屬于家庭稱謂分詞和職業(yè)稱謂分詞的標(biāo)注分詞,采用詞頻-逆文檔頻率算法計(jì)算每個(gè)所述標(biāo)注分詞的重要度,并根據(jù)每個(gè)所述標(biāo)注分詞的重要度,篩選出重要度靠前的指定數(shù)量的標(biāo)注分詞作為自定義標(biāo)注分詞。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所有所述樣本用戶的實(shí)際年齡信息與所述年齡特征標(biāo)簽之間的對應(yīng)關(guān)系,生成年齡概率分布信息集合,包括:
根據(jù)所有所述樣本用戶的實(shí)際年齡信息與所述年齡特征標(biāo)簽之間的對應(yīng)關(guān)系,計(jì)算每個(gè)所述年齡特征標(biāo)簽對應(yīng)在各個(gè)年齡段的分布概率;
根據(jù)所述每個(gè)所述年齡特征標(biāo)簽對應(yīng)在各個(gè)年齡段的分布概率,生成每個(gè)所述年齡特征標(biāo)簽對應(yīng)的年齡概率分布信息;
根據(jù)所有所述年齡特征標(biāo)簽對應(yīng)的年齡概率分布信息,生成年齡概率分布信息集合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海連尚網(wǎng)絡(luò)科技有限公司,未經(jīng)上海連尚網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010425817.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購物或電子商務(wù)
G06Q30-02 .行銷,例如,市場研究與分析、調(diào)查、促銷、廣告、買方剖析研究、客戶管理或獎(jiǎng)勵(lì);價(jià)格評估或確定
G06Q30-04 .簽單或開發(fā)票
G06Q30-06 .購買、出售或租賃交易
G06Q30-08 ..拍賣
- 基于海量數(shù)據(jù)的用戶年齡估算方法及系統(tǒng)
- 年齡估計(jì)裝置、年齡估計(jì)方法和年齡估計(jì)程序
- 一種人臉圖像的年齡預(yù)測方法及裝置
- 年齡識別模型的訓(xùn)練方法、年齡識別方法及相關(guān)設(shè)備
- 一種年齡識別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于年齡編輯的年齡估計(jì)方法
- 年齡預(yù)測模型的訓(xùn)練方法及裝置、年齡預(yù)測方法及裝置
- 年齡估計(jì)方法、年齡估計(jì)模型的訓(xùn)練方法及裝置
- 基于人臉圖像的年齡判斷方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)
- 年齡識別模型的訓(xùn)練、年齡識別方法、裝置及電子設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





