[發(fā)明專利]優(yōu)化特征數(shù)據(jù)提取的方法及其相關(guān)產(chǎn)品在審
| 申請?zhí)枺?/td> | 202011501057.1 | 申請日: | 2020-12-17 |
| 公開(公告)號: | CN112579843A | 公開(公告)日: | 2021-03-30 |
| 發(fā)明(設(shè)計)人: | 陳依云 | 申請(專利權(quán))人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F16/9035 | 分類號: | G06F16/9035;G06F16/9038;G06F16/906;G06K9/62;G06N3/08 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 熊永強 |
| 地址: | 518000 廣東省深圳市福田區(qū)益田路5033號*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 優(yōu)化 特征 數(shù)據(jù) 提取 方法 及其 相關(guān) 產(chǎn)品 | ||
本申請實施例公開了一種優(yōu)化特征數(shù)據(jù)提取的方法及其相關(guān)產(chǎn)品,所述方法包括:獲取多個第一特征數(shù)據(jù);將多個第一特征數(shù)據(jù)進行分組,得到多個第一特征數(shù)據(jù)集;計算多個第一特征數(shù)據(jù)集中每個第一特征數(shù)據(jù)集中每兩第一特征數(shù)據(jù)之間的相關(guān)度,得到多個相關(guān)度;根據(jù)多個相關(guān)度對每個第一特征數(shù)據(jù)集中的第一特征數(shù)據(jù)進行排序,得到第一有序數(shù)據(jù)集;將第一有序數(shù)據(jù)集輸入到預(yù)選訓(xùn)練好的第一特征提取模型,得到第二有序數(shù)據(jù)集;將第二有序數(shù)據(jù)集輸入預(yù)先訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型,得到目標數(shù)據(jù)。本申請實施例將多個特征數(shù)據(jù)進行分組、排序,再將排好的特征數(shù)據(jù)依次輸入特征提取模型、神經(jīng)網(wǎng)絡(luò)模型,減少特征提取模型對特征數(shù)據(jù)的處理時長,提高轉(zhuǎn)換率預(yù)測效率。
技術(shù)領(lǐng)域
本申請涉及計算機技術(shù)領(lǐng)域,尤其涉及一種優(yōu)化特征數(shù)據(jù)提取的方法及其相關(guān)產(chǎn)品。
背景技術(shù)
隨著科技的發(fā)展,人們每天接受的信息越來越多,個性化推薦系統(tǒng)可以有效的向用戶提供個性化的決策支持。個性化推薦系統(tǒng)是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的一種智能平臺。而轉(zhuǎn)化率預(yù)測是推薦系統(tǒng)中的一項重要任務(wù),旨在估算用戶購買給定項目的概率。目前的轉(zhuǎn)化率預(yù)測是通過用戶數(shù)據(jù)之間的相關(guān)度向用戶推送相關(guān)的內(nèi)容。
近年來已經(jīng)提出了許多排序(Rank)模型(WDL,AFN,xDeepFM等)可以從原始特征中學(xué)習(xí)低階和高階交互特征。對于大數(shù)據(jù)團隊建模應(yīng)用平臺來說,在完整的深度學(xué)習(xí)Rank推薦框架中,對于不同的場景,需要構(gòu)造很多不同的特征,所以如何利用Rank模型提高轉(zhuǎn)化率預(yù)測效率是十分有必要的。
發(fā)明內(nèi)容
本申請實施例的主要目的在于提供一種優(yōu)化特征數(shù)據(jù)提取的方法及其相關(guān)產(chǎn)品,能夠有效地進一步提高轉(zhuǎn)化率預(yù)測效率。
第一方面,本申請實施例提供了一種優(yōu)化特征數(shù)據(jù)提取的方法,應(yīng)用于電子設(shè)備,所述方法包括:
獲取多個第一特征數(shù)據(jù);
將所述多個第一特征數(shù)據(jù)進行分組,得到多個第一特征數(shù)據(jù)集;
計算所述多個第一特征數(shù)據(jù)集中每個第一特征數(shù)據(jù)集中每兩第一特征數(shù)據(jù)之間的相關(guān)度,得到多個相關(guān)度;
根據(jù)所述多個相關(guān)度對所述每個第一特征數(shù)據(jù)集中的第一特征數(shù)據(jù)進行排序,得到第一有序數(shù)據(jù)集;
根據(jù)所述第一有序數(shù)據(jù)集和預(yù)先訓(xùn)練好的第一特征提取模型,確定第二有序數(shù)據(jù)集,所述第二有序數(shù)據(jù)集與所述第一有序數(shù)據(jù)集對應(yīng);
將所述第二有序數(shù)據(jù)集輸入預(yù)先訓(xùn)練好的第二神經(jīng)網(wǎng)絡(luò)模型,得到目標數(shù)據(jù)。
可選的,所述將所述多個第一特征數(shù)據(jù)進行分組,得到多個第一特征數(shù)據(jù)集,包括:根據(jù)聚類分析算法,將所述多個第一特征數(shù)據(jù)進行分組,得到所述多個第一特征數(shù)據(jù)集。
可選的,所述聚類分析算法包括K均值聚類(kmeans)聚類算法;所述根據(jù)聚類分析算法,將所述多個第一特征數(shù)據(jù)進行分組,得到所述多個第一特征數(shù)據(jù)集,包括:根據(jù)kmeans聚類方法計算所述多個第一特征數(shù)據(jù)的特征之間的相似性;根據(jù)所述特征之間的相似性對所述多個第一特征數(shù)據(jù)進行分組,得到所述多個第一特征數(shù)據(jù)集。
可選的,所述根據(jù)所述多個相關(guān)度對所述每個第一特征數(shù)據(jù)集中的第一特征數(shù)據(jù)進行排序,得到第一有序數(shù)據(jù)集,包括:根據(jù)所述多個相關(guān)度,對所述每個第一特征數(shù)據(jù)集中的第一特征數(shù)據(jù)進行降序排序,得到所述第一有序數(shù)據(jù)集。
可選的,所述根據(jù)所述第一有序數(shù)據(jù)集和訓(xùn)練好的第一特征提取模型,確定第二有序數(shù)據(jù)集,包括:將所述第一有序數(shù)據(jù)集中的第一特征數(shù)據(jù),轉(zhuǎn)換成預(yù)處理矩陣;將所述預(yù)處理矩陣輸入到特征金字塔網(wǎng)絡(luò)模型中,得到所述第二有序數(shù)據(jù)集,其中,所述特征金字塔網(wǎng)絡(luò)模型為所述預(yù)訓(xùn)練好的第一特征提取模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國平安人壽保險股份有限公司,未經(jīng)中國平安人壽保險股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011501057.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





