[發(fā)明專利]一種基于神經(jīng)網(wǎng)絡(luò)的推薦方法有效
| 申請?zhí)枺?/td> | 201811215216.4 | 申請日: | 2018-10-18 |
| 公開(公告)號: | CN109447698B | 公開(公告)日: | 2021-01-29 |
| 發(fā)明(設(shè)計)人: | 周曦;張竹昕 | 申請(專利權(quán))人: | 廣州云從人工智能技術(shù)有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 上海光華專利事務(wù)所(普通合伙) 31219 | 代理人: | 尹麗云 |
| 地址: | 511457 廣東省廣州市南沙區(qū)豐澤*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 神經(jīng)網(wǎng)絡(luò) 推薦 方法 | ||
一種基于神經(jīng)網(wǎng)絡(luò)的推薦方法,采用以下步驟,S1:從底層模塊中提取結(jié)構(gòu)化數(shù)據(jù),將結(jié)構(gòu)化數(shù)據(jù)添加到數(shù)據(jù)集中,將數(shù)據(jù)集中用戶信息輸入到用戶處理模塊,將數(shù)據(jù)集中商業(yè)信息輸入到廣告處理模塊;S2:對數(shù)據(jù)集中的特征進(jìn)行清洗,對于數(shù)據(jù)集中含有的缺失值,可以根據(jù)缺失的具體的類型使用均值填充、眾數(shù)填充、隨機森林填充、猜測矩陣填充方式,將缺失值補齊;對于缺失比例超過30%的特征予以剔除,用箱型圖和統(tǒng)計學(xué)異常值判斷的方法剔除異常值并填補正常值。針對某大數(shù)據(jù)應(yīng)用場景,多級異構(gòu)深度大數(shù)據(jù)神經(jīng)網(wǎng)絡(luò)的第一級神經(jīng)網(wǎng)絡(luò),在AI建模完成后,對大數(shù)據(jù)進(jìn)行多維度融合和挖掘,其輸出結(jié)果代表了神經(jīng)網(wǎng)絡(luò)對該應(yīng)用場景的判斷。
技術(shù)領(lǐng)域
本發(fā)明涉及機器學(xué)習(xí)領(lǐng)域,具體涉及一種基于神經(jīng)網(wǎng)絡(luò)的推薦方法。
背景技術(shù)
大多數(shù)廣告推薦用的協(xié)同過濾技術(shù),通過相似用戶聚類的方法給剩余的用戶匹配相似客戶,在根據(jù)這個相似客戶推薦可能喜愛的產(chǎn)品。
此種技術(shù)的缺點是:1.無法利用交叉利用多重特征;2.必須要有初始的打分項;3.通過相似用戶的判斷到喜愛產(chǎn)品的推薦,誤差較大;4.學(xué)習(xí)深度不夠,無法深度挖掘客戶和產(chǎn)品之間的內(nèi)在聯(lián)系。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術(shù)的不足,提出一種基于神經(jīng)網(wǎng)絡(luò)的推薦方法,具體技術(shù)方案如下:
一種基于神經(jīng)網(wǎng)絡(luò)的推薦方法,其特征在于:
采用以下步驟,
S1:從底層模塊中提取結(jié)構(gòu)化數(shù)據(jù),將結(jié)構(gòu)化數(shù)據(jù)添加到數(shù)據(jù)集中,將數(shù)據(jù)集中用戶信息輸入到用戶處理模塊,將數(shù)據(jù)集中商業(yè)信息輸入到廣告處理模塊;
S2:對數(shù)據(jù)集中的特征進(jìn)行清洗,對于數(shù)據(jù)集中含有的缺失值,可以根據(jù)缺失的具體的類型使用均值填充、眾數(shù)填充、隨機森林填充、猜測矩陣填充方式,將缺失值補齊;
對于缺失比例超過30%的特征予以剔除,用箱型圖和統(tǒng)計學(xué)異常值判斷的方法剔除異常值并填補正常值;
S3:對特征進(jìn)行判斷,如果特征是連續(xù)型的稱之為密集特征,則按照步驟S4處理,如果特征是離散型的,則按照步驟S5處理;
S4:直接歸一化后放入神經(jīng)網(wǎng)絡(luò)或者用分箱操作將特征進(jìn)行分類,轉(zhuǎn)化為離散型特征;
S5:采用獨熱編碼的方式使這些特征變成稀疏特征,利用神經(jīng)網(wǎng)絡(luò)進(jìn)行特征重組,使特征維度增加;
S6:采用訓(xùn)練集訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,根據(jù)用戶曾經(jīng)消費最多的商戶給訓(xùn)練數(shù)據(jù)的用戶打標(biāo)簽,作為訓(xùn)練集的目標(biāo)集;
訓(xùn)練集為用戶或商戶的各項特征,目標(biāo)集為用戶和商戶的標(biāo)簽;
設(shè)置神經(jīng)網(wǎng)絡(luò)的參數(shù),包括神經(jīng)網(wǎng)絡(luò)的層數(shù)、激勵函數(shù)和每一層產(chǎn)生的節(jié)點;
將重組后的特征作為輸入,輸入設(shè)置好維度的神經(jīng)網(wǎng)絡(luò)張量中,得到用戶和用戶標(biāo)簽的匹配;
S7:采用混淆矩陣對訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行評估,計算每個標(biāo)簽的精準(zhǔn)度和召回率,并且得到AUC值,判斷神經(jīng)網(wǎng)絡(luò)模型是否能準(zhǔn)確評估客戶和商戶的標(biāo)簽;
S8:對特征向量提取,最后的特征處理成為一個embedding層,embedding層定義為從一個矩陣中選擇一行,一行對應(yīng)著一個離散的新的特征,將兩個神經(jīng)網(wǎng)絡(luò)模型的低維向量提取之后,進(jìn)行存儲;
S9:對點乘進(jìn)行評估,將用戶處理模塊對應(yīng)的輸出向量和廣告處理模塊對應(yīng)的輸出向量兩兩點乘,得到其在向量空間中的大小,點乘的最終向量大小與客戶和廣告的匹配度為正相關(guān);
S10:針對每一個客戶,對應(yīng)生成一個由點乘向量組成的目標(biāo)向量集合,對目標(biāo)向量集合內(nèi)的點乘向量按從大到小進(jìn)行排序,按照從大到小的順序選取前x個點乘向量給用戶做推薦,x為正整數(shù),且x>1。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州云從人工智能技術(shù)有限公司,未經(jīng)廣州云從人工智能技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811215216.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





