[發(fā)明專(zhuān)利]一種基于深度學(xué)習(xí)的推薦方法在審
| 申請(qǐng)?zhí)枺?/td> | 201911059150.9 | 申請(qǐng)日: | 2019-11-01 |
| 公開(kāi)(公告)號(hào): | CN110929148A | 公開(kāi)(公告)日: | 2020-03-27 |
| 發(fā)明(設(shè)計(jì))人: | 楊勇;黃淑英;方玉明 | 申請(qǐng)(專(zhuān)利權(quán))人: | 楊勇 |
| 主分類(lèi)號(hào): | G06F16/9535 | 分類(lèi)號(hào): | G06F16/9535;G06F40/30;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 北京匯信合知識(shí)產(chǎn)權(quán)代理有限公司 11335 | 代理人: | 張煥響 |
| 地址: | 330036 江西*** | 國(guó)省代碼: | 江西;36 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 推薦 方法 | ||
本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的推薦方法,包括以下步驟:對(duì)推薦項(xiàng)目的內(nèi)容進(jìn)行劃分,將文本信息進(jìn)行文本結(jié)構(gòu)統(tǒng)一;對(duì)內(nèi)容文本進(jìn)行數(shù)據(jù)預(yù)處理,具體包括對(duì)內(nèi)容文本進(jìn)行詞組拆分、語(yǔ)義提取、語(yǔ)義延伸和詞組重組;利用訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)模型對(duì)經(jīng)過(guò)數(shù)據(jù)預(yù)處理的內(nèi)容文本進(jìn)行特征提取;對(duì)提取的特征進(jìn)過(guò)濾處理,然后基于過(guò)濾處理后的特征進(jìn)行內(nèi)容推薦;本發(fā)明通過(guò)對(duì)推薦內(nèi)容的文本信息進(jìn)行多級(jí)處理,能夠?qū)ξ谋拘畔⒌恼Z(yǔ)義內(nèi)容進(jìn)行精確深度獲取,然后利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)深度化的內(nèi)容文本進(jìn)行訓(xùn)練,可以得出最優(yōu)輸出,保證推薦內(nèi)容豐富度和準(zhǔn)確性高。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種基于深度學(xué)習(xí)的推薦方法。
背景技術(shù)
推薦系統(tǒng)是根據(jù)用戶(hù)的信息需求、興趣等,將用戶(hù)感興趣的信息、產(chǎn)品等推薦給用戶(hù)的個(gè)性化信息推薦系統(tǒng)。與搜索引擎相比,推薦系統(tǒng)通過(guò)研究用戶(hù)的興趣偏好,進(jìn)行個(gè)性化計(jì)算,由系統(tǒng)發(fā)現(xiàn)用戶(hù)的興趣點(diǎn),從而引導(dǎo)用戶(hù)發(fā)現(xiàn)自己的信息需求。一個(gè)好的推薦系統(tǒng)不僅能為用戶(hù)提供個(gè)性化的服務(wù),還能和用戶(hù)之間建立密切關(guān)系,讓用戶(hù)對(duì)推薦產(chǎn)生依賴(lài),目前的推薦系統(tǒng)主要分為三類(lèi):基于內(nèi)容的推薦系統(tǒng)、基于協(xié)同過(guò)濾的推薦系統(tǒng)和混合型推薦系統(tǒng);
深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究,含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu),深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象的高層表示屬性類(lèi)別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示;
現(xiàn)有的基于深度學(xué)習(xí)的推薦方法,在過(guò)程中往往只對(duì)主要的幾個(gè)重要信息進(jìn)行提取特征,導(dǎo)致推薦內(nèi)容信息不全面,深層次挖掘和理解推薦項(xiàng)目的文本內(nèi)容信息對(duì)準(zhǔn)確推薦至關(guān)重要,因此,本發(fā)明提出一種基于深度學(xué)習(xí)的推薦方法,以解決現(xiàn)有技術(shù)中的不足之處。
發(fā)明內(nèi)容
針對(duì)上述問(wèn)題,本發(fā)明提出一種基于深度學(xué)習(xí)的推薦方法,通過(guò)對(duì)推薦內(nèi)容的文本信息進(jìn)行多級(jí)處理,能夠?qū)ξ谋拘畔⒌恼Z(yǔ)義內(nèi)容進(jìn)行精確深度獲取,然后利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)深度化的內(nèi)容文本進(jìn)行訓(xùn)練,可以得出最優(yōu)輸出,保證推薦內(nèi)容豐富度和準(zhǔn)確性高。
本發(fā)明提出一種基于深度學(xué)習(xí)的推薦方法,包括以下步驟:
步驟一:對(duì)推薦項(xiàng)目的內(nèi)容進(jìn)行劃分,將文本信息進(jìn)行文本結(jié)構(gòu)統(tǒng)一,形成內(nèi)容文本;
步驟二:對(duì)內(nèi)容文本進(jìn)行數(shù)據(jù)預(yù)處理,具體包括對(duì)內(nèi)容文本進(jìn)行詞組拆分、語(yǔ)義提取、語(yǔ)義延伸和詞組重組;
步驟三:構(gòu)建一個(gè)深度神經(jīng)網(wǎng)絡(luò)模型,并訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型,然后利用訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)模型對(duì)經(jīng)過(guò)數(shù)據(jù)預(yù)處理的內(nèi)容文本進(jìn)行特征提取;
步驟四:對(duì)提取的特征進(jìn)過(guò)濾處理,然后基于過(guò)濾處理后的特征進(jìn)行內(nèi)容推薦。
進(jìn)一步改進(jìn)在于:所述步驟一中對(duì)推薦項(xiàng)目的內(nèi)容進(jìn)行劃分時(shí),具體為將推薦內(nèi)容按照文本信息、圖片內(nèi)容和鏈接三個(gè)類(lèi)別進(jìn)行劃分。
進(jìn)一步改進(jìn)在于:所述步驟一中將文本信息進(jìn)行文本結(jié)構(gòu)統(tǒng)一,形成內(nèi)容文本的具體過(guò)程為:將非結(jié)構(gòu)化和半結(jié)構(gòu)化的文本信息轉(zhuǎn)換成結(jié)構(gòu)化的文本信息,形成內(nèi)容文本,首先選擇文本信息的范圍,然后建立分類(lèi)文本語(yǔ)料庫(kù)訓(xùn)練文本信息。
進(jìn)一步改進(jìn)在于:所述步驟二中對(duì)內(nèi)容文本進(jìn)行數(shù)據(jù)預(yù)處理前,需要先對(duì)內(nèi)容文本進(jìn)行壓縮處理,去除重復(fù)無(wú)用的詞組,具體為:建立兩個(gè)存放字符的列表來(lái)完成,并按照不同情況,將其放入list1或list2列表或觸發(fā)壓縮判斷,若得出重復(fù)則壓縮去除。
進(jìn)一步改進(jìn)在于:所述壓縮去除的規(guī)則為:
如果讀入的當(dāng)前字符與list1的首字符相同,而list2沒(méi)有放入的國(guó)際字符,則將這個(gè)字符放入list2中;
如果讀入的當(dāng)前字符與list1的首字符相同,而list2也有國(guó)際字符,則觸發(fā)壓縮判斷,若得出重復(fù),則進(jìn)行壓縮去除,清空第二個(gè)列表;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于楊勇,未經(jīng)楊勇許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911059150.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。





