[發明專利]一種基于深度學習的菜譜推薦方法在審
| 申請號: | 201710915536.X | 申請日: | 2017-09-30 |
| 公開(公告)號: | CN107665254A | 公開(公告)日: | 2018-02-06 |
| 發明(設計)人: | 王心茹;王藝淳;于治樓 | 申請(專利權)人: | 濟南浪潮高新科技投資發展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06K9/62;G06N3/04 |
| 代理公司: | 濟南信達專利事務所有限公司37100 | 代理人: | 孟峣 |
| 地址: | 250100 山東省濟南市*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 菜譜 推薦 方法 | ||
技術領域
本發明涉及計算機應用技術領域,具體地說是一種基于深度學習的菜譜推薦方法。
背景技術
“民以食為天”,健康美味的飲食是積極生活方式中必不可少的一環,越來越受到大眾矚目。在這樣的大背景下,專注于美食的網站和手機應用如雨后春筍般出現,它們提供有版權的實用菜譜和飲食知識,倡導在家烹飪的生活方式,為美食愛好者搭建記錄、分享的平臺。然而,用戶在海量的菜譜信息中往往感到無所適從,對個性化推薦的需求日趨強烈。
現有的推薦算法有兩種應用最為廣泛:
基于內容的過濾(content-basedfiltering):“以物為本”的推薦。通過比較用戶的喜好特征向量和候選產品的內容特征向量,為用戶推薦相關性最大的一組產品。優點是保證了用戶之間的獨立性,但項目的特征抽取一般存在困難,且無法挖掘用戶的潛在興趣。
協同過濾(collaborativefiltering):“以人為本”的推薦。利用與用戶有相似行為和喜好的其他用戶的喜好,來推薦用戶感興趣的信息。協同過濾充分利用了大數據和群體信息,但存在冷啟動的問題。
目前美食互聯網產品的個性化推薦功能尚存在明顯不足。首先,對于菜譜的特征提取僵化、不完備,在基于內容的推薦上容易忽略用戶個人口味、營養需求等信息;其次,與其他音樂、社區、電子商務等應用相比,美食應用的用戶數據較少,因而根據群體信息進行協同過濾推薦也存在偏差。基于此,本發明提出運用深度神經網絡(DNN),尤其是在NLP中應用較廣的卷積神經網絡(CNN)或遞歸神經網絡(RNN),對菜譜進行全面的風味分析和特征提取方法,將基于內容的過濾和協同過濾充分結合,為用戶提供先進的個性化菜品推薦功能。
發明內容
本發明的技術任務是針對以上不足之處,提供一種基于深度學習的菜譜推薦方法。
一種基于深度學習的菜譜推薦方法,其實現過程為:
S1、首先將菜譜的文本結構進行統一;
S2、對菜譜文本進行數據預處理;
S3、訓練DNN分類器,對經過預處理的菜譜數據進行特征提取;
S4、對提取的特征進行過濾后,對菜譜進行推薦。
在步驟S1中,菜譜的文本結構統一是指通過深度神經網絡對菜譜文本進行多維度特征分類。
步驟S2中對菜譜文本進行數據預處理的過程為:
用結巴中文分詞庫對菜譜文本進行實詞分詞;
用word2vec工具包生成每個詞語的詞向量。
所述步驟S3的過程為:
首先設計網絡結構,該網絡結構采用深度神經網絡;
對深度神經網絡的輸出結果進行統計量化;
通過深度神經網絡中的類型和維度,生成菜譜訓練集和驗證集,訓練該深度神經網絡;
訓練完成之后,得到一個可以對菜譜進行分類的深度神經網絡模型,輸入菜譜文本序列,輸出菜譜分類子維度的概率分布,對概率分布進行重新量化后得到菜譜的特征向量。
所述深度神經網絡采用DNN結構是卷積神經網絡,該卷積神經網絡的結構包括:
輸入層,輸入層是一個n×k維的句子矩陣,即每個句子有n個實詞,向量的維數為k;且步驟S2中已生成用詞向量表示的菜譜文本序列,如果輸入層有兩個通道,則一個作為靜態矩陣,一個作為動態矩陣,對于未登錄詞的詞向量,用0或隨機小的正數填充;
卷積層,輸入層通過卷積操作得到若干列數為1的featuremap,卷積窗口大小為h×k,其中h表示縱向詞語的個數;
池化層,提取每個featuremap中的最大值,輸出一個一維列向量;
全連接softmax輸出層,池化層的一維列向量的輸出通過全連接的方式連接一個softmax 層,Softmax神經元的數目由菜譜分類維度總數決定。
訓練深度神經網絡通過以下方式實現:首先選取激勵函數和目標函數,預制精度值,激勵函數采用ReLu和擬對數函數,目標函數使用交叉熵損失函數,采用小批量隨機梯度下降法使目標函數最小化,采用dropout方法和正則化限制過度擬合,達到預定精度后停止訓練。
步驟S4中,通過分類器對所有預處理的菜譜特征抽取后,形成菜譜的特征向量,然后根據菜譜的特征向量和用戶的行為興趣向量,進行基于內容的過濾和協同過濾,對用戶進行菜單推薦。
所述基于內容的過濾是指,利用提取的特征值組成的向量,計算目標菜譜i和該用戶已收藏菜譜的相似度,根據相似度將所有目標菜譜排序,選取排名靠前的k個菜譜進行推薦。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于濟南浪潮高新科技投資發展有限公司,未經濟南浪潮高新科技投資發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710915536.X/2.html,轉載請聲明來源鉆瓜專利網。





