[發(fā)明專利]一種基于雙向長短期記憶網絡顯式信息耦合分析的推薦方法在審
| 申請?zhí)枺?/td> | 202011147322.0 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN112256859A | 公開(公告)日: | 2021-01-22 |
| 發(fā)明(設計)人: | 張全貴;王天昊;李鑫 | 申請(專利權)人: | 遼寧工程技術大學 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/9535;G06F16/9536;G06N3/04 |
| 代理公司: | 北京華夏正合知識產權代理事務所(普通合伙) 11017 | 代理人: | 韓登營 |
| 地址: | 123000 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 雙向 短期 記憶 網絡 信息 耦合 分析 推薦 方法 | ||
本發(fā)明公開了一種基于雙向長短期記憶網絡顯式信息耦合分析的推薦方法,包括數據采集和處理、劃分數據集、構建耦合模型、訓練模型和項目推薦。本發(fā)明通過分析用戶及項目相關的顯式短文本信息之間微觀的耦合關系,將BiLSTM雙向長短期記憶網絡和Attention注意力機制結合,得到融合了重要上下文信息的顯式文本特征表示,結合隱式特征,從中分析出評論文本信息與用戶主觀情感之間的耦合關系,更好地表達用戶的主觀偏好,并融合用戶/項目特征的顯?隱式耦合關系,為用戶提供更準確的個性化推薦。同時,本發(fā)明采用卷積神經網絡有助于更深層次的學習特征間的交互。
技術領域
本發(fā)明屬于自然語言處理及計算機人工智能的技術領域,尤其涉及一種基于雙向長短期記憶網絡顯式信息耦合分析的推薦方法。
背景技術
自然語言處理通常使用預訓練的詞向量來完成后續(xù)的任務,最初的詞向量是通過淺層網絡進行無監(jiān)督訓練得到的,雖然在詞級上表現(xiàn)出不錯的特性,但缺少對連續(xù)文本的內在聯(lián)系和語言特征的表達能力。現(xiàn)如今,評論文本信息逐漸成為推薦系統(tǒng)的重要研究研究依據,而現(xiàn)存的很多推薦系統(tǒng)可解釋性差,并認為用戶和項目是獨立同分布的而忽略了用戶和項目之間的耦合性,同時沒有達到對評論文本的情感分析與非獨立同分布的推薦方法結合。
發(fā)明內容
基于以上現(xiàn)有技術的不足,本發(fā)明所解決的技術問題在于提供一種基于雙向長短期記憶網絡顯式信息耦合分析的推薦方法,具有良好的推薦準確度和可解釋性。
為了解決上述技術問題,本發(fā)明通過以下技術方案來實現(xiàn):本發(fā)明提供一種基于雙向長短期記憶網絡顯式信息耦合分析的推薦方法,包括以下步驟:
S1、數據采集和處理:從亞馬遜下載評論數據集后清理臟數據,合并每個用戶對應的所有項目的評論作為用戶評論文本以及合并所有用戶對項目的評論文本作為項目評論文本;
S2、劃分數據集:將處理好的數據集按8:1:1的比例劃分為訓練集、測試集和驗證集;
S3、構建耦合模型:卷積神經網絡學習用戶/項目顯式-隱式耦合;多層感知器學習用戶特征與項目特征之間的耦合;
S4、訓練模型和項目推薦:步驟S2中所得到的訓練數據集和測試數據集分別用于訓練和評估步驟S3構建的耦合模型,根據用戶對項目的預測評分判斷是否將項目推薦給用戶。
進一步的,所述步驟S1的數據采集和處理的具體步驟如下:
S101、將下載的Json格式的亞馬遜產品評論數據集轉化為Csv格式存儲;
S102、將每個用戶對應的所有項目的評論文本合并作為用戶評論文本,將所有用戶對項目的評論文本合并作為項目評論文本;
S103、刪除每個用戶評論文本低于50個單詞的記錄,清理用戶評論文本中的停止詞,標點符號,數字,頻度小于10的詞。
進一步的,所述步驟S3中構建耦合模型的具體步驟如下:
S301、構建輸入層:輸入層包括四個輸入內容,用戶項目ID和對應的用戶項目評論文本;
S302、構建基于雙向長短期記憶網絡的用戶及項目文本分析學習框架;
S303、構建輸出層:預測用戶對項目的評分。
進一步的,所述步驟S302中構建基于雙向長短期記憶網絡的用戶及項目文本分析學習框架的具體步驟如下:
S302-1、構建向量映射層:將用戶和項目ID通過全連接層轉化為指定維度Embedding的向量,代表用戶/項目的隱式特征向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于遼寧工程技術大學,未經遼寧工程技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011147322.0/2.html,轉載請聲明來源鉆瓜專利網。





