[發明專利]雙向語義特征匹配方法及供給內容推薦裝置在審
| 申請號: | 202010135628.8 | 申請日: | 2020-03-02 |
| 公開(公告)號: | CN111368034A | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 劉天弼;馮瑞 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/30;G06K9/62;G06N3/04 |
| 代理公司: | 上海德昭知識產權代理有限公司 31204 | 代理人: | 盧泓宇 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 雙向 語義 特征 匹配 方法 供給 內容 推薦 裝置 | ||
1.一種基于深度神經網絡的雙向語義特征匹配方法,其特征在于,根據用戶信息以及用戶需求匹配供給內容,包括如下步驟:
步驟S1,根據所述供給內容建立含有供給屬性的供給信息模型,并基于該供給信息模型為所有的所述供給內容標注屬性標簽從而形成對應的供給信息向量;
步驟S2,根據所述用戶信息建立用戶信息模型,并基于該用戶信息模型為所有的所述用戶信息標注屬性標簽從而形成對應的用戶信息向量;
步驟S3,分別對所述用戶需求以及所述供給內容進行自然語言分析,從而分別提取預定數量的所述用戶需求的關鍵詞以及所述供給內容的關鍵詞;
步驟S4,根據用戶信息向量、用戶需求的關鍵詞、供給信息模型以及供給內容的關鍵詞建立神經網絡模型;
步驟S5,對步驟S4建立的所述神經網絡模型進行訓練,得到訓練好的所述神經網絡模型作為雙向語義特征匹配模型;
步驟S6,根據用戶新輸入的用戶需求,采用所述雙向語義特征匹配模型進行所述供給內容的匹配,
其中,步驟S4包括如下步驟:
步驟S4-1,將所述用戶信息向量以及提取出的所述用戶需求的所述關鍵詞融合形成用戶需求矩陣;
步驟S4-2,將所述供給信息模型以及提取出的所述供給內容的所述關鍵詞融合形成供給內容矩陣;
步驟S4-3,基于所述用戶需求矩陣和所述供給內容矩陣的數據結構建立能夠進行特征向量提取神經網絡模型作為所述神經網絡模型。
2.根據權利要求1所述的基于深度神經網絡的雙向語義特征匹配方法,其特征在于:
其中,所述供給信息模型的形式是以one-hot向量表示各個所述供給內容的不同供給屬性。
3.根據權利要求1所述的基于深度神經網絡的雙向語義特征匹配方法,其特征在于:
其中,所述用戶信息具有不同的用戶屬性,
所述用戶屬性包括內容可窮舉的用戶屬性以及內容不可窮舉的用戶屬性,
步驟S2中,對于內容可窮舉的所述用戶屬性,直接進行one-hot編碼從而以one-hot形式表示;對于內容不可窮舉的用戶屬性,根據該用戶屬性的內容進行人為定義從而劃分為多個內容范圍,再進行one-hot編碼從而以one-hot形式表示。
4.根據權利要求1所述的基于深度神經網絡的雙向語義特征匹配方法,其特征在于:
其中,步驟S3中,所述供給內容的關鍵詞提取采用XGBoost算法,所述用戶需求的關鍵詞提取采用Bi-LSTM算法。
5.根據權利要求1或4所述的基于深度神經網絡的雙向語義特征匹配方法,其特征在于:
其中,步驟S3中,所述供給內容的關鍵詞以及所述用戶需求的關鍵詞均設有提取的最大數量,
所述供給內容的關鍵詞的所述最大數量為大于所述用戶需求的關鍵詞的所述最大數量。
6.根據權利要求1所述的基于深度神經網絡的雙向語義特征匹配方法,其特征在于:
其中,步驟S5包括如下步驟:
步驟S5-1,構建訓練數據集;
步驟S5-2,采用步驟S5-1得到的所述訓練數據集對步驟S4中建立的所述特征向量提取神經網絡模型進行訓練,得到所述雙向語義特征匹配模型。
7.根據權利要求6所述的基于深度神經網絡的雙向語義特征匹配方法,其特征在于:
其中,步驟S5-1的過程為:
先選取一個具體的所述用戶并選定該用戶的一個用戶需求,然后根據所述用戶的實際情況分析對所述用戶需求進行分析,從而在所述供給內容中查找語義、語境完全匹配的n個供給內容,然后將所述用戶的所述用戶屬性與選定的所述用戶需求形成所述用戶需求矩陣,將所述n個供給內容分別形成n個供給內容矩陣,并將所述用戶需求矩陣與所述n個供給內容矩陣一一對應從而形成n條訓練數據錄入所述訓練數據集。
8.一種供給內容推薦裝置,其特征在于,根據用戶信息以及用戶需求匹配供給內容,包括:
用戶信息存儲部,用于存儲各個用戶的用戶信息以及對應的用戶信息向量;
供給內容存儲部,用于存儲各個所述供給內容以及對應的供給內容向量;
當前需求矩陣獲取部,用于獲取當前的用戶需求并形成對應的當前需求矩陣;
供給預定向量獲取部,用于根據當前的用戶需求以及該用戶的用戶信息獲取一個供給預定向量;
推薦結果獲取部,用于計算所述供給內容存儲部中各個所述供給內容向量與所述供給預定向量之間的相似度,并將所述相似度按照從高到低進行排序,然后獲取排在前列的預定個數的所述供給內容向量所對應的所述供給內容作為待輸出的供給內容;
輸出部,用于對待輸出的供給內容進行輸出,
其中,所述供給預定向量獲取部含有一個雙向語義特征匹配模型,該雙向語義特征匹配模型采用如下方法獲得:
步驟S1,根據所述供給內容建立供給信息模型,并基于該供給信息模型為所有的所述供給內容標注屬性標簽從而形成對應的供給信息向量;
步驟S2,根據所述用戶信息建立用戶信息模型,并基于該用戶信息模型為所有的所述用戶信息標注屬性標簽從而形成對應的用戶信息向量;
步驟S3,分別對所述用戶需求以及所述供給內容進行自然語言分析,從而分別提取預定數量的所述用戶需求的關鍵詞以及所述供給內容的關鍵詞;
步驟S4,根據用戶信息向量、用戶需求的關鍵詞、供給信息模型以及供給內容的關鍵詞建立神經網絡模型;
步驟S5,對步驟S4建立的所述神經網絡模型進行訓練,得到訓練好的所述神經網絡模型作為所述雙向語義特征匹配模型,
步驟S4包括如下步驟:
步驟S4-1,將所述用戶信息向量以及提取出的所述用戶需求的所述關鍵詞融合形成用戶需求矩陣;
步驟S4-2,將所述供給信息模型以及提取出的所述供給內容的所述關鍵詞融合形成供給內容矩陣;
步驟S4-3,基于所述用戶需求矩陣和所述供給內容矩陣的數據結構建立能夠進行特征向量提取神經網絡模型作為所述神經網絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010135628.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:社交方法、系統、智能終端和介質
- 下一篇:一種熱點分析建模方法





