[發明專利]一種基于NMF算法的大數據商品及服務推薦方法及系統在審
| 申請號: | 201610266693.8 | 申請日: | 2016-04-27 |
| 公開(公告)號: | CN105787770A | 公開(公告)日: | 2016-07-20 |
| 發明(設計)人: | 姚薇 | 申請(專利權)人: | 上海遙薇(集團)有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 北京一格知識產權代理事務所(普通合伙) 11316 | 代理人: | 滑春生;趙永偉 |
| 地址: | 201802 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 nmf 算法 數據 商品 服務 推薦 方法 系統 | ||
技術領域
本發明涉及一種基于NMF算法的大數據商品及服務推薦方法及系統。
背景技術
隨著電子商務規模的不斷擴大,商品個數和種類快速增長,顧客需要花費大量的 時間才能找到自己想買的商品。這種瀏覽大量無關的信息和產品過程無疑會使淹沒在信息 過載問題中的消費者不斷流失。同時隨著電子商務系統正處在不斷的擴大化,系統結構不 斷的復雜化,用戶及商品的數量幾乎呈直線上身,然而現階段很多推薦算法由于自身的條 件限制,存在兩個方面的問題:稀疏性問題與擴展性問題,這嚴重的影響了推薦的質量。另 一方面,語音查詢功能在各行業中都有非常實際的應用。隨著移動終端的普及,越來越多的 語音識別應用被開發。利用語音識別技術能夠在一定程度上便于用戶的搜索或操作,若能 夠將語音識別技術輔以主動根據用戶需求對商品進行篩選推薦的系統,則有望更快、更便 利地推薦最適合用戶的產品,以達到使得用戶能夠更便捷地找尋所需商品的目的,從而大 大改善用戶的使用體驗。
發明內容
本發明要解決的技術問題是為了現有電子商務中用戶需要花費大量的時間才能 找到自己想買的商品,而在這種瀏覽中必然產生大量無關的信息,因而會大大降低電子商 務的效率,同時嚴重影響用戶的使用體驗的缺陷,提出一種基于NMF算法的大數據商品及服 務推薦方法及系統。
本發明是通過下述技術方案來解決上述技術問題的:一種基于NMF算法的大數據 商品及服務推薦方法,其創新點在于,在一數據庫中記錄有多個用戶的多個用戶日志,用戶 日志對應地記錄有用戶的歷史記錄,該基于NMF算法的大數據商品及服務推薦方法包括以 下步驟:
A:接收一用戶輸入的信息,并將這一用戶作為目標用戶,對信息轉化成標準文本信息, 以生成一結構化文本,根據結構化文本在數據庫中進行查詢,以獲查詢結果;
B:若在該數據庫中記錄有該目標用戶的用戶日志,則將該結構化文本記錄至該目標用 戶的用戶日志中,若在該數據庫中未記錄有該目標用戶的用戶日志,則在該數據庫中創建 該目標用戶的用戶日志、并將該結構化文本記錄至該目標用戶的用戶日志中;根據該數據 庫中記錄的該多個用戶的用戶日志對用戶進行聚類分析,以得到聚類結果,該聚類結果包 括若干用戶聚類及其特征;
C:以商品類別屬性為因變量,以用戶屬性、商品瀏覽歷史記錄等特征值為自變量通過 邏輯回歸算法(LogisticRegression)做統計分析,得出用戶對商品類別喜好地概率,建立 屬性值預測模型,然后結合非負矩陣分解算法(NMF)與用戶選定的目標商品匹配對比,對用 戶個性化推薦,推薦相似商品。
D:根據用戶屬性信息、用戶瀏覽記錄、商品屬性計算用戶在每個屬性分類上的NMF 值,用戶的NMF值計算結果為一個向量,對于m個屬性分類,用eum表示用戶NMF值向量中的 項,用戶NMF值向量表示為Eu={eu1,eu2,eu3,...,eum},每個進行個性化推薦的用戶都有 一個用戶NMF值向量;對用戶個性化推薦,推薦相似商品,根據當前用戶所選商品,與推薦候 選集中的結果進行匹配,根據匹配結果和分類NMF值權重計算商品的相似度,然后根據相似 度進行降序排序完成推薦排序過程:
E:根據當前用戶選擇的商品,計算當前用戶在屬性分類上的NMF值,匹配得到的候選集 合商品的屬性匹配向量B,再根據全局NMF值向量Et和中的用戶NMF值向量Eu,計算推薦候 選集中每個商品的相似度,再根據相似度對推薦候選集商品進行降序排序,其中,對于推薦 候選集中的第k項商品,k=1,2,3,4,5...,相似度simk計算公式為:如果k≤5,simk=Bk ×(Et-Eu)÷k,如果k>5,simk=Bk×(Et-Eu)÷0.5k,根據商品頁的推薦數需求對排序 后的推薦候選集的推薦數目進行裁剪,得到最終的推薦集合,進行個性化推薦。
優選的,該步驟A包括以下步驟:對語音信息進行音頻特征的提取;獲取以馬爾科 夫模型為基礎建立的聲學模型,然后根據該聲學模型解析得到和提取的音頻特征匹配度最 高的詞序列將該詞序列生成為該文本信息。
優選的,對語音信息進行模數轉換、端點檢測、預加重、加窗、自相關序列、LPC系 數、和/或倒頻譜系數的計算,以提取音頻特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海遙薇(集團)有限公司,未經上海遙薇(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610266693.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種填開代開發票申請的方法
- 下一篇:用于圖像識別服務的方法和設備
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





