[發明專利]一種基于NMF算法的大數據商品及服務推薦方法及系統在審

申請號：	201610266693.8	申請日：	2016-04-27
公開（公告）號：	CN105787770A	公開（公告）日：	2016-07-20
發明（設計）人：	姚薇	申請（專利權）人：	上海遙薇（集團）有限公司
主分類號：	G06Q30/02	分類號：	G06Q30/02
代理公司：	北京一格知識產權代理事務所(普通合伙) 11316	代理人：	滑春生;趙永偉
地址：	201802 上海市***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于 nmf 算法數據商品服務推薦方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及一種基于NMF算法的大數據商品及服務推薦方法及系統。

背景技術

隨著電子商務規模的不斷擴大，商品個數和種類快速增長，顧客需要花費大量的時間才能找到自己想買的商品。這種瀏覽大量無關的信息和產品過程無疑會使淹沒在信息過載問題中的消費者不斷流失。同時隨著電子商務系統正處在不斷的擴大化，系統結構不斷的復雜化，用戶及商品的數量幾乎呈直線上身，然而現階段很多推薦算法由于自身的條件限制，存在兩個方面的問題：稀疏性問題與擴展性問題，這嚴重的影響了推薦的質量。另一方面，語音查詢功能在各行業中都有非常實際的應用。隨著移動終端的普及，越來越多的語音識別應用被開發。利用語音識別技術能夠在一定程度上便于用戶的搜索或操作，若能夠將語音識別技術輔以主動根據用戶需求對商品進行篩選推薦的系統，則有望更快、更便利地推薦最適合用戶的產品，以達到使得用戶能夠更便捷地找尋所需商品的目的，從而大大改善用戶的使用體驗。

發明內容

本發明要解決的技術問題是為了現有電子商務中用戶需要花費大量的時間才能找到自己想買的商品，而在這種瀏覽中必然產生大量無關的信息，因而會大大降低電子商務的效率，同時嚴重影響用戶的使用體驗的缺陷，提出一種基于NMF算法的大數據商品及服務推薦方法及系統。

本發明是通過下述技術方案來解決上述技術問題的：一種基于NMF算法的大數據商品及服務推薦方法，其創新點在于，在一數據庫中記錄有多個用戶的多個用戶日志，用戶日志對應地記錄有用戶的歷史記錄，該基于NMF算法的大數據商品及服務推薦方法包括以下步驟：

A：接收一用戶輸入的信息，并將這一用戶作為目標用戶，對信息轉化成標準文本信息，以生成一結構化文本，根據結構化文本在數據庫中進行查詢，以獲查詢結果；

B：若在該數據庫中記錄有該目標用戶的用戶日志，則將該結構化文本記錄至該目標用戶的用戶日志中，若在該數據庫中未記錄有該目標用戶的用戶日志，則在該數據庫中創建該目標用戶的用戶日志、并將該結構化文本記錄至該目標用戶的用戶日志中；根據該數據庫中記錄的該多個用戶的用戶日志對用戶進行聚類分析，以得到聚類結果，該聚類結果包括若干用戶聚類及其特征；

C：以商品類別屬性為因變量，以用戶屬性、商品瀏覽歷史記錄等特征值為自變量通過邏輯回歸算法（LogisticRegression）做統計分析，得出用戶對商品類別喜好地概率，建立屬性值預測模型，然后結合非負矩陣分解算法（NMF）與用戶選定的目標商品匹配對比，對用戶個性化推薦，推薦相似商品。

D：根據用戶屬性信息、用戶瀏覽記錄、商品屬性計算用戶在每個屬性分類上的NMF 值，用戶的NMF值計算結果為一個向量，對于m個屬性分類，用eum表示用戶NMF值向量中的項，用戶NMF值向量表示為Eu＝{eu1，eu2，eu3，...，eum}，每個進行個性化推薦的用戶都有一個用戶NMF值向量；對用戶個性化推薦，推薦相似商品，根據當前用戶所選商品，與推薦候選集中的結果進行匹配，根據匹配結果和分類NMF值權重計算商品的相似度，然后根據相似度進行降序排序完成推薦排序過程：

E：根據當前用戶選擇的商品，計算當前用戶在屬性分類上的NMF值，匹配得到的候選集合商品的屬性匹配向量B，再根據全局NMF值向量Et和中的用戶NMF值向量Eu，計算推薦候選集中每個商品的相似度，再根據相似度對推薦候選集商品進行降序排序，其中，對于推薦候選集中的第k項商品，k＝1，2，3，4，5...，相似度simk計算公式為：如果k≤5，simk＝Bk ×(Et-Eu)÷k，如果k＞5，simk＝Bk×(Et-Eu)÷0.5k，根據商品頁的推薦數需求對排序后的推薦候選集的推薦數目進行裁剪，得到最終的推薦集合，進行個性化推薦。

優選的，該步驟A包括以下步驟：對語音信息進行音頻特征的提取；獲取以馬爾科夫模型為基礎建立的聲學模型，然后根據該聲學模型解析得到和提取的音頻特征匹配度最高的詞序列將該詞序列生成為該文本信息。

優選的，對語音信息進行模數轉換、端點檢測、預加重、加窗、自相關序列、LPC系數、和/或倒頻譜系數的計算，以提取音頻特征。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于上海遙薇（集團）有限公司，未經上海遙薇（集團）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201610266693.8/2.html，轉載請聲明來源鉆瓜專利網。