[發(fā)明專利]基于大規(guī)模評(píng)分?jǐn)?shù)據(jù)對(duì)用戶進(jìn)行商品在線實(shí)時(shí)推薦的方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710292884.6 | 申請(qǐng)日: | 2017-04-28 |
| 公開(公告)號(hào): | CN108154380A | 公開(公告)日: | 2018-06-12 |
| 發(fā)明(設(shè)計(jì))人: | 王成;文詩(shī)琪;張憶文;賴雄鳴;何霆;洪欣;鄭國(guó)旗 | 申請(qǐng)(專利權(quán))人: | 華僑大學(xué);亞爾迪(廈門)科技有限公司 |
| 主分類號(hào): | G06Q30/02 | 分類號(hào): | G06Q30/02;G06Q30/06 |
| 代理公司: | 廈門市首創(chuàng)君合專利事務(wù)所有限公司 35204 | 代理人: | 張松亭;楊鍇 |
| 地址: | 362000*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 評(píng)分?jǐn)?shù)據(jù) 時(shí)空效率 協(xié)同過(guò)濾 貝葉斯 離散化 成功率 并行 并行讀取 獨(dú)立屬性 分類模型 回歸模型 商品推薦 數(shù)據(jù)存儲(chǔ) 實(shí)時(shí)性 預(yù)測(cè) 準(zhǔn)確率 取整 算法 概率 期望 應(yīng)用 | ||
1.一種基于大規(guī)模評(píng)分?jǐn)?shù)據(jù)對(duì)用戶進(jìn)行商品在線實(shí)時(shí)推薦的方法,其特征在于,獲取用戶對(duì)商品的評(píng)分?jǐn)?shù)據(jù),并對(duì)其進(jìn)行離散化處理作為類別屬性,利用基于并行樸素貝葉斯分類模型計(jì)算用戶對(duì)商品各評(píng)分類別的概率,通過(guò)期望求和預(yù)測(cè)用戶對(duì)商品的評(píng)分,獲得并行樸素貝葉斯回歸模型;通過(guò)并行樸素貝葉斯回歸模型進(jìn)行協(xié)同過(guò)濾推薦,實(shí)現(xiàn)商品在線實(shí)時(shí)推薦。
2.根據(jù)權(quán)利要求1所述的基于大規(guī)模評(píng)分?jǐn)?shù)據(jù)對(duì)用戶進(jìn)行商品在線實(shí)時(shí)推薦的方法,其特征在于,獲取用戶對(duì)商品的評(píng)分?jǐn)?shù)據(jù)后,將評(píng)分?jǐn)?shù)據(jù)存儲(chǔ)于Hadoop的HDFS分布式文件系統(tǒng)上;其中,用戶對(duì)商品的評(píng)分?jǐn)?shù)據(jù)包括:用戶a,商品b,用戶a對(duì)商品b的評(píng)分ra,b。
3.根據(jù)權(quán)利要求2所述的基于大規(guī)模評(píng)分?jǐn)?shù)據(jù)對(duì)用戶進(jìn)行商品在線實(shí)時(shí)推薦的方法,其特征在于,將獲取的用戶對(duì)商品的評(píng)分離散化處理后,作為樸素貝葉斯的分類類別Ri,i∈[1,…,s],表示有s種不同的評(píng)分。
4.根據(jù)權(quán)利要求3所述的基于大規(guī)模評(píng)分?jǐn)?shù)據(jù)對(duì)用戶進(jìn)行商品在線實(shí)時(shí)推薦的方法,其特征在于,如果獲取的評(píng)分?jǐn)?shù)據(jù)為整數(shù),則評(píng)分?jǐn)?shù)據(jù)直接作為分類類別;如果獲取的評(píng)分?jǐn)?shù)據(jù)為小數(shù),則采用四舍五入的方式取整后,再作為分類類別;
則,
5.根據(jù)權(quán)利要求4所述的基于大規(guī)模評(píng)分?jǐn)?shù)據(jù)對(duì)用戶進(jìn)行商品在線實(shí)時(shí)推薦的方法,其特征在于,確定評(píng)分?jǐn)?shù)據(jù)為樸素貝葉斯分類的特征屬性。
6.根據(jù)權(quán)利要求5所述的基于大規(guī)模評(píng)分?jǐn)?shù)據(jù)對(duì)用戶進(jìn)行商品在線實(shí)時(shí)推薦的方法,其特征在于,將獲取的評(píng)分?jǐn)?shù)據(jù)及取整的評(píng)分?jǐn)?shù)據(jù)讀取作為訓(xùn)練樣本,用戶和商品作為特征屬性,生成用戶-商品評(píng)分矩陣R={r1,1,…,ra,b,…,rm,n};其中,矩陣包括m個(gè)用戶U={u1,u2,…,ua,…,um}和n個(gè)商品I={i1,i2,…,ib,…,in}。
7.根據(jù)權(quán)利要求6所述的基于大規(guī)模評(píng)分?jǐn)?shù)據(jù)對(duì)用戶進(jìn)行商品在線實(shí)時(shí)推薦的方法,其特征在于,計(jì)算用戶對(duì)商品各評(píng)分類別的概率的方法如下:
讀取存儲(chǔ)在HDFS分布式文件系統(tǒng)上的評(píng)分?jǐn)?shù)據(jù)作為輸入,則輸入為<offset,(UserID,ItemID,Rating)>;其中,offset是文件位置偏移量,(UserID,ItemID,Rating)是讀取數(shù)據(jù)中每一行的內(nèi)容,UserID表示用戶,ItemID表示商品,Rating表示用戶對(duì)商品的評(píng)分;
Map-I階段:評(píng)分Rating為key,(UserID,ItemID)和(NUM)為value,輸出<Rating,(UserID,ItemID)>和<Rating,(NUM)>的鍵值對(duì);其中,NUM表示訓(xùn)練樣本中數(shù)據(jù)的總量;
Reduce-I階段:讀取Map-I階段的輸出,得到各個(gè)評(píng)分類別的概率,將評(píng)分Rating設(shè)置為key,統(tǒng)計(jì)各評(píng)分出現(xiàn)的次數(shù)NUM_Ri,結(jié)合Map-I階段中得到的訓(xùn)練樣本數(shù)據(jù)總量NUM,則得到各個(gè)評(píng)分類別的概率并輸出<UserID Rating,(1)>、<ItemIDRating,(1)>、<Rating NUM_Ri P(Ri),(1)>的鍵值對(duì)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華僑大學(xué);亞爾迪(廈門)科技有限公司,未經(jīng)華僑大學(xué);亞爾迪(廈門)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710292884.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購(gòu)物或電子商務(wù)
G06Q30-02 .行銷,例如,市場(chǎng)研究與分析、調(diào)查、促銷、廣告、買方剖析研究、客戶管理或獎(jiǎng)勵(lì);價(jià)格評(píng)估或確定
G06Q30-04 .簽單或開發(fā)票
G06Q30-06 .購(gòu)買、出售或租賃交易
G06Q30-08 ..拍賣
- 數(shù)據(jù)處理方法及裝置
- 一種基于加速近端梯度PCA的時(shí)序評(píng)分異常值檢測(cè)方法
- 一種評(píng)課方法及系統(tǒng)
- 一種旅游景點(diǎn)用旅游適游指數(shù)的計(jì)算系統(tǒng)及方法
- 基于Kruskal算法改進(jìn)的K均值雙重聚類推薦的方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 機(jī)器學(xué)習(xí)模型的測(cè)試數(shù)據(jù)優(yōu)化方法、裝置及電子設(shè)備
- 信用評(píng)分方法及裝置
- 一種交易評(píng)價(jià)的方法、裝置及終端
- 數(shù)據(jù)處理方法及裝置
- 數(shù)據(jù)處理方法及裝置
- 發(fā)送裝置、接收裝置及無(wú)線通信方法
- 一種時(shí)空地理大數(shù)據(jù)的檢索方法及系統(tǒng)
- 一種時(shí)空變化過(guò)程動(dòng)態(tài)可視化方法
- 應(yīng)用的凍結(jié)或解凍方法、裝置及移動(dòng)終端
- 一種云環(huán)境下時(shí)空索引的構(gòu)建方法、裝置及電子設(shè)備
- 基于stacking集成學(xué)習(xí)算法的時(shí)空數(shù)據(jù)預(yù)測(cè)方法
- 一種基于改進(jìn)遺傳算法的星地時(shí)空最大覆蓋問(wèn)題求解方法
- 一種時(shí)空軌跡構(gòu)建方法、系統(tǒng)、設(shè)備和介質(zhì)
- 多維時(shí)空譜數(shù)據(jù)融合方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種智能高效的時(shí)空大數(shù)據(jù)分析方法
- 協(xié)同過(guò)濾系統(tǒng)以及協(xié)同過(guò)濾方法
- 一種基于時(shí)間衰減的協(xié)同過(guò)濾系統(tǒng)及方法
- 基于聚類和SlopeOne預(yù)測(cè)的協(xié)同過(guò)濾方法
- 一種基于協(xié)同過(guò)濾的安全事件預(yù)測(cè)技術(shù)
- 基于用戶動(dòng)態(tài)行為相似性的在線協(xié)同過(guò)濾內(nèi)容推薦算法
- 基于用戶特征的協(xié)同過(guò)濾推薦算法
- 一種音視頻推薦的方法、裝置和計(jì)算機(jī)設(shè)備
- 一種基于改進(jìn)協(xié)同過(guò)濾算法的電影推薦方法
- 一種基于協(xié)同過(guò)濾的進(jìn)銷項(xiàng)差異度計(jì)算的方法及系統(tǒng)
- 搜索方法及裝置
- 一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法
- 構(gòu)建解決組合爆炸問(wèn)題的級(jí)聯(lián)貝葉斯網(wǎng)絡(luò)的方法
- 一種可重構(gòu)系統(tǒng)貝葉斯網(wǎng)構(gòu)建方法
- 一種基于貝葉斯網(wǎng)絡(luò)的網(wǎng)站缺陷預(yù)測(cè)方法及其實(shí)現(xiàn)系統(tǒng)
- 應(yīng)用處理方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種遮擋目標(biāo)檢測(cè)方法、電子設(shè)備、存儲(chǔ)介質(zhì)及系統(tǒng)
- 基于貝葉斯網(wǎng)絡(luò)推理模型的犯罪重建方法及裝置
- 利用憶阻器本征噪聲實(shí)現(xiàn)貝葉斯神經(jīng)網(wǎng)絡(luò)的方法及裝置
- 基于面向?qū)ο筘惾~斯網(wǎng)絡(luò)的中央空調(diào)系統(tǒng)故障診斷方法
- 一種基于貝葉斯神經(jīng)網(wǎng)絡(luò)權(quán)重約束的圖像分類方法





