[發(fā)明專利]一種基于移動終端應(yīng)用數(shù)據(jù)的預(yù)測推薦方法有效
| 申請?zhí)枺?/td> | 201810490042.6 | 申請日: | 2018-05-21 |
| 公開(公告)號: | CN108647364B | 公開(公告)日: | 2021-10-29 |
| 發(fā)明(設(shè)計)人: | 韓一石;劉山彪;程家豪;胡紀坤 | 申請(專利權(quán))人: | 廣東工業(yè)大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510006 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 移動 終端 應(yīng)用 數(shù)據(jù) 預(yù)測 推薦 方法 | ||
1.一種基于移動終端應(yīng)用數(shù)據(jù)的預(yù)測推薦方法,其特征在于,包括以下步驟:
S1.采集用戶移動終端應(yīng)用的原始數(shù)據(jù),對原始數(shù)據(jù)進行清洗,得到移動終端應(yīng)用數(shù)據(jù);
S2.爬取移動終端應(yīng)用商城數(shù)據(jù),計算每個應(yīng)用的單詞偏向;具體步驟為:
S21.使用爬蟲抓取手機應(yīng)用商城的應(yīng)用數(shù)據(jù),通過自然語言處理方法,處理移動終端應(yīng)用單詞并分配唯一的數(shù)字ID;
S22.將移動終端應(yīng)用描述信息的單詞轉(zhuǎn)化為應(yīng)用單詞向量w=(w1,w2...wn),其中,wn表示出現(xiàn)的第n個單詞;
S23.將所有的移動終端應(yīng)用向量組合起來得到應(yīng)用-詞矩陣Cm×l,矩陣Cm×l中包含應(yīng)用的所有描述單詞,矩陣Cm×l中的值為0或1;
S24.使用TF-IDF算法計算每個應(yīng)用的單詞偏向,并將TF-IDF值代替應(yīng)用-詞矩陣的值,得到更新后的應(yīng)用-詞矩陣Cm×l;
S3.根據(jù)步驟S2得到的單詞偏向數(shù)據(jù),計算用戶的隱性偏好矩陣;具體步驟為:
S31.根據(jù)矩陣Cn×m和Cm×l相乘得到用戶-詞矩陣Cn×l;
S4.根據(jù)步驟S3得到的用戶的隱性偏好矩陣,計算用戶隱性矩陣,構(gòu)建用戶屬性計算模型;具體步驟為:
S41.根據(jù)LDA主題模型處理用戶-詞矩陣Cn×l,得到用戶隱性主題矩陣Cn×t和主題-詞偏好矩陣Ct×l;
S42.根據(jù)矩陣Cn×t得到用戶屬性Ck與主題topic之間的關(guān)系;
S43.根據(jù)樸素貝葉斯算法得出已知用戶屬性Ck,通過公式P(topic|ck)得到偏愛主題topic;
S44.根據(jù)樸素貝葉斯算法計算得出P(ck|topic),選擇概率最大的P(ck|topic)值作為用戶屬性計算值;
S5.采取部分與整體的協(xié)同過濾算法預(yù)測用戶屬性;具體步驟為:
S51.利用改進的皮爾遜相似度ρ'uv的鄰居相似度計算方法,根據(jù)主題-詞矩陣Ct×l計算主題的N個鄰居以及用戶-主題矩陣Cn×t計算用戶的M個鄰居;
S52.計算基于主題的協(xié)同過濾算法得到值uu,i和基于用戶的協(xié)同過濾算法得到值wu,i;
S53.根據(jù)混合協(xié)同過濾預(yù)測算法,得到以下公式并計算用戶屬性預(yù)測結(jié)果:
qu,i=αuu,i+(1-α)wu,i
其中,qu,i為預(yù)測值,α是平衡系數(shù);
S6.根據(jù)步驟S5得到的預(yù)測用戶屬性對原有的用戶信息進行更新或補充,使用推薦系統(tǒng)為用戶推薦個性化應(yīng)用。
2.根據(jù)權(quán)利要求1所述的基于移動終端應(yīng)用數(shù)據(jù)的預(yù)測推薦方法,其特征在于,所述步驟S1的具體步驟如下:
S11.將用戶特征信息根據(jù)用戶ID進行統(tǒng)計,經(jīng)過統(tǒng)計的信息中每個特征分配唯一的數(shù)字ID;
S12.將用戶信息中的異常值刪除;
S13.從處理后的數(shù)據(jù)中選取常出現(xiàn)的、計算特征與用戶屬性的相關(guān)系數(shù),提取與用戶屬性相關(guān)系數(shù)大的特征,去除與用戶屬性相關(guān)系數(shù)小的特征;
S14.統(tǒng)計用戶點擊移動終端應(yīng)用的次數(shù),通過歸一化公式計算得到用戶偏好矩陣Cn×m。
3.根據(jù)權(quán)利要求1所述的基于移動終端應(yīng)用數(shù)據(jù)的預(yù)測推薦方法,其特征在于,所述步驟S6的具體步驟如下:
S61.根據(jù)步驟S53得到的用戶屬性預(yù)測結(jié)果更新或補充用戶信息;
S62.將用戶屬性預(yù)測結(jié)果和用戶屬性結(jié)合,推薦系統(tǒng)為用戶推薦個性化的移動終端應(yīng)用。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東工業(yè)大學,未經(jīng)廣東工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810490042.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 在線應(yīng)用平臺上應(yīng)用間通信的回調(diào)應(yīng)答方法、應(yīng)用及在線應(yīng)用平臺
- 應(yīng)用使用方法、應(yīng)用使用裝置及相應(yīng)的應(yīng)用終端
- 應(yīng)用管理設(shè)備、應(yīng)用管理系統(tǒng)、以及應(yīng)用管理方法
- 能力應(yīng)用系統(tǒng)及其能力應(yīng)用方法
- 應(yīng)用市場的應(yīng)用搜索方法、系統(tǒng)及應(yīng)用市場
- 使用應(yīng)用的方法和應(yīng)用平臺
- 應(yīng)用安裝方法和應(yīng)用安裝系統(tǒng)
- 使用遠程應(yīng)用進行應(yīng)用安裝
- 應(yīng)用檢測方法及應(yīng)用檢測裝置
- 應(yīng)用調(diào)用方法、應(yīng)用發(fā)布方法及應(yīng)用發(fā)布系統(tǒng)





