[發明專利]一種基于移動終端應用數據的預測推薦方法有效
| 申請號: | 201810490042.6 | 申請日: | 2018-05-21 |
| 公開(公告)號: | CN108647364B | 公開(公告)日: | 2021-10-29 |
| 發明(設計)人: | 韓一石;劉山彪;程家豪;胡紀坤 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510006 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 移動 終端 應用 數據 預測 推薦 方法 | ||
本發明公布了一種基于移動終端應用數據的預測推薦方法,本發明根據用戶使用移動終端應用數據更新和補充用戶屬性,結合主題模型和混合協同過濾預測方法的優點,在考慮到用戶個性化的同時提高了推薦的準確性,而且本發明根據用戶安裝移動終端應用情況可以得到用戶的隱性偏好,利用用戶隱性偏好預測的準確性要比基于用戶的協同過濾和基于物品的協同過濾算法的準確性要高。
技術領域
本發明涉及移動互聯網領域,更具體地,涉及一種基于移動終端應用數據的預測推薦方法。
背景技術
目前,移動網絡用戶正在創建和共享大規模網絡信息,如文本文章、照片、視頻等,是挖掘用戶個人信息的重要線索,用戶個人基本信息包括性別,年齡,個人興趣愛好(例如,科技、娛樂、體育)、個人職業信息(例如,研究者、學生、軟件工程師、音樂家),個人情感取向(例如,樂觀的、消極的)等等。我們稱這些個人信息為用戶屬性。從用戶個人數據中推斷出用戶屬性,可以在用戶分析、信息檢索、個性化推薦等多個方面起到重要作用。
目前主要使用用戶網絡行為數據(網頁點擊量、網頁訪問時長等)、服務行為數據(網頁停留時長、網頁訪問深度等)、用戶偏好數據(瀏覽/收藏、評論內容、生活行為偏好等)、用戶購買行為數據(重復購買率,用戶貢獻等率)來預測用戶屬性。但是針對網絡行為的分類預測都不能達到理想的效果,預測的準確率依舊不高。應用商城給用戶推薦應用只推薦用戶數量多的應用,沒有考慮用戶屬性和用戶個性化需求。
發明內容
本發明為克服上述現有技術所述的缺陷,進一步提升網絡行為分類預測的準確率,提供一種基于移動終端應用數據的預測推薦方法。
為解決上述技術問題,本發明的技術方案如下:
一種基于移動終端應用數據的預測推薦方法,包括以下步驟:
S1.采集用戶移動終端應用的原始數據,對原始數據進行清洗,得到移動終端應用數據;
S2.爬取移動終端應用商城數據,計算每個應用的單詞偏向;
S3.根據步驟S2得到的單詞偏向數據,計算用戶的隱性偏好矩陣;
S4.根據步驟S3得到的用戶的隱性偏好矩陣,計算用戶隱性矩陣,構建用戶屬性計算模型;
S5.采取部分與整體的協同過濾算法預測用戶屬性;
S6.根據步驟S5得到的預測用戶屬性對原有的用戶信息進行更新或補充,使用推薦系統為用戶推薦個性化應用。
優選地,所述步驟S1的具體步驟如下:
S11.將用戶特征信息根據用戶ID進行統計,經過統計的信息中每個特征分配唯一的數字ID;
S12.將用戶信息中的異常值刪除;
S13.從處理后的數據中選取常出現的、計算特征與用戶屬性的相關系數,提取與用戶屬性相關系數大的特征,去除與用戶屬性相關系數小的特征;
S14.統計用戶點擊移動終端應用的次數,通過歸一化公式計算得到用戶偏好矩陣Cn×m。
優選地,所述步驟S2的具體步驟如下:
S21.使用爬蟲抓取手機應用商城的應用數據,通過自然語言處理方法,處理移動終端應用單詞并分配唯一的數字ID;
S22.將移動終端應用描述信息的單詞轉化為應用單詞向量w=(w1,w2...wn),其中,wn表示出現的第n個單詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810490042.6/2.html,轉載請聲明來源鉆瓜專利網。





