[發明專利]一種標簽推薦方法及系統在審
| 申請號: | 201710544732.0 | 申請日: | 2017-07-06 |
| 公開(公告)號: | CN107341242A | 公開(公告)日: | 2017-11-10 |
| 發明(設計)人: | 李鳳蓮;張雪英;李彥民;焦江麗;田玉楚;王燕;黃麗霞 | 申請(專利權)人: | 太原理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京高沃律師事務所11569 | 代理人: | 王戈 |
| 地址: | 030000 *** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 標簽 推薦 方法 系統 | ||
技術領域
本發明涉及個性化推薦領域,特別是涉及一種標簽推薦方法及系統。
背景技術
現如今,Web技術的發展突飛猛進,用戶可以在多種多樣的網絡平臺上對一個項目標注多個不同的標簽,尤其是在各個平臺的推薦系統應用方面,系統通過標簽來探索每個用戶的喜好特征,當用戶對未標注過標簽的項目標注標簽時,可以更有效地向用戶推薦合適的標簽供用戶標注,幫助用戶快速找到自己滿意的標簽。項目是指用戶標注標簽的對象,例如電影、視頻、文章等。以往的推薦算法大多針對的是基于二元關系的用戶-項目的評分矩陣數據進行研究,隨著標簽數據的加入,由用戶、項目和標簽組成的三元關系數據處理成為了近年來推薦算法研究的重點。
由于推薦系統中用戶、項目和標簽數量的與日俱增,三者組成的權值數據規模呈指數速度增長,數據稀疏性逐漸變大,由此用于處理該數據的推薦算法的推薦準確性降低,成為推薦技術需解決的最主要的問題。
發明內容
本發明的目的是提供一種標簽推薦方法及系統,以解決現有技術中推薦算法推薦準確性低的問題。
為實現上述目的,本發明提供了如下方案:
一種標簽推薦方法,所述方法包括:
依次獲取所有用戶對所有項目標注的標簽總集合,所述標簽總集合包括所有的第一標簽集合,所述第一標簽集合為一個用戶對一個項目標注的標簽的集合,所述第一標簽集合包括M個標簽,M為大于0的整數;
利用Apriori算法尋找所述標簽總集合中的最大頻繁項集;
將所述最大頻繁項集設定為新的標識;
將所述第一標簽集合中所述最大頻繁項集替換為所述新的標識,形成第二標簽集合;
將用戶、項目、第二標簽集合相互對應,生成用戶-項目-標簽的三維張量數據,并將三者的關聯權重設為1;
利用HOSVD算法對所述三維張量數據進行分解,得到每個用戶對每個項目標注的標簽的權重值;
根據所述標簽權重值,向第一用戶推薦標簽,供所述第一用戶對項目標注標簽使用,所述第一用戶為第一次對所述第一項目標注標簽的用戶,所述第一項目為所有項目中的任意一個項目。
可選的,所述利用Apriori算法尋找所述標簽總集合中的最大頻繁項集之前,還包括:
將標簽數據轉換成適用于Apriori算法計算的格式。
可選的,所述利用Apriori算法尋找所述標簽總集合中的最大頻繁項集,具體包括:
設定最小支持度,所述最小支持度為標簽出現的頻率的設定閾值;
將所有第一標簽集合中出現頻率大于所述最小支持度的標簽生成頻繁一項集,所述頻繁一項集中每個元素為一個標簽;
將兩個不同的頻繁一項集合并為一個二項集,遍歷所有的頻繁一項集,生成所有的二項集,所述二項集中包括兩個標簽,將所有二項集中兩個標簽同時出現的頻率大于所述最小支持度的二項集生成頻繁二項集;所述頻繁二項集中每個元素為二項集中的兩個標簽;
將頻繁k項集中的任意兩個元素連接,形成k+1項集,所述頻繁k項集中每個元素包括k個不同的標簽,所述k+1項集中包括k+1個不同的標簽;遍歷所述頻繁k項集中的所有元素,生成所有的k+1項集;其中k為大于1的整數;
判斷是否所有的k+1項集中的k+1個標簽同時出現的頻率均小于所述最小支持度,得到第一判斷結果;
當所述第一判斷結果表示所有的k+1項集中的k+1個標簽同時出現的頻率均小于所述最小支持度時,確定所述頻繁k項集為最大頻繁項集;
當所述第一判斷結果表示所有的k+1項集出現的頻率不全小于所述最小支持度時,將所有k+1項集中的k+1個標簽同時出現頻率大于所述最小支持度的k+1項集生成頻繁k+1項集,所述頻繁k+1項集中每個元素包括k+1項集中的k+1個不同的標簽。
可選的,所述利用HOSVD算法對所述三維張量數據進行分解,具體包括:
將所述三維張量數據利用公式沿著三個模方向進行分解,其中所述三維張量表示為A1為所述三維張量A的1-模的矩陣展開形式;A2為所述三維張量A的2-模的矩陣展開形式;A3為所述三維張量A的3-模的矩陣展開形式;
利用奇異值分解算法對所述A1、A2、A3進行分解,得到
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太原理工大學,未經太原理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710544732.0/2.html,轉載請聲明來源鉆瓜專利網。





