[發明專利]一種標簽推薦方法及系統在審
| 申請號: | 201710544732.0 | 申請日: | 2017-07-06 |
| 公開(公告)號: | CN107341242A | 公開(公告)日: | 2017-11-10 |
| 發明(設計)人: | 李鳳蓮;張雪英;李彥民;焦江麗;田玉楚;王燕;黃麗霞 | 申請(專利權)人: | 太原理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京高沃律師事務所11569 | 代理人: | 王戈 |
| 地址: | 030000 *** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 標簽 推薦 方法 系統 | ||
1.一種標簽推薦方法,其特征在于,所述方法包括:
依次獲取所有用戶對所有項目標注的標簽總集合,所述標簽總集合包括所有的第一標簽集合,所述第一標簽集合為一個用戶對一個項目標注的標簽的集合,所述第一標簽集合包括M個標簽,M為大于0的整數;
利用Apriori算法尋找所述標簽總集合中的最大頻繁項集;
將所述最大頻繁項集設定為新的標識;
將所述第一標簽集合中所述最大頻繁項集替換為所述新的標識,形成第二標簽集合;
將用戶、項目、第二標簽集合相互對應,生成用戶-項目-標簽的三維張量數據,并將三者的關聯權重設為1;
利用HOSVD算法對所述三維張量數據進行分解,得到每個用戶對每個項目標注的標簽的權重值;
根據所述標簽權重值,向第一用戶推薦標簽,供所述第一用戶對第一項目標注標簽使用,所述第一用戶為第一次對所述第一項目標注標簽的用戶,所述第一項目為所有項目中的任意一個項目。
2.根據權利要求1所述的方法,其特征在于,所述利用Apriori算法尋找所述標簽總集合中的最大頻繁項集之前,還包括:
將標簽數據轉換成適用于Apriori算法計算的格式。
3.根據權利要求1所述的方法,其特征在于,所述利用Apriori算法尋找所述標簽總集合中的最大頻繁項集,具體包括:
設定最小支持度,所述最小支持度為標簽出現的頻率的設定閾值;
將所有第一標簽集合中出現頻率大于所述最小支持度的標簽生成頻繁一項集,所述頻繁一項集中每個元素為一個標簽;
將兩個不同的頻繁一項集合并為一個二項集,遍歷所有的頻繁一項集,生成所有的二項集,所述二項集中包括兩個標簽,將所有二項集中兩個標簽同時出現的頻率大于所述最小支持度的二項集生成頻繁二項集;所述頻繁二項集中每個元素為二項集中的兩個標簽;
將頻繁k項集中的任意兩個元素連接,形成k+1項集,所述頻繁k項集中每個元素包括k個不同的標簽,所述k+1項集中包括k+1個不同的標簽;遍歷所述頻繁k項集中的所有元素,生成所有的k+1項集;其中k為大于1的整數;
判斷是否所有的k+1項集中的k+1個標簽同時出現的頻率均小于所述最小支持度,得到第一判斷結果;
當所述第一判斷結果表示所有的k+1項集中的k+1個標簽同時出現的頻率均小于所述最小支持度時,確定所述頻繁k項集為最大頻繁項集;
當所述第一判斷結果表示所有的k+1項集出現的頻率不全小于所述最小支持度時,將所有k+1項集中的k+1個標簽同時出現頻率大于所述最小支持度的k+1項集生成頻繁k+1項集,所述頻繁k+1項集中每個元素包括k+1項集中的k+1個不同的標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太原理工大學,未經太原理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710544732.0/1.html,轉載請聲明來源鉆瓜專利網。





