[發明專利]基于模糊聚類的視頻點播推薦系統及方法無效
| 申請號: | 201110216933.0 | 申請日: | 2011-08-01 |
| 公開(公告)號: | CN102289478A | 公開(公告)日: | 2011-12-21 |
| 發明(設計)人: | 王小軍;朱祎;王紅林 | 申請(專利權)人: | 江蘇廣播電視大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N7/02 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 許方 |
| 地址: | 210036 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模糊 視頻點播 推薦 系統 方法 | ||
技術領域
本發明涉及一種基于模糊聚類的視頻點播推薦系統及方法,屬于互聯網視頻點播個性化推薦技術領域。
背景技術
?隨著移動接入的用戶群體不斷增加,以網上視頻為載體的信息傳播模式已經滲入日常生活的方方面面,在視頻點播的過程中,用戶的忠誠度以及應用對用戶的“粘度”已經成為衡量應用是否成功的關鍵。
目前現有的個性化推薦系統主要為客戶推薦商品,?滿足客戶的個性化需求,主要優勢在于它能收集用戶特征資料并根據用戶訪問特征、興趣愛好為用戶提供簡潔的導航服務及個性化的商品推薦服務。在網上視頻點播的個性化推薦方面,主要包括頁面導航和優化兩個方面,所采用的技術包括統計分析、關聯分析、協同過濾以及分類分析,如貝葉斯分類、決策樹分類,在這些技術方法中,提供個性化推薦服務的前提都是,根據用戶的訪問情況建立和完善用戶訪問模型。在建立用戶訪問模型的過程中,下面兩個方面還要進一步的的完善,其一是特征選擇問題,在個性化推薦系統中,針對海量高維、非數值型數據的特征選擇問題(關鍵特征的提取、派生特征和無關特征的篩選),在相關的專利和文獻中都沒有提供較好的解決方法。其二個性化用戶訪問模型的表示,現有技術解決方案中,通常采用用戶訪問記錄和系統訪問特征模型來代替用戶訪問特征模型,沒有根據用戶的個性化特點分別進行推薦,及沒有做到真正的個性化推薦。
發明內容
為了解決上述問題,本發明提供了一種基于模糊聚類的視頻點播推薦系統及方法,在網上視頻點播應用中完善了用戶訪問模型,建立了高效、個性化的推薦系統。
本發明為解決其技術問題采用如下技術方案:
一種基于模糊聚類的視頻點播推薦系統,由數據預處理模塊、模糊聚類分析模塊、個性化用戶推薦模塊和系統有效性分析模塊順序相連,其中,所述的數據預處理模塊是由源數據采集子模塊、數據清洗子模塊、用戶會話識別子模塊、字符屬性轉化子模塊、數據標準化子模塊、特征篩選子模塊和主成份分析子模塊順序相連;所述模糊聚類分析模塊由初始化聚類中心子模塊、模糊聚類算法應用子模塊和系統訪問模式生成子模塊順序相連;個性化推薦模塊由用戶訪問模式生成子模塊、個性化推薦生成及反饋和評測子模塊順序相連。
基于模糊聚類的視頻點播推薦系統的推薦方法,包括如下步驟:
(1)采集視頻點播系統的訪問記錄,對異常訪問記錄進行清洗,根據訪問記錄的狀態屬性識別用戶會話,并對字符屬性進行轉化,對轉化后的訪問記錄進行特征篩選,依據特征相似性指標篩選出關鍵特征,對篩選后的數據再進行主成份分析,根據特征的累計貢獻率確定特征的維數;
(2)對數據預處理模塊的輸出數據進行標準化操作和有放回的隨機抽樣,利用KR密度估計法和K-Means分析,初始化模糊聚類中心,應用模糊聚類算法SFCM,產生模糊聚類中心,系統訪問模式及系統訪問推薦列表;
(3)以用戶為分類依據,使用緩存技術預處理用戶訪問記錄,利用KR密度估計法生成用戶的的初始化聚類中心并計算主成份分析中的綜合變量值,根據用戶訪問模式與系統訪問模式的隸屬度閾值和比例,產生該用戶的個性化視頻點播推薦列表;
(4)通過對劃分系數和可行性劃分系數的定義,結合聚類有效性函數,對模糊聚類算法SFCM的參數進行調節,達到較好的模糊聚類效果,實現較優的視頻點播個性化推薦服務。
本發明的有益效果如下:
1、本發明采用特征篩選和主成分分析的方法,實現源數據降維并保存源數據的信息量,提高了模糊聚類的效率。
2、針對大數據量樣本采用隨機抽樣和KR密度估計算法,實現模糊聚類中心初始化,加快了模糊聚類的收斂速度,并利用模糊聚類中心建立系統訪問模式。通過模糊聚類產生用戶訪問模式及其在系統訪問模式中的隸屬度,根據隸屬度的比例生成個性化的用戶推薦列表,實現個性化的視頻點播推薦。
3、有效的降低源數據中噪音數據對推薦結果的影響,同時提高模糊聚類的執行效率和收斂時間,為用戶提供更合理的個性化視頻節目的推薦服務。
附圖說明
圖1為本發明的視頻點播推薦系統結構組成框圖。
圖2為特征選擇和數據預處理圖。
圖3為模糊聚類生成系統訪問模式的數據流程圖。
圖4為生成個性化用戶推薦列表的數據流程圖。
具體實施方式
下面結合附圖對本發明創造做進一步詳細說明。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇廣播電視大學,未經江蘇廣播電視大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110216933.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:設置配重懸墜邊的床單
- 下一篇:經編間隔結構的充氣床墊





