[發明專利]一種基于關聯規則與貝葉斯網絡集成的推薦技術在審
| 申請號: | 201610096873.6 | 申請日: | 2016-02-23 |
| 公開(公告)號: | CN107103000A | 公開(公告)日: | 2017-08-29 |
| 發明(設計)人: | 肖建軍 | 申請(專利權)人: | 廣州啟法信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510665 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 關聯 規則 貝葉斯 網絡 集成 推薦 技術 | ||
技術領域
本發明涉及商務類網站的智能推薦技術領域,具體涉及將關聯規則與貝葉斯網絡集成的推薦算法。
背景技術
互聯網和信息技術快速發展使得商務網站交易越來越頻繁,大量的信息聚集起來形成海量信息。幫助用戶從海量信息中快速準確地尋找到自己感興趣的信息,建立一個有效的推薦系統,可以使商務網站建立穩定的企業忠實顧客群,提高用戶滿意度。
關聯規則由于形式很簡單,應用方便,得到快速的發展。關聯規則可用于發現商務網站交易數據庫中不同項目之間的聯系,這些規則反映了用戶的網站瀏覽模式。發現這些規則可以應用向用戶推薦感興趣的網址。自從關聯規則提出以來,已成為主流的推薦技術。但是關聯規則不能表達不同規則之間的聯系,這極大地限制了關聯規則在復雜情形下的應用。而貝葉斯網絡用圖形化的形式表示了如何將與一系列節點相關的條件概率函數組合成為一個整體的聯合概率分布函數。一個貝葉斯網絡包括了一個結構模型和與之相關的一組條件概率分布函數。結構模型是一個有向無環圖,其中的節點表示了隨機變量,它是對于過程、事件、狀態等實體的某特性的描述,邊則表示變量間的概率依賴關系。圖中的每個節點都有一個在給定其父節點情況下該節點的條件概率分布函數。
由于貝葉斯網是變量的聯合概率的表示,所以在對節點狀態進行推理的過程中,能夠綜合考慮各個因素(父節點)的影響,由于關聯規則和貝葉斯網絡都是以概率論為理論基礎的,可以考慮使用貝葉斯網絡修正關聯規則,并通過概率推論的方式預測當前用戶訪問對未曾瀏覽網址的概率,將得到的結果排序,推薦概率top-N的網址。
本發明根據用戶歷史瀏覽信息,發現商務網站交易數據庫中不同項目之間的聯系,將這些反映了用戶的網站瀏覽模式的規則用有向無環圖表達出來,基于貝葉斯網絡預測當前用戶訪問各網址的條件概率,找出條件概率最大的N個網址推薦給用戶。為用戶提供個性化的服務的同時建立網站與用戶之間的密切關系,讓用戶對推薦系統產生依賴,從而建立穩定的企業忠實顧客群,實現客戶鏈式反應增值,提高消費者滿意度。通過提高服務效率幫助消費者節約交易成本等,制定有針對性的營銷戰略方針,促進企業長期穩定高速發展。
發明內容
本發明針對商務網站的智能推薦技術,在關聯規則的基礎上學習貝葉斯網絡結構,提出將關聯規則與貝葉斯網絡集成的推薦算法。
方法包括以下步驟:首先,對網址進行關聯分析,并將關聯規則按提升度排序。然后,依據關聯規則前后件的關系,將關聯規則轉化成初始貝葉斯網絡。再然后對初始貝葉斯網絡進行結構學習,尋找最優貝葉斯網絡結構,并學習最優貝葉斯網絡結構的參數,此時的最優貝葉斯網絡相當于對關聯規則的修正。最后使用貝葉斯方法預測當前用戶訪問未知網址的概率,將概率最大的N個網址推薦給用戶。
所述的將關聯規則與貝葉斯網絡集成,是對原始事務集使用Apriori算法得到關聯規則,按提升度排序后,將其轉化成貝葉斯網絡結構。貝葉斯網的結構是一個有向無環圖,圖中的每一個節點唯一地對應一個隨機變量,節點的狀態對應于隨機變量的值。圖中的有向邊表示變量(節點)之間的條件(因果)依賴關系。關聯規則的前件和后件間也蘊含著一種依賴關系,轉化的思路就是將關聯規則中的這種依賴關系用貝葉斯網的結構表示出來。
所述的貝葉斯預測,將所有網址是否被訪問看成一組隨機向量變量,當前用戶的歷史訪問記錄就是一個樣本,結合這個樣本數據和參數先驗,預測某個網址被訪問的概率。變量包含貝葉斯網絡節點和非貝葉斯網絡節點兩部分,假設貝葉斯網絡節點條件獨立,非貝葉斯網絡節點相互獨立,貝葉斯網絡節點和非貝葉斯網絡節點相互獨立。
所述的關聯規則與貝葉斯網絡集成的推薦算法具體步驟如下:
1)數據預處理。在對原始數據的探索分析的基礎上,發現與分析目標無關或模型需要處理的數據,針對此類數據進行處理。通過數據清洗、數據集成和數據變換,將原始數據處理成模型需要的輸入數據。其中 為用戶集,為網址集。
2)關聯規則。首先將數據集D轉化成事務集DT, 考慮到要與貝葉斯網絡對應,本發明只分析具有單個后件屬性狀態的關聯規則前件更新問題,因此Apriori算法只需檢索出事務數據庫中的所有2項頻繁項集,利用頻繁項集構造出滿足用戶最小提升度的規則,并根據提升度將規則按從大到小的順序排列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州啟法信息科技有限公司,未經廣州啟法信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610096873.6/2.html,轉載請聲明來源鉆瓜專利網。





