[發明專利]一種基于DM的農業信息精準推送的方法有效
| 申請號: | 201210177695.1 | 申請日: | 2012-06-01 |
| 公開(公告)號: | CN102750334A | 公開(公告)日: | 2012-10-24 |
| 發明(設計)人: | 欒汝朋;于峰;孫素芬;張峻峰;劉新;張倩;孫利鑫;李剛;郭亮 | 申請(專利權)人: | 北京市農林科學院農業科技信息研究所;北京智農天地網絡技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100097*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 dm 農業 信息 精準 推送 方法 | ||
技術領域
本發明涉及信息處理領域,具體涉及一種利用數據庫挖掘技術(DateMining,DM)提高訪問動態數據庫時的精準信息推送方法。
背景技術
農業信息化的快速發展與廣大用戶需求的個性化,加劇了龐大而無序的海量信息庫與用戶需求之間的矛盾。到2015年,信息化將在農業全領域普遍應用,將建成服務智能推送、渠道豐富多樣的綜合信息服務體系,實現實時準確的農業信息服務。
目前各大網站為用戶推薦的信息基本都是從資源內容關聯的角度進行推薦,沒有考慮用戶的歷史瀏覽行為之間的關聯。近幾年,利用關聯分析等數據挖掘技術對互聯網的訪問記錄進行深度挖掘已成為國內外科研人員研究的熱點。農業信息精準推送的方法主要分為兩種:基于用戶行為分析的和基于內容關鍵詞分析的。
基于用戶行為分析的信息推送方式,通過分析用戶的訪問與瀏覽行為,分析出用戶的喜好和興趣,將有相同喜好用戶所普遍訪問的信息推薦給該用戶,進而為用戶提供更加個性化和精準的信息推送服務。該方式存在的問題主要有:對于不太活躍的用戶或新用戶信息推送效果不理想或無法提供精準信息推送服務。
基于內容關鍵詞分析的信息推送方式,將信息內容通過分詞組件對其進行處理得到信息內容的關鍵詞,再將含有這些關鍵詞的信息內容推送給用戶,從而實現信息的精準推送。該方式存在的問題主要有:由于語言表述的差異,有可能內容相似的兩條信息卻沒有共同的關鍵詞,從而這兩個信息之間的“相似”關系不被發現,無法實現兩者之間的互相推薦。
發明內容
為解決現有技術中針對新用戶或不太活躍用戶在查詢信息時,服務系統不能精確推送訪問內容的問題,本發明提供一種綜合考慮用戶行為和內容關鍵詞的高精準信息推送方式。具體方案如下:一種基于DM的農業信息精準推送的方法,包括:
步驟1、對用戶訪問頁面的規律進行分析;其特征在于,分析的規律包括:
步驟101、對用戶相關行為進行分析并生成行為序列表;
步驟102、對用戶瀏覽頁面內容的分析并生成內容序列表;
步驟2、對行為序列表和內容序列表配以不同的權重后進行組合生成推薦序列表,根據推薦序列表為用戶提供與用戶訪問頁面信息相同或相近的其它頁面。
為提高用戶行為的精確預測:所述步驟101中用戶相關行為分析的因素包括:用戶的歷史瀏覽行為、當前頁面的訪問熱度和當前頁面的訪問時間長短,針對上述信息采用Apriori關聯算法對網站內其它頁面進行關聯,并將關聯出的頁面進行排序。
為避免有關頁面在關聯性計算時被遺漏:所述步驟101中Apriori關聯算法在對關聯出的頁面進行排序時,包括對各個頁面中的相關因素設定權重的步驟,設定權重的因素包括當前面的訪問熱度和當前頁面的訪問時間長短,首先將各個頁面按訪問熱度的權重系數進行排序后,再利用訪問時間長短的權重系數對排序的頁面進行修正,最終生成行為序列表。
為避免熱門頁面影響關聯效果:所述訪問熱度的權重系數設定標準是與其頁面的訪問熱度成反比。
為方便新用戶得到相似性頁面的推薦:所述步驟102中,對用戶瀏覽的每個頁面采用分詞組件進行關鍵詞排序,并針對每個頁面建立一個關鍵詞序列表,再利用TF×IDF根據關鍵詞序列表在網站內其它頁面中進行內容相關性分析,并將分析出的頁面生成內容序列表。
為提高最終推薦頁面的精確性:所述步驟2中將用戶行為的分析結果與用戶瀏覽頁面的分析結果按不同的權重比例計算后進行排序,步驟如下:
步驟601、基于用戶行為序列表和內容序列表,分別得到行為關聯度倒序列表和內容相似度倒序列表;
步驟602、通過各自列表的極值分別將關聯度和相似度歸一化映射為0-1區間的值;
步驟603、按數值由大到小進行合并生成組合表,在組合表中,行為關聯度優先于內容相似度且同一個頁面中以較大的特征數值為準。
為提高程序執行效率:所述用戶序列表和內容序列表的內容包括相同或相似頁面的url。
為使新用戶有針對性的頁面推薦:所述步驟1中包括對當前頁面是否是常用頁面的判斷步驟,判斷的依據是當前頁面的點擊量。
本發明通過對訪問用戶意圖的準確理解和涉及到的相關農業信息的尋優及生成,采集用戶訪問站點的訪問記錄,對采集的數據進行預處理;然后對數據進行挖掘,找出訪問規則和用戶集,建立訪問站點的用戶訪問模式,最后按照用戶訪問模式結合其瀏覽行為關聯和內容關聯兩個方面來實現一種新的農業信息精準推送方式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市農林科學院農業科技信息研究所;北京智農天地網絡技術有限公司,未經北京市農林科學院農業科技信息研究所;北京智農天地網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210177695.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種理想圓柱孔珩磨頭裝置及其構造方法
- 下一篇:螺旋力累加增距增力器
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





