[發明專利]基于用戶興趣的個性化元搜索引擎及搜索結果處理方法無效
| 申請號: | 200910020951.4 | 申請日: | 2009-01-16 |
| 公開(公告)號: | CN101477554A | 公開(公告)日: | 2009-07-08 |
| 發明(設計)人: | 杜晨光;顏濤;鄧雙成;李曉輝 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 陜西電子工業專利中心 | 代理人: | 王品華;黎漢華 |
| 地址: | 71007*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 用戶 興趣 個性化 搜索引擎 搜索 結果 處理 方法 | ||
1.一種基于用戶興趣的個性化元搜索引擎,主要由用戶注冊/登錄單元、元搜索結果收集單元和個性化處理單元組成,其特征在于個性化處理單元,包括:
搜索結果預處理模塊,用于接收元搜索結果收集單元送入的搜索結果原始數據,進行基于網址和基于摘要內容的去除重復處理,并將處理后的搜索結果送入個性化排序處理模塊;
個性化排序處理模塊,用于接收搜索結果預處理模塊送入的搜索結果數據,并進行基于用戶興趣和搜索意圖的個性化排序處理,將排序后的搜索結果提交給用戶;
用戶興趣更新模塊,用于捕獲用戶對搜索結果的點擊行為,對用戶點擊過的搜索結果進行興趣分析,并對用戶興趣數據庫中存儲的用戶興趣模型數據進行更新;
用戶興趣數據庫,用于存儲網站注冊用戶的興趣模型數據,并將這些數據提供給個性化排序處理模塊進行個性化排序。
2.一種基于用戶興趣的個性化元搜索引擎結果處理方法,包括:
步驟1.建立并初始化用戶興趣模型數據,保存在服務器的用戶興趣數據庫中;
步驟2.將用戶輸入的搜索詞語,按各獨立搜索引擎要求的格式分發出去,并收集它們返回的結果,將收集的返回結果轉換成統一的格式;
步驟3.將轉換成統一格式的搜索結果進行去除重復處理;
步驟4.根據用戶興趣模型和本次搜索詞語對去除重復處理后的搜索結果進行個性化排序,并將該排序結果提交給用戶;
步驟5.捕獲用戶點擊的搜索結果,對其進行興趣分析,改變興趣種類和權值大小,并根據改變的結果更新用戶興趣數據庫中用戶的興趣模型數據。
3.根據權利要求2所述的基于用戶興趣的個性化元搜索引擎結果處理方法,其中步驟1所述的建立用戶興趣模型數據,包括兩種方式:一是用戶直接通過主動選擇網站提供的興趣類別并設置權值大小,建立該用戶的用戶興趣模型數據;二是搜索引擎系統通過興趣更新模塊對用戶搜索行為的興趣分析,自動建立用戶興趣模型數據。
4.根據權利要求2或3所述的基于用戶興趣的個性化元搜索引擎結果處理方法,其中所述的用戶興趣模型數據,用I(C)={(c1,w1),(c2,w2),...,(cm,wm)}表示,其中(ci,wi)是用戶的一個興趣分量,ci為興趣類別,wi為ci對應的歸一化權值,該用戶興趣模型數據是用于定量描述用戶興趣喜好及其喜好程度的數據集。
5.根據權利要求2所述的基于用戶興趣的個性化元搜索引擎結果處理方法,其中步驟3所述的將轉換成統一格式的搜索結果進行去除重復處理,是先將統一格式的搜索結果按照網址是否相同進行過濾,只保留網址不同的搜索結果;再將各條搜索結果的摘要內容與其它搜索結果的摘要內容進行文本比較,濾除摘要內容相似的搜索結果。
6.根據權利要求2所述的基于用戶興趣的個性化元搜索引擎結果處理方法,其中步驟4所述的根據用戶興趣模型和本次搜索詞語對去除重復處理后的搜索結果的個性化排序方法,按如下步驟進行:
(6a)分別計算搜索詞語與用戶興趣的相關度向量和搜索結果與用戶興趣的相關度向量;
(6b)根據步驟(6a)得到的相關度向量,計算搜索結果與用戶搜索詞語的相關度向量;
(6c)計算搜索結果在各獨立搜索引擎上的排名得分向量;
(6d)將步驟(6b)和(6c)得到的數值進行加權綜合,得到每條搜索結果基于用戶興趣的權值,并按權值大小排序,得到個性化排序結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910020951.4/1.html,轉載請聲明來源鉆瓜專利網。





