[發(fā)明專利]基于用戶興趣的個性化元搜索引擎及搜索結(jié)果處理方法無效
| 申請?zhí)枺?/td> | 200910020951.4 | 申請日: | 2009-01-16 |
| 公開(公告)號: | CN101477554A | 公開(公告)日: | 2009-07-08 |
| 發(fā)明(設計)人: | 杜晨光;顏濤;鄧雙成;李曉輝 | 申請(專利權(quán))人: | 西安電子科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 陜西電子工業(yè)專利中心 | 代理人: | 王品華;黎漢華 |
| 地址: | 71007*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 用戶 興趣 個性化 搜索引擎 搜索 結(jié)果 處理 方法 | ||
1.一種基于用戶興趣的個性化元搜索引擎,主要由用戶注冊/登錄單元、元搜索結(jié)果收集單元和個性化處理單元組成,其特征在于個性化處理單元,包括:
搜索結(jié)果預處理模塊,用于接收元搜索結(jié)果收集單元送入的搜索結(jié)果原始數(shù)據(jù),進行基于網(wǎng)址和基于摘要內(nèi)容的去除重復處理,并將處理后的搜索結(jié)果送入個性化排序處理模塊;
個性化排序處理模塊,用于接收搜索結(jié)果預處理模塊送入的搜索結(jié)果數(shù)據(jù),并進行基于用戶興趣和搜索意圖的個性化排序處理,將排序后的搜索結(jié)果提交給用戶;
用戶興趣更新模塊,用于捕獲用戶對搜索結(jié)果的點擊行為,對用戶點擊過的搜索結(jié)果進行興趣分析,并對用戶興趣數(shù)據(jù)庫中存儲的用戶興趣模型數(shù)據(jù)進行更新;
用戶興趣數(shù)據(jù)庫,用于存儲網(wǎng)站注冊用戶的興趣模型數(shù)據(jù),并將這些數(shù)據(jù)提供給個性化排序處理模塊進行個性化排序。
2.一種基于用戶興趣的個性化元搜索引擎結(jié)果處理方法,包括:
步驟1.建立并初始化用戶興趣模型數(shù)據(jù),保存在服務器的用戶興趣數(shù)據(jù)庫中;
步驟2.將用戶輸入的搜索詞語,按各獨立搜索引擎要求的格式分發(fā)出去,并收集它們返回的結(jié)果,將收集的返回結(jié)果轉(zhuǎn)換成統(tǒng)一的格式;
步驟3.將轉(zhuǎn)換成統(tǒng)一格式的搜索結(jié)果進行去除重復處理;
步驟4.根據(jù)用戶興趣模型和本次搜索詞語對去除重復處理后的搜索結(jié)果進行個性化排序,并將該排序結(jié)果提交給用戶;
步驟5.捕獲用戶點擊的搜索結(jié)果,對其進行興趣分析,改變興趣種類和權(quán)值大小,并根據(jù)改變的結(jié)果更新用戶興趣數(shù)據(jù)庫中用戶的興趣模型數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的基于用戶興趣的個性化元搜索引擎結(jié)果處理方法,其中步驟1所述的建立用戶興趣模型數(shù)據(jù),包括兩種方式:一是用戶直接通過主動選擇網(wǎng)站提供的興趣類別并設置權(quán)值大小,建立該用戶的用戶興趣模型數(shù)據(jù);二是搜索引擎系統(tǒng)通過興趣更新模塊對用戶搜索行為的興趣分析,自動建立用戶興趣模型數(shù)據(jù)。
4.根據(jù)權(quán)利要求2或3所述的基于用戶興趣的個性化元搜索引擎結(jié)果處理方法,其中所述的用戶興趣模型數(shù)據(jù),用I(C)={(c1,w1),(c2,w2),...,(cm,wm)}表示,其中(ci,wi)是用戶的一個興趣分量,ci為興趣類別,wi為ci對應的歸一化權(quán)值,該用戶興趣模型數(shù)據(jù)是用于定量描述用戶興趣喜好及其喜好程度的數(shù)據(jù)集。
5.根據(jù)權(quán)利要求2所述的基于用戶興趣的個性化元搜索引擎結(jié)果處理方法,其中步驟3所述的將轉(zhuǎn)換成統(tǒng)一格式的搜索結(jié)果進行去除重復處理,是先將統(tǒng)一格式的搜索結(jié)果按照網(wǎng)址是否相同進行過濾,只保留網(wǎng)址不同的搜索結(jié)果;再將各條搜索結(jié)果的摘要內(nèi)容與其它搜索結(jié)果的摘要內(nèi)容進行文本比較,濾除摘要內(nèi)容相似的搜索結(jié)果。
6.根據(jù)權(quán)利要求2所述的基于用戶興趣的個性化元搜索引擎結(jié)果處理方法,其中步驟4所述的根據(jù)用戶興趣模型和本次搜索詞語對去除重復處理后的搜索結(jié)果的個性化排序方法,按如下步驟進行:
(6a)分別計算搜索詞語與用戶興趣的相關度向量和搜索結(jié)果與用戶興趣的相關度向量;
(6b)根據(jù)步驟(6a)得到的相關度向量,計算搜索結(jié)果與用戶搜索詞語的相關度向量;
(6c)計算搜索結(jié)果在各獨立搜索引擎上的排名得分向量;
(6d)將步驟(6b)和(6c)得到的數(shù)值進行加權(quán)綜合,得到每條搜索結(jié)果基于用戶興趣的權(quán)值,并按權(quán)值大小排序,得到個性化排序結(jié)果。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學,未經(jīng)西安電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910020951.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





