[發明專利]一種Web新網頁推薦方法無效
| 申請號: | 201010155971.5 | 申請日: | 2010-04-26 |
| 公開(公告)號: | CN102236655A | 公開(公告)日: | 2011-11-09 |
| 發明(設計)人: | 張巖 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京北新智誠知識產權代理有限公司 11100 | 代理人: | 趙郁軍 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 web 網頁 推薦 方法 | ||
技術領域
本發明涉及一種推薦Web新網頁的方法,尤其涉及一種針對搜索引擎排名算法的弱點,在盡量不影響搜索結果質量的前提下,向用戶推薦高質量的新網頁的方法,屬于互聯網搜索技術領域。
背景技術
當前,搜索引擎已經漸漸成為人們獲取信息的主要方式之一。當搜索引擎把查詢結果返回給用戶時,查詢結果的排列方式對結果被用戶關注和點擊的概率具有絕對的影響。那么應該如何對結果合理排名呢?在結果與查詢關鍵詞的匹配度一樣的情況下,最理想的排名方案應該是按照結果頁面質量從高到低排列。然而頁面質量(page?quality)是一個相當主觀的概念。它需要通過網絡用戶的主觀判斷而得到,但是首先人工的評判需要大量的人力物力財力,耗費大量的時間。其次,由于不同的個體對于同一個Web頁面的質量可能會得出不同的評價,使得人工網頁評價成為相當不實際的做法。
在此背景下,搜索引擎排名算法的設計者轉而考慮用一些客觀的易于被觀察和計算的特征值來替代和近似估計一個網頁的重要性程度。因而,Web頁面流行度(page?popularity)的概念被提出了。Web頁面流行度代表一個網頁被用戶喜歡的程度,可以用頁面獲得的inlink數或者點擊次數來計算。1998年S.Brin和L.Page等人提出了利用Web鏈接結構圖來獲得頁面重要性的算法,即PageRank算法。PageRank算法很好地利用了“群體智慧”,使搜索引擎的性能大為提高,是當前排名算法中的佼佼者。因此,PageRank算法目前仍然是絕大多數商業搜索引擎的排名算法的基礎。
基于網頁流行度的排名算法雖然能夠幫助網絡用戶搜尋有用的信息,但它同時也引發了一些弊端。Web是一個規模巨大、新舊頁面不斷更替的動態環境,其中每個新頁面都會經歷一個流行度從小到大,直到與其本身質量相一致的成長過程。當用網頁流行度來近似獲得網頁質量時,Web新頁面的質量往往被低估了。特別是當搜索引擎開始主導用戶的瀏覽模式時,新頁面被訪問的概率大大下降,流行度的成長過程被大大的延長了。
為了解決新網頁容易被搜索引擎所忽視的問題,S.Pandey和S.Roy等人提出了一種Shuffling方法。該方法的本質是剝奪一個成熟頁面被展示的機會,而把這個機會讓給某個被隨機推薦出來的新頁面。由于Shuffling方法在選取被推薦的新頁面時采用的是隨機法,因此被推薦的新頁面的質量可能參差不齊,所以很可能造成一個質量不佳的新頁面占據了良好的展示位置出現在結果集合中,卻沒有能為用戶帶來有用信息的局面。雖然Shuffling方法在理論上對于新頁面提升認知度有一定作用,但實際應用的效果難以得到保障。
在提高搜索結果時效性方面也有很多類似的技術。例如在專門針對新聞時事的搜索引擎中,搜索結果通常都是按照頁面發布的時間或者時新度(freshness)排名的,因為新聞搜索引擎的用戶更關注的是最新報道,根據結果時效性來對結果排名是最符合用戶需求的。頁面時效性對于新聞搜索排名是有實際意義的,但無法用于評價新網頁的質量,因此并不適合作為推薦普遍意義上的新頁面的衡量標準。
發明內容
本發明所要解決的技術問題在于提供一種Web新網頁推薦方法。該方法可以使新頁面有更多機會被用戶認知,有助于優化搜索引擎的排名,提高用戶滿意度。
為了實現上述的發明目的,本發明采用下述的技術方案:
一種Web新網頁推薦方法,其特征在于包括如下步驟:
對于新網頁,首先確定所述新網頁出現在搜索引擎返回結果中的推薦比例;然后估測新頁面的潛在質量,根據潛在質量的高低以預定的概率選取被推薦的新網頁;將被推薦的新網頁和搜索引擎返回結果一起展示給用戶。
其中,所述推薦比例為15%~20%。
在估測新頁面的潛在質量時,使用的方法包括以下三種:
(1)使用新網頁當前的PageRank結果(簡稱Naive方法)
(2)使用兄弟頁面PageRank的均值(簡稱ASP方法)
(3)使用兄弟頁面PageRank的中值(簡稱MSP方法)
將被推薦的新網頁和搜索引擎返回結果一起展示給用戶時,可以采用的頁面展示方法包括顯式展示法和隱式展示法,其中隱式展示法是將被推薦的新頁面與原來的10個結果混合在一起,沒有區分的展示給用戶;顯式展示法是將被推薦的新頁面以某種顯著的方式展示給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010155971.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全球定位系統終端設備
- 下一篇:切割機





