[發明專利]一種基于搜索引擎的搜索結果排序方法及裝置有效
| 申請號: | 200710187276.5 | 申請日: | 2007-11-15 |
| 公開(公告)號: | CN101158971A | 公開(公告)日: | 2008-04-09 |
| 發明(設計)人: | 劉漢洲 | 申請(專利權)人: | 深圳市迅雷網絡技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 | 代理人: | 劉松 |
| 地址: | 518057廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 搜索引擎 搜索 結果 排序 方法 裝置 | ||
技術領域
本發明涉及搜索引擎領域,特別是涉及一種基于搜索引擎的搜索結果排序方法及裝置。
背景技術
隨著搜索引擎技術的不斷發展與信息處理技術的進步,人們對搜索引擎的需求也越來越廣泛,搜索引擎的種類也呈現多樣化發展。目前,主流的搜索引擎分為:全文搜索引擎、目錄搜索引擎和元搜索引擎。近期,垂直搜索引擎也逐漸進入了人們的視野。
在搜索引擎領域,評價一個搜索引擎好壞的重要標準就是能否讓用戶盡快找到所需的信息,即與用戶搜索主題相關的各種信息。
近年來,各大搜索引擎在搜索結果的相關性排序上均做了優化。所謂搜索結果的相關性就是指用戶搜索詞和頁面的相關程度。通常,相關性是搜索引擎進行排序的一個重要依據。計算頁面相關性的主要方法有google的PageRank、Bharat的HillTop、百度的超鏈分析等。它們的基本原理就是根據網頁的引用情況進行排序。
但是由于在中文搜索引擎中存在分詞的問題,詞典是以搜索詞作為查詢詞的搜索引擎的基礎。詞典的好壞在一定程度上決定著搜索結果排序的效果。詞典過小,會導致過多的無關信息的出現;詞典過大,有時會導致部分詞搜索結果的主題過少等問題出現。因此如何確定詞典,增加新的擴充詞典集,使搜索引擎的結果更加準確、更加人性化就隨之成為一個備受關注的問題。
發明內容
本發明實施例提供一種基于搜索引擎的搜索結果排序方法及裝置,使排序結果更加貼近用戶的需求。
本發明實施例的一種基于搜索引擎的搜索結果排序方法,包括下列步驟:對用戶輸入的搜索詞進行分詞處理;以分詞處理所得的分詞分別在關鍵詞索引中進行查找,以確定所述搜索詞在各待排序網絡資源中的關鍵詞權重;確定所述搜索詞在各待排序網絡資源中的總權重;以及按照總權重對所述各待排序的網絡資源進行排序,并呈現給用戶。
本發明實施例的一種基于搜索引擎的搜索結果排序裝置,包括:分詞單元,用于對用戶輸入的搜索詞進行分詞處理;關鍵詞權重確定單元,用于以分詞處理所得分詞分別在關鍵詞索引中進行查找,以確定所述搜索詞在各待排序網絡資源中的關鍵詞權重;總權重確定單元,用于確定所述搜索詞在各待排序網絡資源中的總權重;排序單元,用于按照總權重對所述各待排序的網絡資源進行排序;呈現單元,用于向用戶呈現排序結果。
綜上所述,本發明實施例中對用戶輸入的搜索詞進行分詞處理;以分詞處理所得的分詞分別在關鍵詞索引中進行查找,以確定所述搜索詞在各待排序網絡資源中的關鍵詞權重,并確定所述搜索詞在各待排序網絡資源中的總權重。由于總權重中考慮了搜索詞與關鍵詞的匹配等情況,所以按照總權重對所述各待排序的網絡資源進行排序并呈現給用戶,可更加貼近用戶的需求。
附圖說明
圖1為本發明實施例的方法步驟流程圖;
圖2為本發明實施例的裝置結構示意圖;
圖3為本發明實施例的裝置優化結構示意圖;
圖4為本發明實施例的索引示意圖;
圖5為本發明實施例中確定待排序網絡資源的示意圖;
圖6為本發明實施例中查詢分詞權重的示意圖。
具體實施方式
為了使排序結果更加貼近用戶的需求,本發明實施例提供了一種基于搜索引擎的搜索結果排序方法及裝置,以下分別簡要概述。
本發明實施例提供的一種基于搜索引擎的搜索結果排序方法,在進行了一些預先設置,用戶輸入搜索詞,并且確定了待排序網絡資源之后,參見圖1所示,執行下列主要步驟:
S1、對用戶輸入的搜索詞進行分詞處理(本步驟也可在確定待排序網絡資源之前執行)。
S2、以分詞處理所得的分詞分別在關鍵詞索引中進行查找,以確定所述搜索詞在各待排序網絡資源(包括但不限于網頁資源及下載資源,以下不再贅述)中的關鍵詞權重。
S3、確定所述搜索詞在各待排序網絡資源中的總權重。
S4、按照總權重對所述各待排序的網絡資源進行排序,并呈現給用戶。
在用戶輸入搜索詞進行搜索之前,預先的設置步驟,具體包括:
定制關鍵詞詞典的步驟:以詞和詞的屬性作為基本結構,定制的關鍵詞詞典中包括各有效詞和每一有效詞對應的屬性,以及各無效詞和每一無效詞對應的屬性。所述無效詞的集合與有效詞的集合互為互斥關系,并且一個無效詞包含的字符覆蓋一個有效詞包含的字符。所述詞的屬性以字符型數字表示,每一位字符分別表示所述詞的一種屬性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市迅雷網絡技術有限公司,未經深圳市迅雷網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710187276.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種改進的彩鋼外墻保溫裝飾墻板
- 下一篇:一種移動腳手架縱、橫向支撐裝置





