[發(fā)明專利]一種基于搜索引擎的搜索結(jié)果排序方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 200710187276.5 | 申請(qǐng)日: | 2007-11-15 |
| 公開(公告)號(hào): | CN101158971A | 公開(公告)日: | 2008-04-09 |
| 發(fā)明(設(shè)計(jì))人: | 劉漢洲 | 申請(qǐng)(專利權(quán))人: | 深圳市迅雷網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人: | 劉松 |
| 地址: | 518057廣東省深圳市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 搜索引擎 搜索 結(jié)果 排序 方法 裝置 | ||
1.一種基于搜索引擎的搜索結(jié)果排序方法,其特征在于,包括下列步驟:
對(duì)用戶輸入的搜索詞進(jìn)行分詞處理;
以分詞處理所得的分詞分別在關(guān)鍵詞索引中進(jìn)行查找,以確定所述搜索詞在各待排序網(wǎng)絡(luò)資源中的關(guān)鍵詞權(quán)重;
確定所述搜索詞在各待排序網(wǎng)絡(luò)資源中的總權(quán)重;以及
按照總權(quán)重對(duì)所述各待排序的網(wǎng)絡(luò)資源進(jìn)行排序,并呈現(xiàn)給用戶。
2.如權(quán)利要求1所述的方法,其特征在于,在用戶輸入搜索詞進(jìn)行搜索之前還包括:以詞和詞的屬性作為基本結(jié)構(gòu),定制關(guān)鍵詞詞典的步驟;定制的關(guān)鍵詞詞典中包括各有效詞和每一有效詞對(duì)應(yīng)的屬性,以及各無(wú)效詞和每一無(wú)效詞對(duì)應(yīng)的屬性。
3.如權(quán)利要求2所述的方法,其特征在于,所述無(wú)效詞的集合與有效詞的集合互為互斥關(guān)系。
4.如權(quán)利要求3所述的方法,其特征在于,一個(gè)所述無(wú)效詞包含的字符覆蓋一個(gè)有效詞包含的字符。
5.如權(quán)利要求2所述的方法,其特征在于,所述詞的屬性以字符型數(shù)字表示,每一位字符分別表示所述詞的一種屬性。
6.如權(quán)利要求2所述的方法,其特征在于,在用戶輸入搜索詞進(jìn)行搜索之前還包括:依據(jù)關(guān)鍵詞詞典,按最大匹配原則對(duì)每一網(wǎng)絡(luò)資源的主題信息進(jìn)行分詞處理;根據(jù)分詞處理所得分詞的屬性對(duì)該分詞進(jìn)行過(guò)濾,以提取每一網(wǎng)絡(luò)資源的主題信息的關(guān)鍵詞。
7.如權(quán)利要求1所述的方法,其特征在于,在用戶輸入搜索詞進(jìn)行搜索之前還包括:
分別對(duì)每一網(wǎng)絡(luò)資源的主題信息的各關(guān)鍵詞進(jìn)行分詞處理;
建立關(guān)鍵詞的各分詞到網(wǎng)絡(luò)資源的關(guān)鍵詞索引。
8.如權(quán)利要求7所述的方法,其特征在于,還包括配置權(quán)重的步驟,其中包括:
根據(jù)關(guān)鍵詞的各分詞詞長(zhǎng)占該關(guān)鍵詞詞長(zhǎng)的比例,為各分詞分別配置分詞權(quán)重;或者
根據(jù)網(wǎng)絡(luò)資源的信息,為該網(wǎng)絡(luò)資源配置靜態(tài)權(quán)重,并根據(jù)關(guān)鍵詞的各分詞詞長(zhǎng)占該關(guān)鍵詞詞長(zhǎng)的比例,為各分詞分別配置分詞權(quán)重。
9.如權(quán)利要求8所述的方法,其特征在于,所述網(wǎng)絡(luò)資源的信息包括:被瀏覽次數(shù)和/或被引用情況和/或被下載次數(shù)和/或文件格式和/或文件大小。
10.如權(quán)利要求1所述的方法,其特征在于,將以分詞處理所得分詞分別在關(guān)鍵詞索引中進(jìn)行查找,以確定每一分詞在各待排序網(wǎng)絡(luò)資源的主題信息的關(guān)鍵詞中的分詞權(quán)重;
將各分詞在同一待排序網(wǎng)絡(luò)資源的主題信息中的分詞權(quán)重相加,作為所述搜索詞在該待排序網(wǎng)絡(luò)資源中的關(guān)鍵詞權(quán)重。
11.如權(quán)利要求10所述的方法,其特征在于,所述總權(quán)重至少包括:搜索詞在所述待排序網(wǎng)絡(luò)資源中的關(guān)鍵詞權(quán)重。
12.如權(quán)利要求10所述的方法,其特征在于,確定所述搜索詞在各待排序網(wǎng)絡(luò)資源中的總權(quán)重,包括下列步驟:
取根據(jù)當(dāng)前待排序網(wǎng)絡(luò)資源的信息配置的靜態(tài)權(quán)重;
取所述搜索詞在當(dāng)前待排序網(wǎng)絡(luò)資源中的關(guān)鍵詞權(quán)重;
將當(dāng)前待排序網(wǎng)絡(luò)資源的靜態(tài)權(quán)重與關(guān)鍵詞權(quán)重組合成當(dāng)前待排序網(wǎng)絡(luò)資源的總權(quán)重。
13.如權(quán)利要求12所述的方法,其特征在于,當(dāng)前待排序網(wǎng)絡(luò)資源的總權(quán)重為W(docid)=q1*Ws(docid)+q2*Wk(docid),
其中,docid表示當(dāng)前待排序的網(wǎng)絡(luò)資源;
q1表示靜態(tài)權(quán)重占總權(quán)重的比例;
Ws(docid)表示靜態(tài)權(quán)重;
q2表示關(guān)鍵詞權(quán)重占總權(quán)重的比例;
Wk(docid)表示關(guān)鍵詞權(quán)重。
14.如權(quán)利要求1所述的方法,其特征在于,在用戶輸入搜索詞進(jìn)行搜索之前還包括:
根據(jù)基礎(chǔ)分詞詞典對(duì)網(wǎng)絡(luò)資源的主題信息進(jìn)行分詞處理;
建立網(wǎng)絡(luò)資源的各分詞到網(wǎng)絡(luò)資源的資源索引。
15.如權(quán)利要求14所述的方法,其特征在于,確定所述待排序網(wǎng)絡(luò)資源,包括下列步驟:
以對(duì)搜索詞進(jìn)行分詞處理所得分詞分別在資源索引中進(jìn)行查找,以分別確定每一分詞所屬的網(wǎng)絡(luò)資源的集合;
取各所述集合的交集,作為待排序的網(wǎng)絡(luò)資源。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市迅雷網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)深圳市迅雷網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710187276.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 內(nèi)容-索引搜索系統(tǒng)和方法
- 通過(guò)若干搜索引擎實(shí)現(xiàn)的聯(lián)合搜索
- 一種深層網(wǎng)移動(dòng)搜索方法、服務(wù)器及系統(tǒng)
- 搜索引擎的狀態(tài)獲取方法、裝置以及瀏覽器
- 一種瀏覽器中進(jìn)行網(wǎng)頁(yè)搜索的方法及裝置
- 通過(guò)若干搜索引擎實(shí)現(xiàn)的聯(lián)合搜索
- 通過(guò)搜索引擎生成定制化內(nèi)容的方法、系統(tǒng)及搜索引擎
- 通過(guò)搜索引擎?zhèn)鬟f信息的方法、系統(tǒng)及搜索引擎
- 搜索引擎的切換方法、裝置以及電子設(shè)備
- 搜索引擎處理方法、裝置、終端及存儲(chǔ)介質(zhì)





