[發(fā)明專利]搜索引擎及其實(shí)現(xiàn)方法有效
| 申請?zhí)枺?/td> | 201110079697.2 | 申請日: | 2011-03-31 |
| 公開(公告)號: | CN102722498A | 公開(公告)日: | 2012-10-10 |
| 發(fā)明(設(shè)計(jì))人: | 呼大為 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市威世博知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44280 | 代理人: | 何青瓦;李慶波 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 搜索引擎 及其 實(shí)現(xiàn) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及搜索引擎技術(shù),尤其涉及一種可擴(kuò)展同義搜索查詢的搜索引擎及其實(shí)現(xiàn)方法。
背景技術(shù)
互聯(lián)網(wǎng)的飛速發(fā)展為人們提供了一個(gè)全新的信息存儲、加工、傳遞和使用的載體,網(wǎng)絡(luò)信息也迅速成為了人們獲取知識和信息的主要渠道之一。而如此規(guī)模的信息資源在將人類占有的幾乎所有知識納入其中的同時(shí),也給資源的使用者帶來了如何充分開發(fā)和利用的問題。搜索引擎正是在這一需求下應(yīng)運(yùn)而生的,它協(xié)助網(wǎng)絡(luò)用戶在互聯(lián)網(wǎng)上查找信息。具體地,搜索引擎根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對信息進(jìn)行組織和處理后,為用戶提供搜索服務(wù),將用戶搜索相關(guān)的信息展示給用戶。
搜索引擎提供的在線搜索服務(wù)通常是基于關(guān)鍵詞的搜索,即用戶通過搜索引擎的輸入框輸入查詢表達(dá)式,搜索引擎進(jìn)行查詢并返回包含這些關(guān)鍵詞的結(jié)果網(wǎng)頁。由于不同用戶的知識背景或使用習(xí)慣不同,對同一事物搜索所使用的關(guān)鍵詞可能也會不同,再加上自然語言中本身就存在很多同義詞或近義詞,所以僅基于用戶提供的關(guān)鍵詞來搜索是不夠的。目前,很多搜索引擎都具有擴(kuò)展查詢的功能,如同義擴(kuò)展查詢。當(dāng)搜索引擎接收到用戶輸入的原始查詢表達(dá)式后,會對其進(jìn)行分詞操作,并識別分詞后的詞條集合中是否有潛在的同義詞對。具體地,搜索引擎會將切分后的詞條和預(yù)定的同義詞詞庫進(jìn)行匹配,判斷這些詞條中是否存在同義詞的,如果是,則會在同義詞的基礎(chǔ)上擴(kuò)展搜索查詢,并將擴(kuò)展的查詢結(jié)果和原始的查詢結(jié)果合并后返回顯示給用戶。從而,為用戶提供了更多相關(guān)的搜索結(jié)果。
目前,搜索引擎都會在查詢結(jié)果中對用戶輸入的查詢詞進(jìn)行標(biāo)紅處理,從而可以供用戶快速地定位所需要查找的信息。當(dāng)然,對于同義擴(kuò)展查詢結(jié)果中的同義詞也會標(biāo)紅或用不同于原詞標(biāo)紅的其它顏色進(jìn)行展示,如美國公開專利申請US2008/0208835A所示。然而,有些原詞和同義詞的相似程度較低,如“土豆”和“馬鈴薯”,對于這種相似程度比較低的同義詞進(jìn)行標(biāo)紅的話,會給用戶帶來突兀感。這種情況下,用戶在瀏覽搜索結(jié)果時(shí),猛一看還以為搜索引擎出錯(cuò)了,從而會給用戶帶來不良的使用體驗(yàn)。
有鑒于此,有必要對現(xiàn)有的搜索引擎予以改進(jìn),以解決上述問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種搜索引擎,其能夠根據(jù)同義詞和原詞的相似度等級在搜索結(jié)果中對同義詞進(jìn)行相適應(yīng)的展示,從而在供用戶快速定位所需信息的同時(shí)避免給用戶帶來突兀感,以提升用戶的使用體驗(yàn)。
本發(fā)明的目的還在于提供一種上述搜索引擎的實(shí)現(xiàn)方法。
為實(shí)現(xiàn)上述發(fā)明目的之一,本發(fā)明的一種搜索引擎的實(shí)現(xiàn)方法,其包括如下步驟:
接收用戶搜索的原始查詢式;
分析所述原始查詢式,以獲取存在于原始查詢式中的原詞以及該原詞的同義詞,并且將所述同義詞替代原始查詢式中的原詞以獲得同義查詢式;
根據(jù)所述原始查詢式和同義查詢式搜索并獲得查詢結(jié)果;
判斷所述同義詞與原詞的相似度等級,并根據(jù)所述相似度等級確定查詢結(jié)果中同義詞的展示方式。
作為本發(fā)明的進(jìn)一步改進(jìn),所述同義詞的展示方式包括對同義詞進(jìn)行特定顏色的展示。
作為本發(fā)明的進(jìn)一步改進(jìn),所述特定顏色包括紅色。
作為本發(fā)明的進(jìn)一步改進(jìn),所述同義詞的展示方式包括對同義詞進(jìn)行特定字體的展示。
作為本發(fā)明的進(jìn)一步改進(jìn),所述特定字體包括粗體或斜體。
作為本發(fā)明的進(jìn)一步改進(jìn),所述相似度等級的判斷包括判斷原詞和同義詞是否屬于專有名詞縮寫、或數(shù)字變換、或地域詞變換;或判斷原詞和同義詞的語義相似度、或詞形相似度、或編輯距離是否大于或等于預(yù)定閾值。
作為本發(fā)明的進(jìn)一步改進(jìn),所述相似度等級至少包括相似度等級較高的第一等級和相似度等級較低的第二等級。
作為本發(fā)明的進(jìn)一步改進(jìn),所述相似度等級還包括相似度等級比第二等級低的第三等級。
作為本發(fā)明的進(jìn)一步改進(jìn),所述特定顏色的標(biāo)注對應(yīng)的相似度等級高于所述特定字體的標(biāo)注對應(yīng)的相似度等級,所述特定字體的標(biāo)注對應(yīng)的相似度等級高于不標(biāo)注對應(yīng)的相似度等級。
作為本發(fā)明的進(jìn)一步改進(jìn),所述判斷相似度等級的步驟包括:判斷原詞和同義詞是否屬于專有名詞縮寫、或數(shù)字變換、或地域詞變換;如果是,則相似度等級為第一等級。
作為本發(fā)明的進(jìn)一步改進(jìn),所述判斷相似度等級的步驟還包括:當(dāng)判斷相似度等級非第一等級時(shí),繼續(xù)判斷原詞和同義詞的語義相似度、或詞形相似度、或編輯距離是否大于或等于預(yù)定閾值;如果是,則相似度等級為第二等級。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110079697.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 內(nèi)容-索引搜索系統(tǒng)和方法
- 通過若干搜索引擎實(shí)現(xiàn)的聯(lián)合搜索
- 一種深層網(wǎng)移動(dòng)搜索方法、服務(wù)器及系統(tǒng)
- 搜索引擎的狀態(tài)獲取方法、裝置以及瀏覽器
- 一種瀏覽器中進(jìn)行網(wǎng)頁搜索的方法及裝置
- 通過若干搜索引擎實(shí)現(xiàn)的聯(lián)合搜索
- 通過搜索引擎生成定制化內(nèi)容的方法、系統(tǒng)及搜索引擎
- 通過搜索引擎?zhèn)鬟f信息的方法、系統(tǒng)及搜索引擎
- 搜索引擎的切換方法、裝置以及電子設(shè)備
- 搜索引擎處理方法、裝置、終端及存儲介質(zhì)
- 互動(dòng)業(yè)務(wù)終端、實(shí)現(xiàn)系統(tǒng)及實(shí)現(xiàn)方法
- 街景地圖的實(shí)現(xiàn)方法和實(shí)現(xiàn)系統(tǒng)
- 游戲?qū)崿F(xiàn)系統(tǒng)和游戲?qū)崿F(xiàn)方法
- 圖像實(shí)現(xiàn)裝置及其圖像實(shí)現(xiàn)方法
- 增強(qiáng)現(xiàn)實(shí)的實(shí)現(xiàn)方法以及實(shí)現(xiàn)裝置
- 軟件架構(gòu)的實(shí)現(xiàn)方法和實(shí)現(xiàn)平臺
- 數(shù)值預(yù)報(bào)的實(shí)現(xiàn)方法及實(shí)現(xiàn)系統(tǒng)
- 空調(diào)及其冬眠控制模式實(shí)現(xiàn)方法和實(shí)現(xiàn)裝置以及實(shí)現(xiàn)系統(tǒng)
- 空調(diào)及其睡眠控制模式實(shí)現(xiàn)方法和實(shí)現(xiàn)裝置以及實(shí)現(xiàn)系統(tǒng)
- 輸入設(shè)備實(shí)現(xiàn)方法及其實(shí)現(xiàn)裝置





