[發明專利]一種提供檢索關聯詞的方法及裝置無效
| 申請號: | 201010618560.5 | 申請日: | 2010-12-31 |
| 公開(公告)號: | CN102567409A | 公開(公告)日: | 2012-07-11 |
| 發明(設計)人: | 吳周強;蔡勇;王彪;倪玉華;吳悠;彭德琦 | 申請(專利權)人: | 珠海博睿科技有限公司;北京師范大學珠海分校 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 519015 廣東省珠海市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提供 檢索 關聯詞 方法 裝置 | ||
技術領域
本發明涉及檢索技術,特別涉及一種提供檢索關聯詞的方法及裝置。
背景技術
隨著英特網上信息數據量的劇增,搜索引擎為了更好的服務于用戶,就有必要采取輔助手段來提高搜索效率,而智能推薦檢索關聯詞就是多種輔助手段中的一種。參閱圖1所示,所謂智能推薦檢索關聯詞,即是當用戶輸入某個檢索關鍵字時,例如,人參,在搜索頁面將會呈現出一系列可能與用戶輸入的檢索關鍵字相關聯的詞匯,稱為檢索關聯詞,例如,如圖1所示,人參果、人參健脾丸、人參娃娃......,點擊這些檢索關聯詞,用戶可以進行進一步的搜索。
目前,支持智能推薦檢索關聯詞的搜索引擎有很多,這此搜索引擎采用的推薦檢索關聯詞方法通常包括以下幾種:
但不同的搜索引擎完成這個功能的方式不同,通用的搜索引擎由于搜索人群非常廣泛,涉獵的領域非常繁多,因此在推薦方面大都采用簡單高效的推薦計算方式,常見的方式有:
1、系統關鍵字模糊匹配。
即在用戶輸入檢索關鍵字后,根據預設的系統關鍵字庫中記錄的內容進行模糊匹配,并將模糊匹配成功的檢索關鍵字作為檢索關聯詞推薦給用戶。
2、用戶輸入關鍵字模糊匹配。
即將用戶輸入的檢索關鍵字保存至用戶輸入關鍵字庫中并進行條數累計,當該用戶輸入檢索關鍵字后,根據用戶輸入關鍵字庫中記錄的內容進行模糊匹配,并將模糊匹配成功的檢索關鍵字按照累計次數排序,作為檢索關聯詞推薦給用戶。
3、參考其他用戶輸入的關鍵字進行推薦。
系統記錄任何一個用戶輸入檢索關鍵字的全過程并保存到用戶輸入關鍵字庫中,用戶輸入檢索關鍵字后,根據用戶輸入關鍵字庫搜索匹配的檢索關鍵字,并將以前輸入這個檢索關鍵字的用戶輸入的其它檢索關鍵字,作為檢索關鍵詞推薦給用戶。
然而,現有的搜索引擎在提供檢索關聯詞時,沒有考慮到檢索關聯詞的行業特征,推薦的檢索關聯詞一般是通用的關鍵字序列,并且,現有的搜索引擎通常采用模糊匹配的方式推薦檢索關聯詞,這樣,很多與檢索關鍵字不存在模糊匹配關系,但存在一定邏輯關系的檢索關聯詞將得不到推薦。例如,當用戶輸入的檢索關鍵字為“人參”時,與“人參”存在一定邏輯關系的檢索關聯詞“皂苷”,“黃芪”等等將得不到推薦,從而,在一定程度上影響了檢索關聯詞的準確性,從而降低了搜索引擎的檢索效率。
發明內容
本發明實施例公開一種提供檢索關聯詞的方法及裝置,用以提高檢索關聯詞的準確性,提高搜索引擎的檢索效率。
本發明實施例提供的具體技術方案如下:
一種提供檢索關聯詞的方法,包括:
根據用戶輸入的檢索關鍵字獲取包含所述檢索關鍵字的網頁頁面;
基于所述網頁頁面包含的文本數據提取出目標分詞;
分別基于每一個目標分詞在各網頁頁面中的密度,計算每一個目標分詞與所述檢索關鍵字之間的關聯度;
將關聯度達到設定門限值的目標分詞,作為檢索關聯詞呈現給用戶。
一種提供檢索關聯詞的裝置,包括:
獲取單元,用于根據用戶輸入的檢索關鍵字獲取包含所述檢索關鍵字的網頁頁面;
提取單元,用于基于所述網頁頁面包含的文本數據提取出目標分詞;
計算單元,用于分別基于每一個目標分詞在各網頁頁面中的密度,計算每一個目標分詞與所述檢索關鍵字之間的關聯度;
呈現單元,用于將關聯度達到設定門限值的目標分詞,作為檢索關聯詞呈現給用戶。
本發明實施例中,針對用戶輸入的檢索關鍵字,不采用模糊匹配的方式獲取檢索關聯詞,而是基于檢索關鍵字所在的網頁頁面包含的文本數據,提取出目標分詞,再計算各目標分詞與檢索關鍵字之間的關聯度,將關聯度達到設定門限值的目標分詞,作為檢索關聯詞進行呈現,這樣,便可以根據檢索關鍵字所在的網頁頁面包含的信息內容,獲取到與檢索關鍵字存在邏輯上的關聯關系,并且存在或不存在模糊匹配關系的其他檢索關聯詞,從而提高了檢索關聯詞的信息準確度,避免了部分檢索關聯詞的遺漏,進而有效提高了搜索引擎的檢索效率。
附圖說明
圖1為現有技術下智能推薦檢索關聯詞示意圖;
圖2為本發明實施例中檢索裝置功能結構圖;
圖3為本發明實施例中建立推薦詞庫流程圖;
圖4為本發明實施例中向用戶提供檢索關聯詞流程圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海博睿科技有限公司;北京師范大學珠海分校,未經珠海博睿科技有限公司;北京師范大學珠海分校許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010618560.5/2.html,轉載請聲明來源鉆瓜專利網。





