[發明專利]一種利用語義分析實現精確搜索的方法有效
| 申請號: | 201010264871.6 | 申請日: | 2010-08-27 |
| 公開(公告)號: | CN101916294A | 公開(公告)日: | 2010-12-15 |
| 發明(設計)人: | 黃斌 | 申請(專利權)人: | 黃斌 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100083 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 語義 分析 實現 精確 搜索 方法 | ||
技術領域
本發明涉及一種網絡搜索方法,尤其涉及一種利用語義分析實現精確搜索的方法,屬于網絡搜索技術領域。
背景技術
互聯網已經成為一個規模巨大、分布廣泛的信息服務中心。當前,互聯網中的數據總量以幾百兆兆字節來計算,而且仍以很快的速度增長。為了幫助用戶從這個漫無邊際的數據海洋中快速獲取所需的信息,搜索引擎發揮著不可替代的作用。
搜索引擎(search?engine)是指根據一定的策略、運用特定的計算機程序搜集互聯網上的信息,在對信息進行組織和處理后,并將處理后的信息顯示給用戶,從而為用戶提供檢索服務的信息服務系統。現有的搜索引擎是根據用戶輸入的關鍵詞進入自身的數據庫系統進行檢索,并將檢索的結果反饋給用戶。在這個過程中,最大的問題是用戶不知道應該輸入什么樣的關鍵詞,才能準確表達自己需要搜索的信息。而搜索服務提供者需要根據用戶輸入的信息進行分析判斷,并根據判斷結果來提供搜索信息。因此,搜索服務提供者的判斷與用戶的需求之間經常是答非所問。
如圖1所示,搜索服務提供者根據用戶輸入的信息進行搜索時,往往是根據其輸入的內容進行分析,即進行分詞,將輸入信息分為所謂的“元詞匯”后,根據這些“元詞匯”來進行大規模的檢索運算。當輸入的信息越多時,進行的檢索運算也越多,因此搜索引擎的計算能力開銷較大。例如當用戶一次輸入兩個詞匯時,搜索引擎理論上要進行一次千萬數量級的矩陣運算。因此,現在的搜索引擎在硬件上投入越來越大,而搜索效果并未獲得明顯的改善。另一方面,“元詞匯”的集合,即通常所說的“詞表”也在快速增加之中。目前,最大規模的詞表已達到千萬數量級。對于這個集合了人類信息空間中所有“元詞匯”的“元詞匯庫”,最大的問題是詞匯內容快速增加且有不可阻擋之勢,因此這個“元詞匯”已經很難起到作為信息空間的“元數據”的作用。如果硬性地將這個詞匯庫規定為某一個固定范圍,又不能反映快速發展變化的社會現實,不能準確充分地滿足用戶的需要。
隨著網絡搜索技術的不斷發展,出現了智能搜索的概念。所謂的智能檢索是利用分詞詞典、同義詞典、同音詞典改善檢索效果,進一步還可在知識層面或者概念層面上輔助查詢,通過主題詞典、上下位詞典、相關同級詞典檢索處理形成一個知識體系或概念網絡,給予用戶智能知識提示,最終幫助用戶獲得最佳的檢索效果。例如查詢“計算機”,與“電腦”相關的信息也能檢索出來;還可以進一步縮小查詢范圍至“微機”、“服務器”或擴大查詢至“信息技術”或查詢相關的“電子技術”、“軟件”、“計算機應用”等范疇。另外,現有的某些搜索引擎也提供所謂的“聯想”功能,即根據以前的用戶選擇結果進行統計分析,并根據這些分析結果進行預測,提供最可能的結果來供用戶進行選擇。但這實際上并不能解決網絡搜索的準確性問題,因為對于大量人群來講,存在一定的統計規律,而對于某一個具體用戶的某一次搜索而言,統計規律并沒有太多的意義。
在專利申請號為200910192409.7的中國發明專利申請中,提出了一種基于語義分析的智能檢索系統,其包括:輸入模塊,用于輸入文字或指令;功能對象數據庫,用于存儲功能對象;語義分析搜索模塊,用于對所述輸入模塊輸入的文字進行語義分析,并從功能對象數據庫中搜索出與該語義相關的功能對象;顯示裝置,用于顯示語義分析搜索模塊搜索出的功能對象;選擇調用模塊,用于根據所述輸入裝置輸入的指令從顯示裝置顯示的功能對象中選擇目標功能對象,并調用該目標功能對象。該專利申請同時還提供了一種基于語義分析的智能檢索方法,可以根據輸入文字的語義來預測用戶操作意圖,搜索出與該語義相關聯的功能對象并提供給用戶備選,方便用戶快速、準確地找到目標功能對象。從而不再需要用戶準確地記住各級菜單,也不用操作多級菜單查找目標對象。
發明內容
本發明所要解決的技術問題在于提供一種利用語義分析實現精確搜索的方法。該方法首先對用戶輸入的內容進行語義分析和關聯詞匯檢索,并由用戶進行選擇,從而進一步明確網絡搜索的目標,使搜索引擎能夠準確地從數據庫中將用戶心目中最想要的信息提供給用戶。
為實現上述的發明目的,本發明采用下述的技術方案:
一種利用語義分析實現精確搜索的方法,其特征在于包括如下的步驟:
(1)接受用戶輸入的目標信息描述詞,對所述目標信息描述詞進行分詞操作;
(2)判斷所述目標信息描述詞是否具有完整的語義;
(3)如果是則直接進行后續的檢索;如果不是,則向用戶提供與所述目標信息描述詞相關聯的詞匯;
(4)用戶進行二次輸入,從而確定所述目標信息描述詞的語義,根據該語義進行后續的檢索。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于黃斌,未經黃斌許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010264871.6/2.html,轉載請聲明來源鉆瓜專利網。





