[發明專利]實現查詢理解的方法及裝置有效
| 申請號: | 201310055515.7 | 申請日: | 2013-02-21 |
| 公開(公告)號: | CN104008097B | 公開(公告)日: | 2018-01-12 |
| 發明(設計)人: | 劉春辰;李建強;劉博 | 申請(專利權)人: | 日電(中國)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司11138 | 代理人: | 張耀光 |
| 地址: | 100191 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實現 查詢 理解 方法 裝置 | ||
技術領域
本發明涉及信息檢索領域,特別涉及一種實現查詢理解的方法及裝置。
背景技術
隨著互聯網數據、企業數據等各種數據的爆炸性增長,信息檢索成為了人們從大量的數據中獲取目的信息的重要手段。在信息檢索的過程中,為了能夠向用戶返回滿足其真實需求的信息,需要應用查詢理解技術對用戶輸入的查詢關鍵詞進行理解并識別用戶的查詢意圖,從而能夠根據查詢理解的結果進行更準確的信息檢索。
現有技術在實現查詢理解時,通常采用以下三種方法:
方法一:在公開號為US7840538B2的專利文獻《Discovering query intent from search queries and concept networks》中提供的一種實現查詢理解的方法,包括:預先對查詢日志數據進行統計分析或機器學習;根據用戶輸入的查詢關鍵詞在統計分析的結果或機器學習的結果中獲取查詢理解的結果。
方法二:在ESWC(European Semantic Web Conference,歐洲語義網會議)上公開的文獻《Lightweight Keyword Interface to Semantic Search》中提供的一種實現查詢理解的方法,包括:在RDF(Resource Description Framework,資源描述框架)圖包含的資源中查找查詢關鍵詞對應的資源,根據查找到的資源得到與查詢關鍵詞對應的查詢語句,從而根據構造的查詢語句得到查詢理解的結果。其中,RDF圖中包含多個資源描述,且每個資源描述是由多個語句構成,一個語句表示資源具有的一個屬性,由資源、屬性類型、屬性值構成。
方法三:在WISE(Web Information System Engineering,網頁信息系統工程)國際會議上公布的文獻《Effective and Efficient Keyword Query Interpretation Using a Hybrid Graph》中提供了一種實現查詢理解的方法,該方法包括:預先存儲領域本體,該領域本體中包含特定領域的概念以及概念之間的語義路徑;在領域本體包含的概念中查找與查詢關鍵詞相匹配的概念,得到每個查詢關鍵詞對應的匹配概念集,每個匹配概念集中包含有每個查詢關鍵詞相匹配的概念;將每個查詢關鍵詞對應的匹配概念集中包含的概念進行組合,得到匹配概念組合;根據得到的匹配概念組合從領域本體中獲取對應的查詢語義圖,每個查詢語義圖中包含有每個匹配概念組合中的概念及概念之間的語義路徑;將獲取到的查詢語義圖作為查詢理解的結果。例如,以獲取到的查詢關鍵詞為flash和USA為例。在領域本體包含的概念中查找得到flash對應的匹配概念集{flash flood、flash lamp}和USA對應的匹配概念集{USA};將flash對應的匹配概念集和USA對應的匹配概念集中的概念進行組合后得到匹配概念組合{flash flood、USA}、{flash lamp、USA};根據匹配概念組合分別從領域本體中獲取查詢語義圖{flash flood→USA}和{flash lamp→camera→USA};將獲取到的查詢語義圖作為查詢理解的結果。
在實現本發明的過程中,發明人發現現有技術至少存在以下問題:
方法一在實現查詢理解時是基于查詢日志實現的,由于查詢日志數據沒有具體分類,在一些特定領域如企業、學科等領域的信息檢索中,查詢日志并不是一種可靠的數據源,從而導致最終得到的查詢理解的結果不準確。方法二在實現查詢理解時,都需要在查詢關鍵詞與RDF中的資源相匹配才能進一步得到查詢理解的結果;而方法三在實現查詢理解時也需要查詢關鍵詞與領域本體包含的概念相匹配才能進一步得到查詢理解的結果,從而方法二和方法三對于用戶輸入的查詢關鍵詞要求較高。例如,當用戶輸入的查詢關鍵詞為“USA”時,如果RDF圖包含的資源中或領域本體包含的概念中沒有“USA”,只有“America”或者“Unite States”的話,則無法得到相匹配的資源或概念。因此,上述實現查詢理解的方法對用戶的查詢意圖的理解能力較弱,導致查詢理解的魯棒性和準確性較低。
發明內容
為了解決現有技術的問題,本發明實施例提供了一種實現查詢理解的方法及裝置。所述技術方案如下:
一方面,提供了一種實現查詢理解的方法,所述方法包括:
獲取至少一個查詢關鍵詞,并獲取每個查詢關鍵詞的同義詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于日電(中國)有限公司,未經日電(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310055515.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種兒童驅蟲藥物組合物及其制備方法
- 下一篇:一種治療臁瘡的外用中藥





