[發明專利]一種搜索方法和系統在審
| 申請號: | 201210167761.7 | 申請日: | 2012-05-25 |
| 公開(公告)號: | CN103425714A | 公開(公告)日: | 2013-12-04 |
| 發明(設計)人: | 張帆 | 申請(專利權)人: | 北京搜狗信息服務有限公司;北京搜狗科技發展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 搜索 方法 系統 | ||
技術領域
本申請涉及計算機技術領域,特別是涉及一種搜索方法和系統。
背景技術
隨著網絡信息的不斷膨脹,越來越多的用戶在網絡中輸入問題,通過搜索引擎尋找答案。
現有技術中,對于用戶輸入的查詢問題,存在兩種解決方案:
其一,基于傳統搜索引擎的方案,即通過文字的匹配來篩選匹配頁面,把篩選出來的文檔重新排序后提供給用戶,需要用戶自己根據標題和摘要來選擇文檔,之后再逐個點擊閱讀,之后自己從中找出想要的答案。該種方案,基于文字匹配,導致搜索得到的結果信息可能非常龐大,而與用戶問題相關的真實答案可能被隱藏在很靠后的文檔中,甚至用戶即使閱讀了相關文檔依然有可能找不到所需的信息,需要用戶進行大量的點擊搜索過程,延誤用戶大量的時間,搜索效率低。
其二,基于問答系統的方案:
通常采用的方法是:先給問題分類,再根據類別對問題進行語義解析,再把解析出的結果到檢索結果庫中文檔中匹配,定位答案對應的文本;再解析這些文本得到問題的答案,再將結果按照語義生成自然語言。但按照主語、謂語賓語等語言規則進行的語義解析還相當不成熟,步驟復合且各項操作都沒有較理想的解析精度,常常會給出與問題完全不相關的答案,其搜索準確度比較低。
在問答系統中的方案中,基本上是基于問答網站中的匹配過程進行搜索的:當用戶輸入一個查詢后,系統會將問題轉化為一段語義編碼,再將這段編碼放到問答網站問題的索引庫中做語義匹配,如果能夠匹配上庫中的問題,再將匹配到的問題的答案作為搜索結果展示給用戶。因此,可回答的問題數量非常有限,對于常見問題可以較好地解決,但對于生僻問題等問題一般都無法解決,搜索范圍狹窄。
發明內容
本申請所要解決的技術問題是提供一種搜索方法和系統,解決現有技術中對于問題的解答搜索過程中出現的問答系統中無法解決生僻問題,搜索結果不夠精確、便捷的問題。
為了解決上述問題,本申請公開了一種搜索方法,包括:
接收查詢詞串,并解析所述查詢詞串中各詞所屬的詞性;所述詞性包括實體詞、屬性詞、屬性詞對應的屬性值、關系詞、關系詞對應的關系值;
根據所述查詢詞串中各詞所屬的詞性,確認查詢詞串對應匹配的查詢結構及該查詢結構中的查詢對象;
針對所述查詢結構在結構化知識庫中進行匹配分析,得到所述查詢結構中的查詢對象對應的對象值;
將所述對象值在查詢詞串對應的結果區域中進行單獨顯示。
優選的,針對所述查詢結構在結構化知識庫中進行匹配分析,得到所述查詢結構中的查詢對象對應的對象值包括:
將所述查詢結構中的實體詞、屬性詞、屬性詞對應的屬性值、關系詞、關系詞對應的關系值中一種或幾種在結構化知識庫中進行匹配分析,得到所述查詢結構中的查詢對象對應的對象值。
優選的,解析所述查詢詞串中各詞所屬的詞性時包括:
針對所述查詢詞串,遍歷實體詞表,標注各實體詞;
根據各實體詞所屬類別,遍歷相應類別中的屬性詞表、關系詞表和疑問詞表和特殊疑問模板表,進而標注查詢詞串中的各屬性詞、各關系詞、各疑問詞;
當所述查詢詞串中的屬性詞存在相應的屬性值時,對應標注各屬性值;當所述查詢詞串中的關系詞存在相應的關系值時,對應標注各關系值。
優選的,還包括:
通過從各網頁中提取的實體詞、所述實體詞對應的屬性詞和屬性值、所述實體詞對應的關系詞和關系值構建所述結構化知識庫。
優選的,所述結構化知識庫構建時:
針對抓取的同一知識類別的各知識網站,利用相應知識網站的解析模板解析各知識網站的網頁內容,獲得實體詞及與實體詞相應的屬性詞和屬性值、關系詞和關系值;
針對同一實體詞,以:實體詞、實體詞對應的屬性詞、屬性詞對應的屬性值、實體詞對應的關系詞、關系詞對應的關系值的數據結構存入結構化知識庫。
優選的,還包括:
對抓取的同一知識類別各知識網站,利用該類別各種子挖掘各知識網站的內容存放格式,獲取各知識網站的解析模板;
針對所述每一知識網站,利用相應知識網站的解析模板,解析出所述知識網站內與種子的種子屬性對應的第一屬性詞,及相應的第一屬性值;
選取各種子屬性中與實體詞相關的種子屬性,將相應的第一屬性詞的第一屬性值作為實體詞;
選取各種子屬性中與屬性詞相關的種子屬性,將相應的第一屬性詞作為屬性詞,將相應第一屬性值作為屬性值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗信息服務有限公司;北京搜狗科技發展有限公司,未經北京搜狗信息服務有限公司;北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210167761.7/2.html,轉載請聲明來源鉆瓜專利網。





