[發明專利]一種網絡搜索方法和裝置有效
| 申請號: | 201310633696.7 | 申請日: | 2013-11-29 |
| 公開(公告)號: | CN104679783B | 公開(公告)日: | 2019-08-02 |
| 發明(設計)人: | 張友書;余浩;張闊 | 申請(專利權)人: | 北京搜狗信息服務有限公司;北京搜狗科技發展有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F17/27 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 搜索 方法 裝置 | ||
本申請提供了一種網絡搜索方法和裝置,涉及網絡搜索技術領域。其中的方法具體包括:搜索與輸入的查詢串相匹配的網頁,得到網頁結果;在知識庫中檢索得到所述查詢串對應的實體結果;其中,所述知識庫中存儲全網中的實體對象;將所述實體結果分別在各網頁結果對應的網頁內容中進行分析匹配,篩選出每條網頁結果對應的目標實體;將所述目標實體分別與匹配的網頁結果進行對應展現。本申請將網頁結果中與查詢串相關的目標實體分別篩選出來,并簡潔地、直觀地展現給用戶,無需用戶點擊查看即可判斷當前網頁結果對應的頁面內容與查詢串的相關性,進而判斷當前網頁結果中所包含的頁面內容的可靠性,提高了信息查詢的效率,能夠提高信息查詢的效率。
技術領域
本申請涉及網絡搜索技術領域,特別是涉及一種網絡搜索方法和裝置。
背景技術
目前,數據搜索已經成為互聯網最主要的應用之一。以典型的搜素引擎為例,其通常利用服務器的搜索機器人蜘蛛(Spider)程序,自動搜索互聯網上大大小小的網站內容,按照網頁相關性原理在每一個查詢串和所有相關的網頁之間建立一個對應關系,儲存在其網絡服務器的網頁數據庫中;用戶只要輸入查詢串就可以找到符合該查詢串特征的所有被搜索的網頁,并且以超級鏈接的方式對搜索結果進行展現,點擊相應的鏈接就可以訪問相應的網頁,從而找到所需信息。
現有的搜索結果中的結果項,通常僅簡單地顯示網頁標題和文字摘要,并在文字摘要部分用紅色字體標記出了與查詢串中的分詞相匹配的文字,以方便用戶在瀏覽時快速定位。
然而,由于摘要的字數限制或者文本的結構特點,用戶無法在搜索結果中看到網頁中與查詢串相關的所有內容,還需點擊進入相應的網頁仔細查看,因此,用戶需要分別點擊多個搜索結果的鏈接才能找到其想要搜索的信息,降低了信息查詢的效率。
總之,需要本領域技術人員迫切解決的一個技術問題就是:如何能夠提高信息查詢的效率。
發明內容
本申請所要解決的技術問題是提供一種網絡搜索方法和裝置,能夠提高信息查詢的效率。
為了解決上述問題,本申請公開了一種網絡搜索方法,包括:
搜索與輸入的查詢串相匹配的網頁,得到網頁結果;
在知識庫中檢索得到所述查詢串對應的實體結果;其中,所述知識庫中存儲全網中的實體對象;
將所述實體結果分別在各網頁結果對應的網頁內容中進行分析匹配,篩選出每條網頁結果對應的目標實體;
將所述目標實體分別與匹配的網頁結果進行對應展現。
優選的,所述篩選出每條網頁結果對應的目標實體的步驟,包括:在每條網頁結果對應的網頁內容中分別篩選出與所述實體結果相匹配的目標內容,并將所述目標內容對應的實體結果作為所述網頁結果對應的目標實體。
優選的,所述在每條網頁結果對應的網頁內容中分別篩選出與所述實體結果相匹配的目標內容的步驟,包括:
對所述網頁結果對應的網頁正文進行分析;
依據網頁正文對應的分析結果,提取所述網頁正文中特征內容;所述特征內容包括標題、子標題、表格、摘要和加粗文字中的一項或多項;
將提取到的文字分別與各實體結果進行匹配,得到所述網頁結果中與各實體結果相匹配的目標內容。
優選的,所述方法還包括:
依據所述與所述實體結果相匹配的目標內容分別在各所述網頁結果中出現的頻率和/或位置,以每條網頁結果為單位對所述目標實體進行排序;
則所述將所述目標實體分別與匹配的網頁結果進行對應展現的步驟為,依據目標實體的排序結果分別對所述網頁結果匹配的各目標實體的標記進行對應展現。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗信息服務有限公司;北京搜狗科技發展有限公司,未經北京搜狗信息服務有限公司;北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310633696.7/2.html,轉載請聲明來源鉆瓜專利網。





