[發明專利]一種基于搜索引擎的網絡搜索方法無效
| 申請號: | 201110229642.5 | 申請日: | 2011-08-11 |
| 公開(公告)號: | CN102254039A | 公開(公告)日: | 2011-11-23 |
| 發明(設計)人: | 王君澤;黃本雄;魏超;胡廣;溫杰 | 申請(專利權)人: | 武漢安問科技發展有限責任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市德權律師事務所 11302 | 代理人: | 周發軍 |
| 地址: | 430074 湖北省武漢市東湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 搜索引擎 網絡 搜索 方法 | ||
技術領域
本發明涉及計算機科學/互聯網技術領域,尤其涉及到互聯網的網絡搜索方法。
背景技術
隨著互聯網技術的發展,人們對網絡的依賴程度越來越大了,據統計,每個月有超過100億的搜索關鍵詞提交給網絡搜索引擎。這些搜索大多數是由一些關鍵詞組成的,簡短、模糊并且不太準確。實際上,當用戶提交一個很短并且不準確的查詢時,搜索引擎面臨的一個很大的困難是要分析出用戶的實際需求。
現有的眾多的搜索方法論文以及各種搜索方法專利,這些方法主要是將用戶的搜索關鍵字提交到興趣模型,利用興趣模型的處理結果進行再次搜索,返回最終的搜索結果。或者是根據搜索結果的相似性評價及搜索結果內容,對搜索結果進行優化排序。
這些方法只是考慮了用戶的最初的搜索關鍵字,建立了各種分析模型,而忽略了用戶本身的行為,因而搜索結果可能沒有太大的說服力。
發明內容
本發明所要解決的技術問題是提供一種基于搜索引擎的網絡搜索方法,快速的幫助用戶精確定位到感興趣的內容。
為解決上述技術問題,本發明的技術構思如下:
一、針對用戶提交的初始查詢詞,集中關注搜索引擎返回的結果。當用戶初步瀏覽了各個結果的標題和摘要后,點擊了某一個或幾個鏈接后,那這幾個被用戶點擊的頁面中必定會有一些詞是可以描述用戶的信息需求的。如果可以找出用戶感興趣的這些詞來擴展用戶的搜索詞,必然會大大提高搜索的效率。
當用戶點擊搜索結果中的某個鏈接時,預示著該結果中的某一個或幾個詞語與該用戶的信息需求是相關的。找出這些詞,就可以更加清晰的了解用戶的信息需求。
假如搜索結果是sa,sa是由詞語w1w2...wn組成的。這時就可以用空間向量模型來表示出sa。這里的關鍵問題是如何衡量各個詞語的權重。一種簡單的方法是使用詞語在該結果和整個搜索的結果集中出現的頻率來計算詞語的權重。同時也應該考慮各個詞語和原始查詢詞的相關性。
此方法的基本思想是考察原始查詢詞和搜索結果前列的候選詞的共現頻率,以此來衡量該候選詞的權重。
假設(1)原始查詢詞是Q,(2)Q中的關鍵詞為q1q2q3...qm,(3)查詢結果排在前列的文檔集是C,C={s1,s2,...,sn}。用co_deg?ree(t,qi)來表示詞t和qi在文檔C中的共同出現的次數。本文使用下面的公式來計算t和qi的共現次數:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢安問科技發展有限責任公司,未經武漢安問科技發展有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110229642.5/2.html,轉載請聲明來源鉆瓜專利網。





