[發明專利]查詢詞權重值的確定方法和裝置有效
| 申請號: | 201510064123.6 | 申請日: | 2015-02-06 |
| 公開(公告)號: | CN104615723B | 公開(公告)日: | 2018-08-07 |
| 發明(設計)人: | 張軍 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 路凱;崔雪青 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 查詢詞 權重 查詢日志信息 方法和裝置 分類處理 差異性 日志信息處理 查詢操作 計算模塊 搜索引擎 式中 文檔 搜索 查詢 優化 網絡 | ||
本發明實施例公開了一種查詢詞權重值的確定方法和裝置。所述方法包括:按照設定規則對查詢日志信息進行分類處理;根據查詢詞在至少兩類查詢日志信息中出現的差異性,確定查詢詞的權重值。所述裝置包括:日志信息處理模塊,用于按照設定規則對查詢日志信息進行分類處理;權重值計算模塊,根據查詢詞在至少兩類查詢日志信息中出現的差異性,確定查詢詞的權重值。本發明解決了現有的查詢詞權重值由網絡中包含該查詢詞的文檔數目所決定,與查詢詞在該查詢式中的重要程度有較大偏差技術問題,優化現有的查詢詞權重值確定技術,使得計算得到的查詢詞權重值與用戶實際的查詢操作密切相關,提高了查詢詞權重值的準確性以及搜索引擎的搜索效果。
技術領域
本發明實施例涉及數據處理技術,尤其涉及一種查詢詞權重值的確定方法和裝置。
背景技術
隨著互聯網技術的不斷發展以及互聯網應用對人們工作、學習與生活的不斷滲透,人們越來越多的通過網絡獲取信息。典型的,用戶通過搜索引擎輸入查詢式(Query),搜索引擎通過采用一定的搜索排序方式向用戶返回與輸入查詢式相匹配的搜索結果。其中,搜索引擎在處理用戶輸入的查詢式時,會給查詢式中包括的查詢詞(Term)賦予不同的權重來反映不同查詢詞在查詢式當中的重要程度(也稱為Term重要性),搜索引擎通過聯合使用查詢式當中的Term重要性以及查詢式與網絡中文檔(典型的,網頁)的匹配程度對搜索結果進行排序,并提供給用戶。
現有技術主要通過IDF(Inverse Document Frequency,逆文檔頻率)方法來計算查詢詞的權重值,即通過文檔集合中所有文檔的數目除以包含某個查詢詞的文檔的數目,再將得到的商取對數的結果,作為該查詢詞的權重值。現有技術的主要缺陷在于查詢詞權重值由網絡中包含該查詢詞的文檔數目所決定,與查詢詞在該查詢式中的重要程度有較大偏差。
發明內容
有鑒于此,本發明實施例提供一種查詢詞權重值的確定方法和裝置,以優化現有的查詢詞權重值確定技術,提高所確定的查詢詞重要程度的準確性。
在第一方面,本發明實施例提供了一種查詢詞權重值的確定方法,包括:
按照設定規則對查詢日志信息進行分類處理;
根據查詢詞在至少兩類所述查詢日志信息中出現的差異性,確定所述查詢詞的權重值。
在第二方面,本發明實施例提供了一種查詢詞權重值的確定裝置,包括:
查詢日志處理模塊,用于按照設定規則對查詢日志信息進行分類處理;
權重值確定模塊,用于根據查詢詞在至少兩類所述查詢日志信息中出現的差異性,確定所述查詢詞的權重值。
本發明實施例通過按照設定規則對查詢日志信息進行分類處理;根據查詢詞在至少兩類所述查詢日志信息中出現的差異性,確定所述查詢詞的權重值的技術手段,解決了現有技術在計算查詢詞權重值時僅僅根據網絡中查詢詞的文檔數目,而不考慮用戶實際輸入的查詢式以及實際點擊的搜索結果的技術問題,優化了現有的查詢詞權重值確定技術,使得計算得到的查詢詞權重值與用戶實際的查詢操作密切相關,提高了查詢詞權重值的準確性以及搜索引擎的搜索效果。
附圖說明
圖1是本發明第一實施例的一種查詢詞權重值的確定方法的流程圖;
圖2是本發明第二實施例的一種查詢詞權重值的確定方法的流程圖;
圖3是本發明第三實施例的一種查詢詞權重值的確定方法的流程圖;
圖4是本發明第三實施例所應用的一種搜索引擎的查詢系統的實現框圖;
圖5是本發明第四實施例的一種查詢詞權重值的確定裝置的結構圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510064123.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:內彈式接插件及電能表
- 下一篇:存儲資源分配方法及裝置





