[發明專利]一種搜索需求識別方法及裝置有效
| 申請號: | 201110258828.3 | 申請日: | 2011-09-02 |
| 公開(公告)號: | CN102982024A | 公開(公告)日: | 2013-03-20 |
| 發明(設計)人: | 藍翔;柴春光;吳華 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 搜索 需求 識別 方法 裝置 | ||
技術領域
本申請涉及互聯網應用技術領域,特別是涉及一種搜索需求識別方法及裝置。
背景技術
搜索引擎(search?engine)是指根據一定的策略、運用特定的計算機程序從互聯網上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。傳統的搜索引擎,在接收到用戶的提交的搜索請求(query)后,首先提取該query所包含的關鍵詞,然后基于文本內容匹配操作,將包含有該關鍵詞的網頁或文檔返回給用戶。隨著用戶對搜索智能化要求的不斷提升,搜索需求識別已經成為搜索領域的一個研究熱點。
所謂搜索需求識別,就是根據用戶所提交的query,分析和預測用戶的需求,確定用戶的意圖或感興趣的領域,然后再向其提供相應的信息。例如,用戶輸入“從北京到上海”這樣的query,則可以識別出該用戶可能具有較強的地圖查詢需求或票務查詢需求,這樣就可以在展示搜索結果時,直接向用戶提供地圖或票務的相關內容,或者將地圖或票務的相關內容排在搜索結果的前面,從而方便用戶進一步瀏覽。
搜索需求識別所涉及的關鍵技術包括語義分析、行為分析、智能人機交互、海量計算處理、信息抽取等等。由于用戶query表述方式的多樣性,目前一種較為常用的方式是在不同的領域對用戶的query進行分析,以實現更有針對性的搜索需求識別。
翻譯需求是用戶在搜索過程中一種較為常見的需求,根據現有技術,當用戶輸入“xxx翻譯”或“xxx是什么意思”這樣的query后,搜索引擎可以根據“翻譯”或“是什么意思”等明顯具有翻譯需求的表述,較好地識別出用戶具有針對單詞“xxx”的翻譯需求。但是在實際應用中,用戶的query中可能僅包括一個單詞或短語,而不包括“翻譯”或“是什么意思”等有翻譯需求的表述,在這種情況下,現有的搜索引擎還不能夠很好地確定用戶當前是否具有翻譯需求。
發明內容
為解決上述技術問題,本申請實施例提供種一種搜索需求識別方法及裝置,以實現對用戶翻譯需求的更有效識別,技術方案如下:
本申請實施例提供一種搜索需求識別方法,包括:
預先建立語言模型;
接收到搜索請求后,利用所述語言模型得到搜索關鍵詞對應的語言模型概率;
根據所述搜索關鍵詞的語言模型概率,判斷所述搜索請求是否具有翻譯需求;
其中,在搜索關鍵詞所包含的單詞個數L=1的情況下,所述判斷過程包括:所述搜索關鍵詞的語言模型概率是否低于預設的概率閾值,如果是,則確定該搜索請求具有翻譯需求。
根據本申請方案的一種實施方式,在搜索關鍵詞所包含的單詞個數L≥1的情況下,所述判斷過程包括:
計算所述搜索關鍵詞的困惑度;
判斷所述搜索關鍵詞的困惑度是否高于預設的困惑度閾值,如果是,則確定該搜索請求具有翻譯需求,
其中,p(s)為搜索關鍵詞的語言模型概率。
根據本申請方案的一種實施方式,接收到搜索請求后,還包括:
判斷搜索關鍵詞所包含的單詞個數是否小于預設的長度閾值,如果是,則進一步利用語言模型得到搜索關鍵詞對應的語言模型概率。
根據本申請方案的一種實施方式,所述利用語言模型得到搜索關鍵詞對應的語言模型概率,包括:
利用語言模型即時計算得到搜索關鍵詞對應的語言模型概率。
根據本申請方案的一種實施方式,所述利用語言模型得到搜索關鍵詞對應的語言模型概率,包括:
根據預置的語言模型概率表,查詢得到搜索關鍵詞對應的語言模型概率。
根據本申請方案的一種實施方式,在確定搜索請求具有翻譯需求后,還包括對搜索請求對應的翻譯結果進行展現,所述翻譯結果的展現方法包括:
在搜索框中,展現搜索請求所對應的翻譯結果;或
將搜索請求所對應的翻譯結果以搜索建議的形式進行展現。
根據本申請方案的一種實施方式,在接收到搜索請求并生成搜索建議之后,還包括:
判斷搜索建議的內容是否具有翻譯需求。
根據本申請方案的一種實施方式,在確定搜索建議的內容具有翻譯需求后,還包括:
將搜索建議對應的翻譯內容展現在搜索建議框中。
本申請實施例還提供一種搜索需求識別裝置,包括:
建模單元,用于預先建立語言模型;
語言模型概率計算單元,用于在接收到搜索請求后,利用所述語言模型得到搜索關鍵詞對應的語言模型概率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110258828.3/2.html,轉載請聲明來源鉆瓜專利網。





