[發(fā)明專利]搜索結(jié)果生成方法和裝置有效
| 申請?zhí)枺?/td> | 201711468186.3 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN110020172B | 公開(公告)日: | 2021-07-09 |
| 發(fā)明(設計)人: | 楊震;龔晟;俞惠華;李潔 | 申請(專利權)人: | 中國電信股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 中國貿(mào)促會專利商標事務所有限公司 11038 | 代理人: | 趙倩男 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 結(jié)果 生成 方法 裝置 | ||
本發(fā)明提供了一種搜索結(jié)果生成方法和裝置,涉及搜索引擎領域。該方法包括:基于時間維度信息提取用戶日志記錄中與時間維度相關的第一用戶信息需求特征;基于用戶需求環(huán)境及背景感知的模型庫提取用戶日志記錄中與用戶需求環(huán)境及背景感知相關的第二用戶信息需求特征;根據(jù)第一用戶信息需求特征與第二用戶信息需求特征的關聯(lián)關系建立記錄庫,以便在接收到用戶搜索請求后,基于記錄庫生成關鍵詞權重向量,基于關鍵詞權重向量進行語義搜索。本發(fā)明能夠提高獲得最符合用戶當前信息需求的搜索結(jié)果的準確率。
技術領域
本發(fā)明涉及搜索引擎領域,尤其涉及一種搜索結(jié)果生成方法和裝置。
背景技術
傳統(tǒng)的自然語言理解依靠文法和句法分析來獲得對用戶輸入問題的理解,但是這種方法很難應用到現(xiàn)實的服務系統(tǒng)中,原因是自然語言的規(guī)則、上下文理解技術并不能在現(xiàn)實的信息服務系統(tǒng)中獲得一個較好的應用。
發(fā)明內(nèi)容
本發(fā)明要解決的一個技術問題是提供一種搜索結(jié)果生成方法和裝置,能夠提高獲得最符合用戶當前信息需求的搜索結(jié)果的準確率。
根據(jù)本發(fā)明一方面,提出一種搜索結(jié)果生成方法,包括:基于時間維度信息提取用戶日志記錄中與時間維度相關的第一用戶信息需求特征;基于用戶需求環(huán)境及背景感知的模型庫,提取用戶日志記錄中與用戶需求環(huán)境及背景感知相關的第二用戶信息需求特征;根據(jù)第一用戶信息需求特征與第二用戶信息需求特征的關聯(lián)關系建立記錄庫,以便在接收到用戶搜索請求后,基于記錄庫生成關鍵詞權重向量,基于關鍵詞權重向量進行語義搜索。
可選地,提取第一用戶信息需求特征包括:基于用戶日志記錄的記錄時間距離當前時間的遠近,采用不同的特征提取方式提取第一用戶信息需求特征,并為第一用戶信息需求特征設置預定的權值。
可選地,對于記錄時間距離當前時間小于第一時間維度閾值的用戶日志記錄,采用權重關鍵詞向量提取第一用戶信息需求特征;對于記錄時間距離當前時間大于等于第一時間維度閾值的用戶日志記錄,采用關鍵詞過濾矩陣提取第一用戶信息需求特征。
可選地,對于記錄時間距離當前時間小于第二時間維度閾值的用戶日志記錄,采用知識地圖,結(jié)合關鍵詞權重、表達方式和特征變化的動態(tài)信息提取第一用戶信息需求特征;對于記錄時間距離當前時間大于等于第二時間維度閾值且小于第三時間維度閾值的用戶日志記錄,采用權重關鍵詞向量或關鍵詞過濾矩陣運算提取第一用戶信息需求特征;對于記錄時間距離當前時間大于等于第三時間維度閾值的用戶日志記錄,采用主題詞權重提取第一用戶信息需求特征。
可選地,基于特征使用頻次、最近使用時間和被匹配的次數(shù)中的至少一項對第一用戶信息需求特征設置相應的權重。
可選地,接收用戶搜索請求后,確定用戶搜索請求時間、用戶需求環(huán)境及背景感知;在記錄庫中基于用戶搜索請求時間、用戶需求環(huán)境及背景感知生成關鍵詞權重向量;基于生成關鍵詞權重向量通過搜索引擎搜索到符合用戶信息需求特征的信息搜索結(jié)果。
可選地,基于用戶信息需求特征的種類、解決任務的不同,設定不同的時間維度閾值。
根據(jù)本發(fā)明的另一方面,還提出一種搜索結(jié)果生成裝置,包括:第一特征信息提取單元,用于基于時間維度信息提取用戶日志記錄中與時間維度相關的第一用戶信息需求特征;第二特征信息提取單元,用于基于用戶需求環(huán)境及背景感知的模型庫,提取用戶日志記錄中與用戶需求環(huán)境及背景感知相關的第二用戶信息需求特征;記錄庫形成單元,用于根據(jù)第一用戶信息需求特征與第二用戶信息需求特征的關聯(lián)關系建立記錄庫;搜索結(jié)果生成單元,用于在接收到用戶搜索請求后,基于記錄庫生成關鍵詞權重向量,基于關鍵詞權重向量進行語義搜索。
可選地,該裝置還包括權重設置單元,其中,第一特征信息提取單元用于基于用戶日志記錄的記錄時間距離當前時間的遠近,采用不同的特征提取方式提取第一用戶信息需求特征;權重設置單元用于為第一用戶信息需求特征設置預定的權值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電信股份有限公司,未經(jīng)中國電信股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711468186.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





