[發明專利]檢索項改寫方法、裝置、設備以及存儲介質在審
| 申請號: | 202010600669.X | 申請日: | 2020-06-28 |
| 公開(公告)號: | CN111797216A | 公開(公告)日: | 2020-10-20 |
| 發明(設計)人: | 雷錦藝;丁世強 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/29;G06F9/451;G10L15/22;G06F40/211;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢索 改寫 方法 裝置 設備 以及 存儲 介質 | ||
1.一種檢索項改寫方法,包括:
響應檢索項改寫請求,提取原始檢索項的上下文信息和/或所述原始檢索項的意圖信息;
根據所述上下文信息和/或所述意圖信息,以及機器詞匯集,確定新檢索項;
其中機器對所述新檢索項的理解度大于機器對所述原始檢索項的理解度。
2.根據權利要求1所述的方法,其中,所述根據所述上下文信息和所述意圖信息,以及機器詞匯集,確定新檢索項,包括:
根據所述上下文信息和所述機器詞匯集,確定至少兩個候選檢索項;
匹配所述候選檢索項的意圖與所述原始檢索項的意圖;
根據匹配結果,從所述至少兩個候選檢索項中確定所述新檢索項。
3.根據權利要求2所述的方法,其中,所述根據所述上下文信息和所述機器詞匯集,確定至少兩個候選檢索項,包括:
將所述上下文信息輸入預先訓練的序列編碼網絡,輸出所述至少兩個候選檢索項;
其中,所述序列編碼網絡通過預先訓練學習有所述機器詞匯集。
4.根據權利要求3所述的方法,其中,所述將所述原始檢索項的語義向量輸入預先訓練的序列轉換網絡之前,所述方法還包括:
根據機器反饋給用戶的答復信息,從用戶歷史輸入的檢索項序列中,確定樣本檢索項組;
其中,所述樣本檢索項組中包括至少一個第一檢索項和至少一個第二檢索項,機器對所述第一檢索項的理解度大于第一理解度閾值,機器對所述第二檢索項的理解度小于第二理解度閾值,且所述第一檢索項與所述第二檢索項的語義相似度大于設定相似度閾值;
利用所述樣本檢索項組訓練初始網絡,得到所述序列轉換網絡。
5.根據權利要求4所述的方法,其中,所述根據機器反饋給用戶的答復信息,從用戶歷史輸入的檢索項序列中,確定樣本檢索項組,包括:
根據機器反饋給用戶的答復信息,從用戶歷史輸入的檢索項序列中確定發生時間連續的至少一個第一檢索項;
檢測與所述第一檢索項的發生時間連續,且發生在所述第一檢索項之后的至少一個第二檢索項;
根據所述至少一個第一檢索項和所述至少一個第二檢索項,確定所述樣本檢索項組。
6.根據權利要求4所述的方法,所述根據機器反饋給用戶的答復信息,從用戶歷史輸入的檢索項序列中,確定樣本檢索項組之后,所述方法還包括:
若所述樣本檢索項組中包括至少兩個第一檢索項,則計算所述樣本檢索項組中各第一檢索項與所述樣本檢索項組中的第二檢索項之間的相似度;
根據計算的相似度,對所述樣本檢索項組中的至少兩個第一檢索項進行過濾。
7.根據權利要求1-6中任一所述的方法,其中,若所述原始檢索項具有關聯檢索項,則所述提取原始檢索項的上下文信息,包括:
提取所述原始檢索項中詞語間的第一詞語關系信息,以及所述關聯檢索項中詞語間的第二詞語關系信息;
根據所述第一詞語關系信息以及所述第二詞語關系信息,確定所述原始檢索項的上下文信息。
8.根據權利要求1-6中任一所述的方法,所述根據所述原始檢索項的語義信息和/或所述原始檢索項的意圖信息,以及機器詞匯集,確定新檢索項之后,所述方法還包括:
以文字提示或二輪詢問的方式,將所述新檢索項反饋給用戶;
在獲取到用戶的肯定回答后,根據所述新檢索項進行檢索,并將檢索結果反饋給用戶。
9.一種檢索項改寫裝置,包括:
信息提取模塊,用于響應檢索項改寫請求,提取原始檢索項的上下文信息和/或所述原始檢索項的意圖信息;
檢索項確定模塊,用于根據所述上下文信息和/或所述意圖信息,以及機器詞匯集,確定新檢索項;
其中機器對所述新檢索項的理解度大于機器對所述原始檢索項的理解度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010600669.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于夾絲玻璃的高效水切裝置及方法
- 下一篇:基于深度學習的圖像識別方法





