[發明專利]一種泛化處理的方法、裝置、設備和計算機存儲介質有效
| 申請號: | 202011445266.9 | 申請日: | 2020-12-08 |
| 公開(公告)號: | CN112541362B | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 陳艷;劉凱;劉璟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06N20/00 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 田宏賓 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 泛化 處理 方法 裝置 設備 計算機 存儲 介質 | ||
1.一種泛化處理的方法,包括:
通過將字面匹配方式、語義匹配方式和查詢項query改寫方式,分別獲得的query集合進行取并集的方式,確定query庫中與所請求query相似的候選query集合;
從所述候選query集合中逐一取出query與所請求query構成query對;將query對進行拼接后輸入query匹配模型;所述query匹配模型的向量表示層對拼接后的query對進行編碼后,輸出拼接后的query對對應的向量表示;將該向量表示經過分類器得到query對是否為相關query的分類結果;依據分類結果確定所述候選query集合中所述所請求query對應的泛化query;
其中所述query匹配模型基于交叉注意力模型預先訓練得到;
所述語義匹配方式包括:利用預先訓練得到的雙塔模型中的向量表示層,確定所述所請求query的特征向量表示;通過向量檢索的方式,檢索所述query庫中特征向量表示與所述所請求query的特征向量表示之間的相似度滿足預設相似度要求的query。
2.根據權利要求1所述的方法,其中,所述通過字面匹配方式、語義匹配方式和query改寫方式,確定查詢項query庫中與所請求query相似的候選query集合包括:
通過字面匹配方式,確定所述query庫中與所請求query字面相似的第一query集合;
通過語義匹配方式,確定所述query庫中與所請求query語義相似的第二query集合;
通過query改寫方式,確定所述query庫中所請求query的改寫query構成第三query集合;
將所述第一query集合、第二query集合和第三query集合的并集確定為所述候選query集合。
3.根據權利要求1所述的方法,其中,所述雙塔模型采用如下方式預先訓練得到:
獲取第一訓練數據,所述第一訓練數據包含同一query對應的相關query 和不相關query;
將所述第一訓練數據作為雙塔模型的輸入,訓練所述雙塔模型;訓練目標包括:最大化第一相似度和第二相似度之間的差值,所述第一相似度為所述雙塔模型的向量表示層輸出的所述同一query的特征向量表示與相關query的特征向量表示之間的相似度,所述第二相似度為所述雙塔模型的向量表示層輸出的所述同一query的特征向量表示與不相關query的特征向量表示之間的相似度。
4.根據權利要求1或2所述的方法,其中,所述query改寫方式包括:
將所述所請求query輸入預先訓練得到的query改寫模型,獲取所述query改寫模型輸出的改寫query;
其中所述query改寫模型基于序列到序列Seq2Seq模型預先訓練得到。
5.根據權利要求4所述的方法,其中,所述query改寫模型采用如下方式預先訓練得到:
獲取第二訓練數據,所述第二訓練數據包含樣本query及其對應的改寫query;
將所述樣本query作為預訓練得到的Seq2Seq模型的輸入,將所述改寫query作為所述Seq2Seq模型的目標輸出,進一步訓練所述Seq2Seq模型。
6.根據權利要求1所述的方法,其中,所述query匹配模型采用如下方式預先訓練得到:
獲取第三訓練數據,所述第三訓練數據包括樣本query對,并標注樣本query對是相關query或不相關query;
將所述樣本query對進行拼接后輸入交叉注意力模型,將對所述樣本query對的標注作為所述交叉注意力模型對所述樣本query對的目標分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011445266.9/1.html,轉載請聲明來源鉆瓜專利網。





