[發明專利]一種泛化處理的方法、裝置、設備和計算機存儲介質有效
| 申請號: | 202011445266.9 | 申請日: | 2020-12-08 |
| 公開(公告)號: | CN112541362B | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 陳艷;劉凱;劉璟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06N20/00 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 田宏賓 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 泛化 處理 方法 裝置 設備 計算機 存儲 介質 | ||
本申請公開了一種泛化處理的方法、裝置、設備和計算機存儲介質,涉及人工智能技術領域,具體涉及深度學習技術。具體實現方案為:通過字面匹配方式、語義匹配方式和查詢項(query)改寫方式中的至少一種,確定query庫中與所請求query相似的候選query集合;利用預先訓練得到的query匹配模型,從所述候選query集合中確定所述所請求query對應的泛化query;其中所述query匹配模型基于交叉注意力模型預先訓練得到。通過本申請能夠實現針對所請求query的泛化。
技術領域
本申請涉及計算機應用技術領域,特別涉及人工智能技術領域中的深度學習技術。
背景技術
信息爆炸時代,人們渴望能夠快速、準確、直接地獲取信息,傳統的搜索引擎技術已經不能滿足用戶的需求。問答系統作為搜索引擎的高級形式,用最簡單、高效的方式滿足用戶快速、精準獲取信息的需求。問題泛化是問答系統中的核心技術,對于給定的query(查詢項),可返回該query的所有同義query,從而提高響應的準確率和召回率。由此泛化技術被廣泛運用于搜索、問答系統、智能客服、廣告系統等多種業務場景中。
發明內容
有鑒于此,本申請提供了一種泛化處理的方法、裝置、設備和計算機存儲介質。
第一方面,本申請提供了一種泛化處理的方法,包括:
通過字面匹配方式、語義匹配方式和query改寫方式中的至少一種,確定查詢項query庫中與所請求query相似的候選query集合;
利用預先訓練得到的query匹配模型,從所述候選query集合中確定所述所請求query對應的泛化query;
其中所述query匹配模型基于交叉注意力模型預先訓練得到。
第二方面,本申請提供了一種泛化處理的裝置,包括:
候選確定模塊,用于通過字面匹配方式、語義匹配方式和query改寫方式中的至少一種,確定查詢項query庫中與所請求query相似的候選query集合;
泛化確定模塊,用于利用預先訓練得到的query匹配模型,從所述候選query集合中確定所述所請求query對應的泛化query;其中所述query匹配模型基于交叉注意力模型預先訓練得到。
第三方面,本申請提供了一種電子設備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行上述的方法。
第四方面,本申請提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行上述的方法。
第五方面,本申請還提供了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現根據上述任一項所述的方法。
由以上技術方案可以看出,通過字面匹配、語義匹配和query改寫中至少一種方式先確定出候選query集合,再進一步通過query匹配模型從候選query集合中進一步確定泛化query,從而實現針對所請求query的泛化。
上述可選方式所具有的其他效果將在下文中結合具體實施例加以說明。
附圖說明
附圖用于更好地理解本方案,不構成對本申請的限定。其中:
圖1為本申請實施例提供的主要方法流程圖;
圖2為本申請實施例提供的一種優選方法流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011445266.9/2.html,轉載請聲明來源鉆瓜專利網。





