[發明專利]訓練搜索模型的方法、搜索目標對象的方法及其裝置有效
| 申請號: | 202011330182.0 | 申請日: | 2020-11-24 |
| 公開(公告)號: | CN112328891B | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 卞東海;彭衛華;羅雨;蔣帥 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/36;G06N3/0464;G06N3/08 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 趙林琳;張昊 |
| 地址: | 100094 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 搜索 模型 方法 目標 對象 及其 裝置 | ||
本公開的實施例涉及訓練搜索模型的方法、搜索目標對象的方法及其裝置,涉及機器學習領域。該方法可以包括基于樣本查詢信息獲取用于訓練搜索模型的第一樣本數據集。該方法還可以包括基于預先構建的知識庫確定與樣本查詢信息相關聯的附加查詢信息。此外,該方法可以進一步包括基于附加查詢信息獲取用于訓練搜索模型的第二樣本數據集,其中第二樣本數據集與第一樣本數據集不同。并且,該方法還可以包括基于樣本查詢信息、第一樣本數據集和第二樣本數據集,訓練搜索模型。本公開的技術方案可以快速高效且低成本地完成對搜索模型的訓練,從而確定與用戶查詢信息較為相關的對象。
技術領域
本公開的實施例主要涉及人工智能領域,并且更具體地,涉及訓練搜索模型的方法、用于搜索目標對象的方法、及其裝置、電子設備、計算機可讀存儲介質、以及計算機程序產品。
背景技術
用戶在搜索圖片時,相似的用戶查詢信息(或稱查詢項,即“query”)可能代表著完全不同的種類,如“時尚韓版毛衣”和“時尚歐美毛衣”,從字面上來看都是搜索“毛衣”這個用戶查詢信息,但是本質上用戶更關注的是特定風格類型的毛衣。傳統的圖片搜索方法在這種細粒度分類方面還沒有比較有效的實現方案。此外,用于訓練圖片搜索模型的相關數據集基本都是正樣本數據。因此,訓練出的用于圖片搜索的模型很可能存在性能不佳的情況。
發明內容
根據本公開的示例實施例,提供了一種訓練搜索模型的方案。
在本公開的第一方面中,提供了一種訓練搜索模型的方法。該方法可以包括基于樣本查詢信息獲取用于訓練所述搜索模型的第一樣本數據集。該方法還可以包括基于預先構建的知識庫確定與所述樣本查詢信息相關聯的附加查詢信息。此外,該方法可以進一步包括基于所述附加查詢信息獲取用于訓練所述搜索模型的第二樣本數據集,其中所述第二樣本數據集與所述第一樣本數據集不同。并且,該方法還可以包括基于所述樣本查詢信息、所述第一樣本數據集和所述第二樣本數據集,訓練所述搜索模型。
在本公開的第二方面中,提供了一種訓練搜索模型的裝置,包括:第一樣本數據集獲取模塊,被配置為基于樣本查詢信息獲取用于訓練所述搜索模型的第一樣本數據集;附加查詢信息確定模塊,被配置為基于預先構建的知識庫確定與所述樣本查詢信息相關聯的附加查詢信息;第二樣本數據集獲取模塊,被配置為基于所述附加查詢信息獲取用于訓練所述搜索模型的第二樣本數據集,其中所述第二樣本數據集與所述第一樣本數據集不同;以及搜索模型訓練模塊,被配置為基于所述樣本查詢信息、所述第一樣本數據集和所述第二樣本數據集,訓練所述搜索模型。
在本公開的第三方面中,提供了一種搜索目標對象的方法,包括:基于接收到的用戶查詢信息獲取多個備選目標對象;基于根據本公開的第一方面的方法訓練的所述目標用戶確定模型,分別確定所述多個備選目標對象命中所述用戶查詢信息的概率;以及將概率超過閾值概率的備選目標對象確定為所述目標對象。
在本公開的第四方面中,提供了一種用于搜索目標對象的裝置,包括:備選目標對象獲取模塊,被配置為基于接收到的用戶查詢信息獲取多個備選目標對象;概率確定模塊,被配置為基于根據本公開的第二方面的裝置訓練的所述目標用戶確定模型,分別確定所述多個備選目標對象命中所述用戶查詢信息的概率;以及目標對象確定模塊,被配置為將概率超過閾值概率的備選目標對象確定為所述目標對象。
在本公開的第五方面中,提供了一種電子設備,包括一個或多個處理器;以及存儲裝置,用于存儲一個或多個程序,當一個或多個程序被一個或多個處理器執行,使得一個或多個處理器實現根據本公開的第一方面的方法。
在本公開的第六方面中,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現根據本公開的第一方面的方法。
在本公開的第七方面中,提供了一種計算機程序產品,所述計算機程序產品被有形地存儲在非瞬態計算機可讀介質上并且包括機器可執行指令,所述機器可執行指令在被執行時使機器執行根據本公開的第一方面的方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011330182.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于底盤充電口的彈性防護裝置
- 下一篇:多路高功率同步脈沖輸出裝置





