[發明專利]訓練搜索模型的方法、搜索目標對象的方法及其裝置有效
| 申請號: | 202011330182.0 | 申請日: | 2020-11-24 |
| 公開(公告)號: | CN112328891B | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 卞東海;彭衛華;羅雨;蔣帥 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/36;G06N3/0464;G06N3/08 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 趙林琳;張昊 |
| 地址: | 100094 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 搜索 模型 方法 目標 對象 及其 裝置 | ||
1.一種訓練搜索模型的方法,包括:
基于樣本查詢信息獲取用于訓練所述搜索模型的第一樣本數據集;
基于預先構建的知識庫確定與所述樣本查詢信息相關聯的附加查詢信息;
基于所述附加查詢信息獲取用于訓練所述搜索模型的第二樣本數據集,其中所述第二樣本數據集與所述第一樣本數據集不同;以及
基于所述樣本查詢信息、所述第一樣本數據集和所述第二樣本數據集,訓練所述搜索模型,
其中所述知識庫是知識圖譜,并且基于所述知識庫確定與所述樣本查詢信息相關聯的所述附加查詢信息包括:
獲取所述樣本查詢信息中的關鍵詞;
從所述知識圖譜中確定與所述關鍵詞具有連接關系的附加關鍵詞;以及
基于所述附加關鍵詞確定所述附加查詢信息,
其中所述第一樣本數據集是正樣本數據集,并且所述第二樣本數據集是負樣本數據集。
2.根據權利要求1所述的方法,其中所述知識圖譜包含多個節點以及用于連接所述多個節點的多條邊,所述多條邊用于表征所述多個節點之間的關系,并且從所述知識圖譜中確定所述附加關鍵詞包括:
確定所述關鍵詞在所述知識圖譜中的對應的關鍵節點的上位節點;
基于所述多條邊中的與所述上位節點連接的邊,獲取與所述上位節點相關聯的至少一個節點,所述至少一個節點與所述關鍵節點不同;以及
將所述至少一個節點的對應關鍵詞確定為所述附加關鍵詞。
3.根據權利要求2所述的方法,其中基于所述知識庫確定與所述樣本查詢信息相關聯的所述附加查詢信息還包括:
確定所述關鍵詞與所述附加關鍵詞的路徑距離,所述路徑距離是所述關鍵詞與所述附加關鍵詞之間的邊的數目。
4.根據權利要求3所述的方法,其中基于所述附加查詢信息獲取用于訓練所述搜索模型的所述第二樣本數據集包括:
響應于所述路徑距離小于或等于閾值路徑距離,基于所述附加查詢信息獲取所述第二樣本數據集。
5.根據權利要求1所述的方法,其中訓練所述搜索模型包括:
根據所述樣本查詢信息與所述第一樣本數據集中的第一樣本,確定所述第一樣本命中所述樣本查詢信息的第一概率;
根據所述樣本查詢信息與所述第二樣本數據集中的第二樣本,確定所述第二樣本命中所述樣本查詢信息的第二概率;以及
響應于所述第一概率小于或等于所述第二概率,優化所述搜索模型的參數以更新所述第一概率和所述第二概率,其中更新后的所述第一概率大于更新后的所述第二概率。
6.根據權利要求1至5中任一項所述的方法,其中所述關鍵詞是實體詞或者所述實體詞的修飾詞。
7.根據權利要求1至5中任一項所述的方法,其中所述第一樣本數據集和所述第二樣本數據集均是圖像數據集。
8.一種用于搜索目標對象的方法,包括:
基于接收到的用戶查詢信息獲取多個備選目標對象;
基于根據權利要求1-7中任一項所述的方法訓練的所述搜索模型,分別確定所述多個備選目標對象命中所述用戶查詢信息的概率;以及
將概率超過閾值概率的備選目標對象確定為所述目標對象。
9.根據權利要求8所述的方法,其中所述目標對象是圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011330182.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于底盤充電口的彈性防護裝置
- 下一篇:多路高功率同步脈沖輸出裝置





