[發明專利]一種訓練模型的方法、圖像檢索的方法以及裝置在審
| 申請號: | 202110132038.4 | 申請日: | 2021-01-30 |
| 公開(公告)號: | CN113159095A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 李煒棉;朱凱強;黃飛;許松岑 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/02 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 訓練 模型 方法 圖像 檢索 以及 裝置 | ||
1.一種訓練模型的方法,其特征在于,包括:
獲取多個訓練樣本,每個所述訓練樣本包括圖像和文本,所述文本用于描述所述圖像中的目標對象;
將所述多個訓練樣本輸入目標模型中,以使所述目標模型執行下述流程,直至所述滿足預設的停止條件:
提取第一圖像的圖像特征和第一文本的文本特征,所述第一圖像是所述多個訓練樣本中任意一個所述訓練樣本中包括的圖像,所述第一文本用于描述所述第一圖像中的目標對象;
根據第一向量和第二向量之間的差異獲取第一損失值,所述第一向量的維度和所述第二向量的維度相同,所述第一向量用于指示所述第一圖像的圖像特征,所述第二向量用于指示所述第一文本的文本特征;
所述根據所述第一損失值更新所述目標模型。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
根據所述第一圖像的圖像特征,預測所述第一圖像中的目標對象的至少一個屬性;
根據所述至少一個屬性和預設標簽之間的差異獲取第二損失值,所述預設標簽是對所述第一文本進行分詞預處理后獲取的;
所述根據所述第一損失值更新所述目標模型,包括:
根據所述第一損失值和所述第二損失值更新所述目標模型。
3.根據權利要求2所述的方法,其特征在于,所述方法還包括:
根據所述第一圖像的圖像特征,預測所述第一圖像中的目標對象屬于對象集合中各個目標對象的第一概率,所述對象集合包括所述多個訓練樣本中全部所述圖像中包括的目標對象;
根據所述第一文本的文本特征預測所述第一文本用于描述對象集合中各個目標對象的第二概率;
根據所述第一概率和所述第二概率之間的差異獲取第三損失值;
所述根據所述第一損失值更新所述目標模型,包括:
根據所述第一損失值、所述第二損失值以及所述第三損失值更新所述目標模型。
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:
根據所述第一概率和第一預設值之間的差異,獲取第四損失值,所述第一預設值指示預設的所述第一圖像中的目標對象屬于對象集合中各個目標對象的概率;
根據所述第二概率和第二預設值之間的差異,獲取第五損失值,所述第二預設值指示預設的所述第一文本用于描述對象集合中各個目標對象的概率;
所述根據所述第一損失值更新所述目標模型,包括:
根據所述第一損失值、所述第二損失值、所述第三損失值、所述第四損失值以及所述第五損失值更新所述目標模型。
5.根據權利要求4所述的方法,其特征在于,所述方法還包括:
根據所述第一圖像的圖像特征和第二圖像的圖像特征之間的差異獲取第六損失值,所述第二圖像和所述第一圖像從不同角度展示相同的目標對象;
所述根據所述第一損失值更新所述目標模型,包括:
根據所述第一損失值、所述第二損失值、所述第三損失值、所述第四損失值、所述第五損失值以及所述第六損失值更新所述目標模型。
6.根據權利要求5所述的方法,其特征在于,所述方法還包括:
獲取所述第一向量和第三向量之間的第一距離,獲取所述第一向量和第四向量之間的第二距離,所述第三向量用于指示所述第二圖像的圖像特征,所述第四向量用于指示第三圖像的圖像特征,所述第三圖像和所述第一圖像中包括的目標對象不同;
根據所述第一距離和所述第二距離之間的差值與預設閾值的差異獲取第七損失值;
所述根據所述第一損失值更新所述目標模型,包括:
根據所述第一損失值、所述第二損失值、所述第三損失值、所述第四損失值、所述第五損失值、所述第六損失值以及所述第七損失值更新所述目標模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110132038.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能網絡監控系統
- 下一篇:一種神經網絡的訓練方法及相關設備
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





