[發明專利]基于人工智能的模型訓練方法和相關裝置有效
| 申請號: | 202010162183.2 | 申請日: | 2020-03-10 |
| 公開(公告)號: | CN111401192B | 公開(公告)日: | 2023-07-18 |
| 發明(設計)人: | 宋奕兵 | 申請(專利權)人: | 深圳市騰訊計算機系統有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/82;G06V20/40;G06V10/62 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 常忠良 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 模型 訓練 方法 相關 裝置 | ||
本申請實施例公開了基于人工智能的模型訓練方法和相關裝置,針對用于目標跟蹤的識別網絡模型的訓練過程中,采用目標圖像和訓練圖像進行訓練,得到訓練圖像對應的第一識別結果,其體現對訓練圖像中目標對象的預測位置。基于所述訓練圖像的標簽確定第一識別結果中針對目標對象的差異信息,并根據差異信息生成用于標識目標對象的形態變化的變換參數,通過變換參數調整訓練圖像對應的特征數據,可以使得調整后的特征數據實現模擬目標對象的上述形態變化。識別網絡模型可以針對調整后的特征數據得到第二識別結果,并根據第二識別結果與訓練圖像的標簽對識別網絡模型的參數進行更新,提高了識別網絡模型的對待識別對象形態變化的魯棒性。
技術領域
本申請涉及人工智能領域,特別是涉及基于人工智能的模型訓練方法和相關裝置。
背景技術
目標跟蹤是一種神經網絡模型應用的典型場景,通過神經網絡模型可以實現識別視頻幀中目標的位置,并基于各視頻幀的目標識別結果,實現在視頻中對該目標進行跟蹤。
一種目標跟蹤場景是無預定義目標的情況,例如安防中對可疑危險目標的跟蹤,廣告植入中對候選廣告位的跟蹤等。
在這種目標跟蹤場景中,神經網絡模型在跟蹤一個目標之前難以獲知該目標的一切信息,當目標在跟蹤過程中發生明顯的形態變化時,會很容易出現分辨不出目標而導致跟蹤失敗的情況。
發明內容
為了解決上述技術問題,本申請提供了基于人工智能的模型訓練方法和相關裝置,提高了識別網絡模型對待識別對象形態變化的魯棒性。
本申請實施例公開了如下技術方案:
一方面,本申請實施例提供了一種模型訓練方法,所述方法包括:
根據標識目標對象的目標圖像和包括所述目標對象的訓練圖像訓練識別網絡模型,得到所述訓練圖像對應的第一識別結果,所述第一識別結果用于標識對所述訓練圖像中所述目標對象的預測位置;
根據所述訓練圖像的標簽確定所述第一識別結果中針對所述目標對象的差異信息;
根據所述差異信息生成用于標識所述目標對象的形態變化的變換參數;
通過所述變換參數調整所述訓練圖像對應的特征數據,調整后的所述特征數據用于模擬所述目標對象的所述形態變化;
通過所述識別網絡模型得到第二識別結果,所述第二識別結果用于標識基于調整后的所述特征數據對所述訓練圖像中所述目標對象的預測位置;
根據所述第二識別結果與所述訓練圖像的標簽對所述識別網絡模型的參數進行更新。
另一方面,本申請實施例提供了一種模型訓練方法的裝置,所述裝置包括訓練單元,確定單元,生成單元,調整單元和更新單元:
所述訓練單元,用于根據標識目標對象的目標圖像和包括所述目標對象的訓練圖像訓練識別網絡模型,得到所述訓練圖像對應的第一識別結果,所述第一識別結果用于標識對所述訓練圖像中所述目標對象的預測位置;
所述確定單元,用于根據所述訓練圖像的標簽確定所述第一識別結果中針對所述目標對象的差異信息;
所述生成單元,用于根據所述差異信息生成用于標識所述目標對象的形態變化的變換參數;
所述調整單元,用于通過所述變換參數調整所述訓練圖像對應的特征數據,調整后的所述特征數據用于模擬所述目標對象的所述形態變化;
所述訓練單元,還用于通過所述識別網絡模型得到第二識別結果,所述第二識別結果用于標識基于調整后的所述特征數據對所述訓練圖像中所述目標對象的預測位置;
所述更新單元,用于根據所述第二識別結果與所述訓練圖像的標簽對所述識別網絡模型的參數進行更新。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市騰訊計算機系統有限公司,未經深圳市騰訊計算機系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010162183.2/2.html,轉載請聲明來源鉆瓜專利網。





