[發明專利]圖像前背景分割及網絡模型訓練、圖像處理方法和裝置有效
| 申請號: | 201610694814.9 | 申請日: | 2016-08-19 |
| 公開(公告)號: | CN107341805B | 公開(公告)日: | 2018-11-23 |
| 發明(設計)人: | 石建萍;欒青 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T7/136;G06T7/194 |
| 代理公司: | 北京天健君律專利代理事務所(普通合伙) 11461 | 代理人: | 羅延紅;紀烈超 |
| 地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 背景 分割 網絡 模型 訓練 處理 方法 裝置 | ||
本發明實施例提供了一種圖像前背景分割網絡模型的訓練、圖像前背景分割及視頻圖像處理的方法、裝置和終端設備,其中,圖像前背景分割網絡模型的訓練方法包括:獲取待訓練的樣本圖像的特征向量;對特征向量進行卷積處理,獲取特征向量卷積結果;對特征向量卷積結果進行放大處理;判斷放大后的特征向量卷積結果是否滿足收斂條件;若滿足,則完成對用于分割圖像前背景的卷積神經網絡模型的訓練;若不滿足,則根據放大后的特征向量卷積結果調整卷積神經網絡模型的參數并根據調整后的卷積神經網絡模型的參數對卷積神經網絡模型進行迭代訓練,直至卷積結果滿足收斂條件。通過本發明實施例,提高了卷積神經網絡模型的訓練效率,縮短了訓練時間。
技術領域
本發明實施例涉及人工智能技術領域,尤其涉及一種圖像前背景分割網絡模型的訓練方法、裝置和終端設備,一種圖像前背景分割方法、裝置和終端設備,以及,一種視頻圖像處理方法、裝置和終端設備。
背景技術
卷積神經網絡是用于計算機視覺和模式識別的一個重要的研究領域,它通過計算機仿照生物大腦思維啟發進行類似人類對特定對象的信息處理。通過卷積神經網絡,能夠有效地進行對象檢測和識別。隨著互聯網技術的發展,信息量的急劇增加,卷積神經網絡被越來越廣泛地應用于對象檢測及識別領域,以從大量的信息中尋找出實際所需的信息。
目前,卷積神經網絡需要采集大量的樣本進行訓練,以達到較為準確的預測效果。然而,目前的卷積神經網絡訓練過程復雜,加上訓練樣本數量的增加,造成訓練時間長、訓練成本高。
發明內容
本發明實施例提供了一種圖像前背景分割網絡模型的訓練方案、一種圖像前背景分割方案,以及,一種視頻圖像處理方案。
根據本發明實施例的一個方面,提供了一種圖像前背景分割網絡模型的訓練方法,包括:獲取待訓練的樣本圖像的特征向量,其中,所述樣本圖像為包含有前景標注信息和背景標注信息的樣本圖像;對所述特征向量進行卷積處理,獲取特征向量卷積結果;對所述特征向量卷積結果進行放大處理;判斷放大后的所述特征向量卷積結果是否滿足收斂條件;若滿足,則完成對用于分割圖像前背景的卷積神經網絡模型的訓練;若不滿足,則根據放大后的所述特征向量卷積結果調整所述卷積神經網絡模型的參數并根據調整后的所述卷積神經網絡模型的參數對所述卷積神經網絡模型進行迭代訓練,直至迭代訓練后的特征向量卷積結果滿足所述收斂條件。
可選地,結合本發明實施例提供的任一種圖像前背景分割網絡模型的訓練方法,其中,對所述特征向量卷積結果進行放大處理包括:通過對所述特征向量卷積結果進行雙線性插值,放大所述特征向量卷積結果。
可選地,結合本發明實施例提供的任一種圖像前背景分割網絡模型的訓練方法,其中,對所述特征向量卷積結果進行放大處理包括:將所述特征向量卷積結果放大到放大后的特征向量卷積結果對應的圖像的大小與原始圖像大小一致。
可選地,結合本發明實施例提供的任一種圖像前背景分割網絡模型的訓練方法,其中,判斷放大后的所述特征向量卷積結果是否滿足收斂條件包括:使用設定的損失函數計算放大后的所述特征向量卷積結果和預定的標準輸出特征向量的損失值;根據所述損失值判斷放大后的所述特征向量卷積結果是否滿足收斂條件。
可選地,結合本發明實施例提供的任一種圖像前背景分割網絡模型的訓練方法,其中,所述方法還包括:獲取測試樣本圖像,使用訓練后的所述卷積神經網絡模型對所述測試樣本圖像進行前背景區域的預測;檢驗預測的前背景區域是否正確;若不正確,則使用所述測試樣本圖像對所述卷積神經網絡模型進行再次訓練。
可選地,結合本發明實施例提供的任一種圖像前背景分割網絡模型的訓練方法,其中,使用所述測試樣本圖像對所述卷積神經網絡模型進行再次訓練,包括:從所述測試樣本圖像中獲取前背景區域預測不正確的樣本圖像;使用預測不正確的樣本圖像對所述卷積神經網絡模型進行再次訓練,其中,對所述卷積神經網絡模型進行再次訓練的所述預測不正確的樣本圖像包含有前景信息和背景信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610694814.9/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





