[發明專利]基于深度學習的視頻錄攝方法、裝置及終端在審
| 申請號: | 201710168941.X | 申請日: | 2017-03-16 |
| 公開(公告)號: | CN108632551A | 公開(公告)日: | 2018-10-09 |
| 發明(設計)人: | 鄒超洋;賀永剛;萬美君 | 申請(專利權)人: | 南昌黑鯊科技有限公司 |
| 主分類號: | H04N5/76 | 分類號: | H04N5/76;G06N3/08 |
| 代理公司: | 上海波拓知識產權代理有限公司 31264 | 代理人: | 楊波 |
| 地址: | 330008 江西省南昌市青山*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 訓練樣本圖像 場景 自編碼 稀疏 預處理 訓練分類器 分類模型 音頻參數 終端 調用 學習 多個目標 實時分類 視頻攝錄 網絡訓練 網絡 采集 圖像 | ||
1.一種基于深度學習的視頻錄攝方法,其特征在于,包括:
采集多個目標場景的多張訓練樣本圖像;
對每張訓練樣本圖像進行預處理;
利用預處理后的訓練樣本圖像訓練稀疏自編碼網絡;
通過所述多張訓練樣本圖像和所述稀疏自編碼網絡訓練訓練分類器,以得到分類模型;
利用所述分類模型對視頻錄攝過程中的圖像進行實時分類,以確定所述視頻錄攝的場景,從而調用與所述視頻錄攝的場景對應的音頻參數。
2.如權利要求1所述的基于深度學習的視頻錄攝方法,其特征在于,對每張訓練樣本圖像進行預處理的步驟包括:
隨機選取每張訓練樣本圖像中的多個圖像塊;
對所述訓練樣本圖像的多個圖像塊進行白化處理。
3.如權利要求1或2所述的基于深度學習的視頻錄攝方法,其特征在于,通過所述多張訓練樣本圖像和所述稀疏自編碼網絡訓練訓練分類器,以得到分類模型的步驟包括:
將所述訓練樣本圖像中白化處理后的圖像塊作為稀疏自編碼網絡的輸入矩陣和目標矩陣;
采用正態分布隨機初始化所述稀疏自編碼網絡的權值和偏置單元;
采用BP反向傳播算法更新所述稀疏自編碼網絡的權值和偏置單元。
4.如權利要求2所述的基于深度學習的視頻錄攝方法,其特征在于,所述基于深度學習的視頻錄攝方法還包括:
采集測試樣本圖像;
隨機選取每張測試樣本圖像中的多個圖像塊;
對每張測試樣本圖像中的多個圖像塊進行白化處理;
利用測試樣本圖像中白處理后的圖像塊對所述訓練分類器進行分類效果測試;
根據分類效果測試的結果調整音頻參數。
5.一種基于深度學習的視頻錄攝裝置,其特征在于,所述裝置包括:
圖像采集模塊,用于采集多個目標場景的多張訓練樣本圖像;
訓練預處理模塊,用于對每張訓練樣本圖像進行預處理;
網絡訓練模塊,用于利用預處理后的訓練樣本圖像訓練稀疏自編碼網絡;
分類模型獲取模塊,通過所述多張訓練樣本圖像和所述稀疏自編碼網絡訓練訓練分類器,以得到分類模型;
音頻調整模塊,用于利用所述分類模型對視頻錄攝過程中的圖像進行實時分類,以確定所述視頻錄攝的場景,從而調用與所述視頻錄攝的場景對應的音頻參數。
6.如權利要求5所述的基于深度學習的視頻錄攝裝置,其特征在于,所述訓練預處理模塊包括:
訓練選取單元,用于隨機選取每張訓練樣本圖像中的多個圖像塊;
訓練白化處理單元,對所述訓練樣本圖像的多個圖像塊進行白化處理。
7.如權利要求6所述的基于深度學習的視頻錄攝裝置,其特征在于,所述分類模型獲取模塊包括:
輸入單元,用于將所述訓練樣本圖像中白化處理后的圖像塊作為稀疏自編碼網絡的輸入矩陣和目標矩陣;
初始化單元,用于采用正態分布隨機初始化所述稀疏自編碼網絡的權值和偏置單元;
更新單元,用于采用BP反向傳播算法更新所述稀疏自編碼網絡的權值和偏置單元。
8.如權利要求6所述的基于深度學習的視頻錄攝裝置,其特征在于,裝置還包括:
分類效果測試模塊,用于采集測試樣本圖像,并隨機選取每張測試樣本圖像中的多個圖像塊后,對每張測試樣本圖像中的多個圖像塊進行白化處理,以利用測試樣本圖像中白處理后的圖像塊對所述訓練分類器進行分類效果測試,并根據分類效果測試的結果調整音頻參數。
9.一種終端,其特征在于,所述終端包括如權利要求5至8任意一項所述的基于深度學習的視頻錄攝裝置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南昌黑鯊科技有限公司,未經南昌黑鯊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710168941.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電視機及其LCD顯示設備
- 下一篇:記錄裝置、控制方法和存儲介質





