[發明專利]一種基于卷積神經網絡的特定視頻檢測方法在審
| 申請號: | 201610045369.3 | 申請日: | 2016-01-22 |
| 公開(公告)號: | CN105718890A | 公開(公告)日: | 2016-06-29 |
| 發明(設計)人: | 彭宇新;何相騰 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙) 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 特定 視頻 檢測 方法 | ||
1.一種基于卷積神經網絡的特定視頻檢測方法,包括以下步驟:
(1)利用標注的正樣本和負樣本對預先使用大規模數據集訓練得到的卷積神經網絡模型進行精細調整,從而得到適用于特定視頻檢測的卷積神經網絡模型;
(2)利用步驟(1)中訓練得到的卷積神經網絡模型對待識別的視頻關鍵幀直接計算出特征并進行預測,進而根據預測得分判斷是否為特定視頻。
2.如權利要求1所述的方法,其特征在于,所述步驟(1)中卷積神經網絡模型的訓練過程包括兩步,第一步是預訓練卷積神經網絡模型,第二步是精細調整卷積神經網絡模型。
3.如權利要求2所述的方法,其特征在于,所述預訓練卷積神經網絡模型,利用大規模數據集訓練得到卷積神經網絡模型,在訓練過程中僅使用圖像級別的標注信息,該過程本質上是卷積神經網絡模型參數不斷調整向訓練數據擬合的過程。
4.如權利要求3所述的方法,其特征在于,所述預訓練卷積神經網絡模型,在訓練過程中利用前向傳播算法和反向傳播算法對模型中的參數進行學習優化。
5.如權利要求2所述的方法,其特征在于,所述精細調整卷積神經網絡模型的方法是:首先,選取用于訓練的正樣本,正樣本選用標注好的特定視頻的關鍵幀,負樣本的來源是互聯網上非特定視頻的關鍵幀;然后采用反向傳播算法在選取的正負樣本上進一步學習;在學習過程中,通過控制學習參數減小底層網絡的學習速度,充分保存遷移過來的豐富底層特征,擴大深層網絡的學習速度,使得整個網絡較快地適應視頻類型檢測任務,自動調節深層神經元對于特定視頻概念的識別能力,得到適用于特定視頻檢測任務的卷積神經網絡網絡。
6.如權利要求1所述的方法,其特征在于,所述步驟(2)中,將待識別的視頻關鍵幀作為輸入層輸入到訓練好的卷積神經網絡模型,卷積神經網絡模型利用學習到的概念對輸入關鍵幀直接進行預測,預測的輸出為神經網絡輸出層神經元對于該關鍵幀的響應強度,并利用如下公式得到輸入關鍵幀的預測得分,最后根據得分來判斷是否為特定視頻;
其中h(x)表示輸入關鍵幀的預測得分,x對應于輸入關鍵幀經過卷積神經網絡模型得到的頂層神經元輸出向量,k表示輸出向量的維數,分子中xpos表示正樣本神經元對應的輸出。
7.如權利要求6所述的方法,其特征在于,所述根據得分來判斷是否為特定視頻,是將待識別視頻的所有關鍵幀的預測得分相加取均值或者選取預測得分的最大值作為待識別視頻的預測得分,若預測得分大于設定的閾值,則判斷該視頻為特定視頻,否則,判斷為非特定視頻。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610045369.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可增強對比度的服務器機柜室
- 下一篇:障礙物預警方法和障礙物預警裝置





