[發明專利]一種用于接打電話識別的深度學習網絡模型及系統在審
| 申請號: | 201810765537.5 | 申請日: | 2018-07-12 |
| 公開(公告)號: | CN108985222A | 公開(公告)日: | 2018-12-11 |
| 發明(設計)人: | 張德馨;史玉坤 | 申請(專利權)人: | 天津艾思科爾科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 天津濱海科緯知識產權代理有限公司 12211 | 代理人: | 張會雪 |
| 地址: | 300457 天津市濱海新區經濟技術開*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡模型 網絡 打電話 融合檢測 識別系統 特征提取 卷積 學習 檢測 圖像預處理模塊 視頻輸入模塊 數據存儲模塊 報警模塊 單元確定 聚類算法 網絡包括 第三層 卷積核 連接層 網絡層 占用率 準確率 兩層 內存 替換 原型 優化 統計 保證 | ||
1.一種用于接打電話識別的深度學習網絡模型,網絡模型的原型為VGG16網絡,其特征在于,優化后的網絡的建立方法為將原VGG16網絡中前10層卷積層中的卷積核個數減半,并將原VGG16網絡中第三層全連接層替換為融合檢測網絡。
2.如權利要求1所述一種用于接打電話識別的深度學習網絡模型,其特征在于,所述融合檢測網絡包括5個檢測單元,每個檢測單元包括兩層卷積層。
3.如權利要求2所述一種用于接打電話識別的深度學習網絡模型,其特征在于,所述檢測單元確定特征提取時所需的預選框尺寸的范圍,由K-means聚類算法統計得到。
4.如權利要求3所述一種用于接打電話識別的深度學習網絡模型,其特征在于,所述預選框尺寸范圍的確定方法為:用K-means聚類算法統計標記好的樣本的尺寸,從統計結果中由大到小依次選取x5、x4、x3、x2、x1,其中x5為統計結果中的最大值,第一檢測單元預選框尺寸的范圍為0.8*x1~x1;第二檢測單元預選框尺寸的范圍為x1~x2;第三檢測單元預選框尺寸的范圍為x2~x3;第四檢測單元預選框尺寸的范圍為x3~x4;第五檢測單元預選框尺寸的范圍為x4~x5。
5.如權利要求1所述一種用于接打電話識別的深度學習網絡模型,其特征在于,所述優化后的網絡的輸入為:經過圖像增強的圖像集,圖像增強包括修改原始圖像集的色度、亮度、飽和度和對比度。
6.一種基于深度學習的接打電話識別系統,其特征在于,包括視頻輸入模塊、圖像預處理模塊、接打電話識別模塊、報警模塊和數據存儲模塊,其中圖像預處理模塊用于判斷采集的圖像背景亮度與參考背景亮度之差是否小于設定的閾值,當小于設定的閾值時對采集的圖像進行光照處理。
7.如權利要求6所述一種基于深度學習的接打電話識別系統,其特征在于,光照處理的步驟包括:
步驟1.對圖像進行冪律變換,擴大圖像在光線不足情況下的動態范圍和壓縮在光線強烈時的動態范圍;
步驟2.采用高斯差分濾波器,對低頻和高頻部分進行處理;
步驟3.重新歸一化所有的像素點值。
8.如權利要求6所述一種基于深度學習的接打電話識別系統,其特征在于,所述參考背景定期自動更換或人為更換。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津艾思科爾科技有限公司,未經天津艾思科爾科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810765537.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:視頻片段檢測方法、裝置、設備和存儲介質
- 下一篇:一種人體動作識別方法





