[發(fā)明專利]一種用于接打電話識別的深度學(xué)習(xí)網(wǎng)絡(luò)模型及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201810765537.5 | 申請日: | 2018-07-12 |
| 公開(公告)號: | CN108985222A | 公開(公告)日: | 2018-12-11 |
| 發(fā)明(設(shè)計)人: | 張德馨;史玉坤 | 申請(專利權(quán))人: | 天津艾思科爾科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 天津濱海科緯知識產(chǎn)權(quán)代理有限公司 12211 | 代理人: | 張會雪 |
| 地址: | 300457 天津市濱海新區(qū)經(jīng)濟技術(shù)開*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)絡(luò)模型 網(wǎng)絡(luò) 打電話 融合檢測 識別系統(tǒng) 特征提取 卷積 學(xué)習(xí) 檢測 圖像預(yù)處理模塊 視頻輸入模塊 數(shù)據(jù)存儲模塊 報警模塊 單元確定 聚類算法 網(wǎng)絡(luò)包括 第三層 卷積核 連接層 網(wǎng)絡(luò)層 占用率 準確率 兩層 內(nèi)存 替換 原型 優(yōu)化 統(tǒng)計 保證 | ||
本發(fā)明提出一種用于接打電話識別的深度學(xué)習(xí)網(wǎng)絡(luò)模型,網(wǎng)絡(luò)模型的原型為VGG16網(wǎng)絡(luò),優(yōu)化后的網(wǎng)絡(luò)的建立方法為將原VGG16網(wǎng)絡(luò)中前10層卷積層中的卷積核個數(shù)減半,并將原VGG16網(wǎng)絡(luò)中第三層全連接層替換為融合檢測網(wǎng)絡(luò)。所述融合檢測網(wǎng)絡(luò)包括5個檢測單元,每個檢測單元包括兩層卷積層。所述檢測單元確定特征提取時所需的預(yù)選框尺寸的范圍,由K?means聚類算法統(tǒng)計得到。基于此網(wǎng)絡(luò)模型提出一種基于深度學(xué)習(xí)的接打電話識別系統(tǒng),包括視頻輸入模塊、圖像預(yù)處理模塊、接打電話識別模塊、報警模塊和數(shù)據(jù)存儲模塊。與現(xiàn)有技術(shù)相比,本發(fā)明提出的深度學(xué)習(xí)網(wǎng)絡(luò)中特征提取網(wǎng)絡(luò)層的學(xué)習(xí)更充分。所述識別系統(tǒng)在保證準確率的同時,降低內(nèi)存的占用率。
技術(shù)領(lǐng)域
本發(fā)明屬于機器視覺領(lǐng)域,尤其是一種用于接打電話識別的深度學(xué)習(xí)網(wǎng)絡(luò)模型及系統(tǒng)。
背景技術(shù)
基于視覺的人體動作識別要解決的主要問題是通過計算機對攝像機采集的原始圖像或圖像序列數(shù)據(jù)進行處理和分析,學(xué)習(xí)并理解其中人的動作和行為,通過分析獲得人體運動模式,建立視頻內(nèi)容和動作類型之間的映射關(guān)系。動作識別的主要難點在于模型的設(shè)計,使其不僅能從背景中檢測出目標和動作,而且能準確識別動作多樣性的變化。目前手動設(shè)計的模型,當動作有部分被遮擋或同一動作在不同的環(huán)境下發(fā)生時,識別的效果較差。
發(fā)明內(nèi)容
某些情況下打電話屬于一種危險的動作,比如:在加油站加油或駕駛員處于駕駛狀態(tài)。基于此設(shè)計一種用于接打電話識別的深度學(xué)習(xí)網(wǎng)絡(luò)模型,采用的技術(shù)方案如下:
一種用于接打電話識別的深度學(xué)習(xí)網(wǎng)絡(luò)模型,檢測模型的原型為VGG16網(wǎng)絡(luò),優(yōu)化后的網(wǎng)絡(luò)的建立方法為將原VGG16網(wǎng)絡(luò)中前10層卷積層中的卷積核個數(shù)減半,同時增大權(quán)重學(xué)習(xí)率和偏重學(xué)習(xí)率,并將原VGG16網(wǎng)絡(luò)中第三層全連接層替換為融合檢測網(wǎng)絡(luò)。
進一步的,所述融合檢測網(wǎng)絡(luò)包括5個檢測單元,每個檢測單元包括兩層卷積層。
進一步的,所述檢測單元確定特征提取時所需的預(yù)選框尺寸的范圍,由K-means聚類算法統(tǒng)計得到。
進一步的,所述預(yù)選框尺寸范圍的確定方法為:用K-means聚類算法統(tǒng)計標記好的樣本的尺寸,從統(tǒng)計結(jié)果中由大到小依次選取x5、x4、x3、x2、x1,其中x5為統(tǒng)計結(jié)果中的最大值,第一檢測單元預(yù)選框尺寸的范圍為0.8*x1~x1;第二檢測單元預(yù)選框尺寸的范圍為x1~x2;第三檢測單元預(yù)選框尺寸的范圍為x2~x3;第四檢測單元預(yù)選框尺寸的范圍為x3~x4;第五檢測單元預(yù)選框尺寸的范圍為x4~x5。
進一步的,所述優(yōu)化后的網(wǎng)絡(luò)的輸入為:經(jīng)過圖像增強的圖像集,圖像增強包括修改原始圖像集的色度、亮度、飽和度和對比度。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:將原VGG16網(wǎng)絡(luò)中前10層卷積層中的卷積核個數(shù)減半,同時增大權(quán)重學(xué)習(xí)率和偏重學(xué)習(xí)率,使特征提取網(wǎng)絡(luò)層的學(xué)習(xí)更充分,在保證動作識別的準確率的同時,降低內(nèi)存的占用率。融合檢測網(wǎng)絡(luò)層所使用的預(yù)選框尺寸的范圍是用K-means聚類算法進行統(tǒng)計得到的,這樣可以使預(yù)選框尺寸的最大尺寸和最小尺寸更為適配檢測的場景。
本發(fā)明的另一目的在于提出一種基于深度學(xué)習(xí)的接打電話識別系統(tǒng),包括視頻輸入模塊、圖像預(yù)處理模塊、接打電話識別模塊、報警模塊和數(shù)據(jù)存儲模塊。
其中圖像預(yù)處理模塊用于判斷采集的圖像背景亮度與參考背景亮度之差是否小于設(shè)定的閾值,當小于設(shè)定的閾值時對采集的圖像進行光照處理。光照處理的步驟包括:
步驟1.對圖像進行冪律變換,擴大圖像在光線不足情況下的動態(tài)范圍和壓縮在光線強烈時的動態(tài)范圍;
步驟2.采用高斯差分濾波器,對低頻和高頻部分進行處理;
步驟3.重新歸一化所有的像素點值。
進一步的,所述參考背景定期自動更換或人為更換。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津艾思科爾科技有限公司,未經(jīng)天津艾思科爾科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810765537.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 腦網(wǎng)絡(luò)模型建立方法
- 弱光圖像增強方法及裝置
- 模型訓(xùn)練方法及裝置
- 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型搜索方法、裝置及存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型搜索方法、裝置以及電子設(shè)備
- 含有聚類拓撲耦合的神經(jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 多視角的網(wǎng)絡(luò)攻防仿真系統(tǒng)
- 一種多模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 一種神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 一種利用側(cè)鍵撥打電話的移動終端
- 一種基于Windows Mobile操作系統(tǒng)撥打電話的方法及設(shè)備
- 通過網(wǎng)頁打電話的方法及系統(tǒng)
- 一種利用手機照片撥打電話的方法及手機
- 一種自動防止盜撥電話的方法及系統(tǒng)
- 基于多屏互動終端共享手機撥打電話的處理方法及系統(tǒng)
- 免費上網(wǎng)或打電話系統(tǒng)及其使用方法
- 一種基于計算機視覺技術(shù)的駕駛員打電話檢測方法及系統(tǒng)
- 一種基于計算機視覺技術(shù)的駕駛員打電話檢測系統(tǒng)
- 傳送保密醫(yī)用測試結(jié)果信息到不公開姓名的打電話人的電話發(fā)送和處理系統(tǒng)
- 物體檢測裝置和檢測物體的方法
- 一種檢測基因融合的方法
- 基于Dasarathy模型的檢測數(shù)據(jù)融合方法
- 分布式傳感網(wǎng)絡(luò)基于信任的態(tài)勢數(shù)據(jù)融合方法
- 腫瘤驅(qū)動基因的檢測芯片及其應(yīng)用
- 血液腫瘤融合基因的高通量檢測試劑盒及檢測方法
- 一種協(xié)同檢測異構(gòu)信息融合方法
- 檢測基因融合突變的方法、裝置、存儲介質(zhì)、處理器及轉(zhuǎn)錄組數(shù)據(jù)表達量標準化的方法
- 一種基于激光雷達點云和相機圖像融合的車道線檢測方法及裝置和芯片
- 融合基因檢測參考品的制備方法及融合基因檢測參考品的應(yīng)用





