[發(fā)明專利]一種實時交通場景的多車牌動態(tài)識別方法在審
| 申請?zhí)枺?/td> | 201810368034.4 | 申請日: | 2018-04-23 | 
| 公開(公告)號: | CN108509954A | 公開(公告)日: | 2018-09-07 | 
| 發(fā)明(設計)人: | 張中;牛雷 | 申請(專利權)人: | 合肥湛達智能科技有限公司 | 
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62;G06N3/04;G06N3/08 | 
| 代理公司: | 昆明合眾智信知識產(chǎn)權事務所 53113 | 代理人: | 錢磊 | 
| 地址: | 230088 安徽省合肥市高新*** | 國省代碼: | 安徽;34 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 車牌定位 動態(tài)識別 實時交通 網(wǎng)絡訓練 車牌 圖像后處理 圖像預處理 場景 車牌信息 創(chuàng)新優(yōu)勢 違章行為 字符分割 字符識別 字符信息 傳統(tǒng)的 停車場 網(wǎng)絡 高速公路 分割 監(jiān)測 應用 圖片 | ||
1.一種實時交通場景的多車牌動態(tài)識別方法,其特征在于運用多種卷積神經(jīng)網(wǎng)絡對車牌進行整體識別,包括以下步驟:
S1、建立卷積神經(jīng)網(wǎng)絡,其包括車牌定位網(wǎng)絡和車牌識別;
S2、圖像預處理:將采集到的圖像調(diào)整為224*224分辨率;
S3、定位網(wǎng)絡訓練:將S2中處理過的圖像輸入到車牌定位網(wǎng)絡中進行特征學習;
S4、圖像后處理:把S3中定位后的車牌圖像拉伸到224*224分辨率;
S5、識別網(wǎng)絡訓練:將S4中處理過的車牌圖像輸入到車牌識別網(wǎng)絡中進行學習;
S6、神經(jīng)網(wǎng)絡測試:將測試圖片輸入到車牌定位網(wǎng)絡和車牌識別網(wǎng)絡中進行整體測試。
2.根據(jù)權利要求1所述的一種實時交通場景的多車牌動態(tài)識別方法,其特征在于,所述S3中將圖像輸入車牌定位網(wǎng)絡的特征學習包括以下步驟:
S31、所述車牌定位網(wǎng)絡具有16個卷積層、4個池化層、2個全連接層,層與層之間采用線性激活函數(shù),其最后一層全連接層采用修正的線性激活函數(shù),卷積層用于提取目標特征,全連接層用于預測坐標和類別概率;
S32、將輸入圖像劃分成S*S個格子,進行遍歷,當檢測目標中心出現(xiàn)在格子中時,該格檢測該目標并給出該目標在此格中表示該格子擁有目標的信心值的置信值,置信值范圍為0~1,置信值定義為:其中IOU為表示bounding box與實際目標框交集與并集的比值的交并比函數(shù),將檢測出的目標區(qū)域定義為bounding box,每個格子預測出B個bounding box,bounding box預測五個值:x、y、h、w、confidence;
S33、S32中劃分的每個格子預測一個記為C類的類別信息,預測C種假定類別的條件概率為Pr(Classi|Object);
S34、計算張量,張量計算公式為:S*S(B*5+C);
S35、通過將S32和S33得到的類別概率與置信值相乘,得到該類別的置信分數(shù),用于表示該類別在bounding box中出現(xiàn)的概率,該公式如下:
其中,等式左邊第一項代表每個網(wǎng)格預測的類別信息;
S36、計算坐標預測損失函數(shù),該公式如下:
其中,λcoord代表邊界框預測權重,λnoobj代表不包含目標邊界框的置信度預測權重,其中表示目標是否出現(xiàn)在網(wǎng)格單元i中,表示網(wǎng)格單元i中的第j個邊界框預測器負責預測;
含有目標的bounding box置信值預測損失函數(shù)計算為:
不包含目標的bounding box置信值預測損失函數(shù)計算為:
類別預測損失函數(shù)計算為:
S37、設定識別閾值作為標準,將得到每個bounding box的特定類別的置信分數(shù)與給定閾值比較,濾掉得分較低的bounding box,對保留的bounding box進行非極大值抑制處理,得到最終的檢測結果。
3.根據(jù)權利要求2所述的一種實時交通場景的多車牌動態(tài)識別方法,其特征在于,所述車牌定位網(wǎng)絡具有16個卷積層,2個全連接層,用以實現(xiàn)基于圖像全圖信息端到端的輸出,其網(wǎng)絡結構依次為:卷積層conv1、池化層max pool、卷積層conv2、池化層max pool、卷積層conv3、卷積層conv4、卷積層conv5、卷積層conv6、池化層max pool、卷積層conv7、卷積層conv8、卷積層conv9、卷積層conv10、池化層max pool、卷積層conv11、卷積層conv12、卷積層conv13、卷積層conv14、卷積層conv15、卷積層conv16、全連接層FC1和全連接層FC2。
4.根據(jù)權利要求1所述的一種實時交通場景的多車牌動態(tài)識別方法,其特征在于,所述車牌識別網(wǎng)絡還包括字符識別網(wǎng)絡算法,其包含5個卷積層,3個全連接層,其網(wǎng)絡結構依次為:卷積層conv1、池化層max pool、卷積層conv2、池化層max pool、卷積層conv3、卷積層conv4、卷積層conv5、池化層max pool、全連接層FC1、全連接層FC2和全連接層FC3,其中,全連接層FC3維度分為7部分,用于后續(xù)softmax分類字符。
5.根據(jù)權利要求4所述的一種實時交通場景的多車牌動態(tài)識別方法,其特征在于,所述字符識別網(wǎng)絡結構的全連接層FC3維度分為7個部分包括:采用可輸出7個label的7個softmax分類器分別對字符進行分類,每個softmax分類器負責輸出車牌對應位置的字符,每個分類器輸出字符的概率為:
且每個softmax分類器的輸出字符概率相加為1,即:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥湛達智能科技有限公司,未經(jīng)合肥湛達智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810368034.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡流早期分類
- 神經(jīng)網(wǎng)絡的訓練方法及裝置、存儲介質(zhì)及電子裝置
- 訓練神經(jīng)網(wǎng)絡的方法、裝置、系統(tǒng)和存儲介質(zhì)
- 模型訓練方法及裝置
- 神經(jīng)網(wǎng)絡的訓練方法、圖像識別方法及其裝置
- 目標檢測網(wǎng)絡的訓練方法、電子設備及存儲介質(zhì)
- 一種神經(jīng)網(wǎng)絡的訓練方法、存儲介質(zhì)和設備
- 基于半監(jiān)督學習的腦部腫瘤識別模型的訓練方法及裝置
- 圖像增強網(wǎng)絡的訓練方法、圖像處理方法及相關設備
- 人體部位分割網(wǎng)絡訓練方法、人體部位分割方法及裝置





