[發(fā)明專利]一種基于Unet+ConvGRU混合模型的車道線檢測方法在審
| 申請?zhí)枺?/td> | 202110284093.5 | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN112949541A | 公開(公告)日: | 2021-06-11 |
| 發(fā)明(設(shè)計)人: | 趙靜;邱增玉;孫仕亮 | 申請(專利權(quán))人: | 華東師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海藍迪專利商標事務(wù)所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 unet convgru 混合 模型 車道 檢測 方法 | ||
本發(fā)明公開了一種基于Unet+ConvGRU混合模型的車道線檢測方法,用于輔助駕駛和無人駕駛。與以往采用單幀圖片檢測車道線方法相比,本發(fā)明考慮到車道線檢測具有時序的特點,前幾幀車道線的特征信息對當前車道線檢測具有很大作用,這使得當前的車道線檢測的信息能夠融合多層次的特征結(jié)構(gòu)信息,使得模型推理的信息更加豐富。在車道線被遮擋、標記退化等特殊駕駛場景,更能準確地檢測出車道線。最后在Tusimple車道線數(shù)據(jù)集上驗證了本發(fā)明的有效性和魯棒性,并且實時性也比較好。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機技術(shù)領(lǐng)域,涉及圖像分類技術(shù),特別涉及一種語義分割的車道線檢測方法。
背景技術(shù)
本發(fā)明涉及背景技術(shù):語義分割、Unet模型、GRU模型。
1)語義分割
圖像語義分割(Semantic Segmentation)是圖像處理和是機器視覺技術(shù)中關(guān)于圖像理解的重要一環(huán),也是人工智能領(lǐng)域中一個重要的分支。語義分割即是對圖像中每一個像素點進行分類,確定每個像素點的類別(如屬于背景、人或車等),從而進行區(qū)域劃分。很多語義分割的網(wǎng)絡(luò)模型,例如FCN、Unet、SegNet等,被廣泛應(yīng)用于自動駕駛、醫(yī)療影像等場景中。
2)Unet模型
Unet提出的初衷是為了解決醫(yī)學圖像分割的問題,其網(wǎng)絡(luò)結(jié)構(gòu)類似于U形結(jié)構(gòu)。其網(wǎng)絡(luò)結(jié)構(gòu)首先對圖片進行卷積和池化,在Unet結(jié)構(gòu)中池化了4次,每一次池化操作,特征圖的尺寸將減少一半。例如一開始的圖片尺寸是224×224,那么4次池化后依次就會變成112×112、56×56、28×28、14×14四個不同尺寸的特征圖。然后再對 14×14的特征圖做上采樣或者反卷積,即每次上采樣或者反卷積特征圖的尺寸將擴大一倍,得到28×28的特征圖,這個28×28的特征圖與之前的28×28的特征圖進行通道上的拼接,再對拼接之后的特征圖做卷積和上采樣,得到56×56的特征圖,再與之前的56×56的特征圖拼接、卷積,再上采樣或反卷積,經(jīng)過四次上采樣可以得到一個與輸入圖像尺寸相同的224×224的預(yù)測結(jié)果。通過Unet網(wǎng)絡(luò)對圖片特征提取后獲取上下文的信息和位置信息等。
3)GRU模型
GRU(Gate Recurrent Unit)是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的一種。和LSTM(Long-Short Term Memory)一樣,也是為了解決長期記憶和反向傳播中的梯率等問題而提出來的。相比LSTM,使用GRU能夠達到相當?shù)男Ч啾戎赂菀走M行訓練,能夠很大程率上提高訓練效率,并且模型的參數(shù)、訓練時間更少。而ConvGRU將GRU中的一些矩陣乘法運算代替為卷積運算,但卻大大減少了網(wǎng)絡(luò)模型的參數(shù),提高了模型收斂速率。
在GRU模型中,假設(shè)有一個當前的輸入xt,和上一個節(jié)點傳遞下來的隱狀態(tài)(hidden state)ht-1,這個隱狀態(tài)包含了之前節(jié)點的相關(guān)信息。結(jié)合xt和ht-1,6RU 會得到當前隱藏節(jié)點的輸出yt和傳遞給下一個節(jié)點的隱狀態(tài)ht。其中隱藏狀態(tài)ht通過重置門和更新門得到。滿足下面公式:
rt=σ(Wr×[xt,ht-1])
zt=σ(Wz×[xt,ht-1])
上式中σ稱為為sigmoid函數(shù),通過這個函數(shù)可以將數(shù)據(jù)變換為0-1范圍內(nèi)的數(shù)值。rt為t時刻的重置門(reset gate),zt為t時刻的更新門(update gate)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華東師范大學,未經(jīng)華東師范大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110284093.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于檢測腫瘤的3D UNet網(wǎng)絡(luò)模型構(gòu)建方法、裝置及存儲介質(zhì)
- 一種基于ResNet與UNet模型的圖像分割方法
- 一種基于Capsules-Unet模型的遙感圖像深度學習分類方法和系統(tǒng)
- 基于UNet卷積神經(jīng)網(wǎng)絡(luò)的膀胱超聲圖像分割方法及裝置
- 一種基于Unet網(wǎng)絡(luò)的層序地層格架構(gòu)建方法和系統(tǒng)
- 基于改進Unet網(wǎng)絡(luò)的電阻焊接剪切強度識別方法
- 基于改進型UNet++網(wǎng)絡(luò)的遙感圖像建筑物提取方法
- 一種基于注意力Unet模型的醫(yī)學圖像語義分割方法
- 基于卷積稀疏編碼的Unet語義分割方法
- 一種基于UNet的肺部X光圖像分割方法





