[發(fā)明專利]一種基于卷積神經(jīng)網(wǎng)絡(luò)的車輛前方可通行性分析方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310234126.0 | 申請(qǐng)日: | 2013-06-09 |
| 公開(公告)號(hào): | CN103279759A | 公開(公告)日: | 2013-09-04 |
| 發(fā)明(設(shè)計(jì))人: | 李琳輝;連靜;王蒙蒙;丁新立;宗云鵬;化玉偉;王宏旭;常靜 | 申請(qǐng)(專利權(quán))人: | 大連理工大學(xué) |
| 主分類號(hào): | G06K9/60 | 分類號(hào): | G06K9/60 |
| 代理公司: | 大連東方專利代理有限責(zé)任公司 21212 | 代理人: | 李洪福 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 卷積 神經(jīng)網(wǎng)絡(luò) 車輛 方可 通行 分析 方法 | ||
1.一種基于卷積神經(jīng)網(wǎng)絡(luò)的車輛前方可通行性分析方法,其特征在于:包括以下步驟:
A、圖像采集
首先通過安裝在車輛前方的攝像機(jī)采集大量真實(shí)的車輛行駛環(huán)境圖像,所述的圖像具有m×n個(gè)像素;然后通過裁剪得到圖像下部五分之三的區(qū)域作為感興趣區(qū)域;最后將裁剪后的圖像轉(zhuǎn)化為灰度圖像;
B、圖像預(yù)處理
B1、利用非線性函數(shù)疊加的方法構(gòu)造一個(gè)Gamma矯正函數(shù),對(duì)步驟A獲得的灰度圖像進(jìn)行矯正,具體函數(shù)式如下:
G(x)=1+f1(x)+f2(x)+f3(x)????(1)
f1(x)=acos(πx/255)????(2)
f2(x)=(K(x)+b)cosβ+xsinα????(3)
K(x)=ρsin(4πx/255)????(4)
α=arctan(-2b/255)????(5)
f3(x)=R(x)cos(3πx/255)????(6)
R(x)=c|2x/255-1|????(7)
式中,x為某一像素點(diǎn)的灰度值,G(x)代表某一灰度值對(duì)應(yīng)的Gamma矯正值,a∈(0,1)是一個(gè)加權(quán)系數(shù),b代表f2(x)的最大變化范圍,ρ表示K(x)的振幅,α表示K(x)的偏轉(zhuǎn)角度,c表示R(x)的幅值,且滿足a+b+c<1;
經(jīng)Gamma矯正后的灰度值計(jì)算公式為:
g(x)=255(x/255)1/G(x)????(8)
式中,g(x)代表經(jīng)過Gamma矯正后的某一像素點(diǎn)的灰度值;
經(jīng)過Gamma矯正,得到灰度圖像P;
B2、B2、針對(duì)灰度圖像P,改變某些像素點(diǎn)的灰度值,具體的改變方法如下:
選取圖像中除車輛和道路邊界之外的圖像區(qū)域中灰度值為0的像素點(diǎn),將其灰度值改為1,選取圖像中除車輛和道路邊界之外的圖像區(qū)域中灰度值為255的像素點(diǎn),將其灰度值改為254;將圖像中車輛區(qū)域像素點(diǎn)的灰度值改為0,道路邊界區(qū)域像素點(diǎn)的灰度值改為255,改變像素點(diǎn)后的圖像為灰度圖像Q;至此,灰度圖像Q的像素點(diǎn)包括三類:第一類是灰度值為0的像素點(diǎn),代表車輛;第二類是灰度值為255的像素點(diǎn),代表道路邊界;第三類是除去灰度值為0和255之外的像素點(diǎn),代表路面;將以上三類像素點(diǎn)分別賦予相應(yīng)的標(biāo)簽,即將標(biāo)簽“0”賦給第一類像素點(diǎn),表示“車輛”,將標(biāo)簽“1”賦給第二類像素點(diǎn),表示“道路邊界”,將標(biāo)簽“2”賦給第三類像素點(diǎn),表示“路面”;最后將灰度圖像Q中各個(gè)像素點(diǎn)的標(biāo)簽賦給灰度圖像P中相應(yīng)的像素點(diǎn);
B3、針對(duì)灰度圖像P的大小進(jìn)行歸一化處理:
B31、沿圖像高度方向,間隔選取不同的像素行,用x表示,通過實(shí)際采樣測量,獲取不同像素行x所對(duì)應(yīng)目標(biāo)的像素寬度和高度;
B32、以圖像中像素高度為0~32的圖像區(qū)域?yàn)閰⒖紙D像區(qū)域,以該參考圖像區(qū)域中所要識(shí)別的目標(biāo)的像素寬度W和高度H為基準(zhǔn),即設(shè)該參考圖像區(qū)域的橫向和縱向裁剪比例系數(shù)均為1;用W和H分別去除其余各像素行上目標(biāo)的寬度和高度,獲得兩組比值,分別用Y和Z表示;
B33、最后將像素行x與兩組比值Y和Z分別進(jìn)行擬合,得到兩條擬合曲線,如下所示:
Y=k1x+b1????(9)
Z=k2x+b2????(10)
其中,Y代表圖像橫向裁剪比例系數(shù),Z代表圖像縱向裁剪比例系數(shù),x代表圖像的某一像素行,k1、k2分別代表兩條擬合曲線的斜率,b1、b2分別代表兩條擬合曲線的截距;
B34、將參考圖像區(qū)域的橫向和縱向裁剪比例均設(shè)為1,即將參考圖像區(qū)域裁剪為32×32像素的圖像樣本;隨著x的增大,根據(jù)式(9)、(10)獲得的橫向和縱向裁剪尺寸也相應(yīng)增大;通過裁剪,得到一系列大小不一的圖像樣本,最后將裁剪得到的圖像樣本統(tǒng)一縮放為32×32像素的圖像;將得到的32×32像素的圖像作為卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本;
C、卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
典型卷積神經(jīng)網(wǎng)絡(luò)LeNet-5由8層組成,輸入是層是32×32像素圖像;網(wǎng)絡(luò)層C1、C3和C5分別代表卷積層,網(wǎng)絡(luò)層S2和S4為次抽樣層,網(wǎng)絡(luò)層F5為全連接層,輸出層神經(jīng)元的個(gè)數(shù)與要識(shí)別的目標(biāo)類別數(shù)相同,根據(jù)實(shí)際應(yīng)用環(huán)境進(jìn)行改變;每層網(wǎng)絡(luò)的一個(gè)面代表一個(gè)特征圖,該特征圖是由每一層中權(quán)值共享的神經(jīng)元組成的集合;每一層的神經(jīng)元只與上一層的一個(gè)局域感受野的神經(jīng)元連接;
卷積層的一般形式為:
式中,l∈{1,2,3,4,5,6,7,8}代表層數(shù),k是卷積核,Mj代表輸入特征圖的一個(gè)選擇,b代表偏置;
次抽樣層的一般形式為:
式中,down(·)表示次抽樣函數(shù),一般是對(duì)前一層圖像的一個(gè)n×n的區(qū)域求和,β表示次抽樣層的權(quán)值,b表示偏置;
根據(jù)實(shí)際應(yīng)用環(huán)境,對(duì)LeNet-5的輸出神經(jīng)元的個(gè)數(shù)進(jìn)行調(diào)整,然后采用步驟B獲得的像素尺寸為32×32的圖像樣本進(jìn)行訓(xùn)練;通過訓(xùn)練,當(dāng)卷積神經(jīng)網(wǎng)絡(luò)的輸出值與期望值的誤差處在可接受范圍內(nèi),便得到可用于車輛前方可通行性分析的卷積神經(jīng)網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連理工大學(xué),未經(jīng)大連理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310234126.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





