[發明專利]一種基于深度學習和極限學習機的交通標志識別方法在審
| 申請號: | 202010321962.2 | 申請日: | 2020-04-22 |
| 公開(公告)號: | CN111461060A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 李文舉;那馨元;蘇攀 | 申請(專利權)人: | 上海應用技術大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/06;G06N3/04;G06N3/08 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 黃超宇;胡晶 |
| 地址: | 200235 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 極限 學習機 交通標志 識別 方法 | ||
1.一種基于深度學習和極限學習機的交通標志識別方法,其特征在于,包括以下步驟:
步驟1:獲取交通標志樣本數據集,按照交叉驗證的方法,按照10:1的比例隨機分為訓練數據集和測試數據集;
步驟2:對數據集進行增強處理,得到分布均勻的訓練樣本集,并通過分布均勻的訓練樣本集訓練神經網絡模型;
步驟3:利用VGG16網絡生成的特征金字塔監測出交通標志;
步驟4:利用極限學習機ELM分類器識別交通標志,利用全連接網絡進行邊界框回歸。
2.根據權利要求1所述的一種基于深度學習和極限學習機的交通標志識別方法,其特征在于,步驟1包括:
以含有一個交通標志的圖片為一個樣本,樣本大小為16×16至250×250,數據集共包含51839張樣本,隨機選取47126張作為訓練集,4713張為測試集,然后對所有樣本進行等大縮放處理。
3.根據權利要求2所述的一種基于深度學習和極限學習機的交通標志識別方法,其特征在于,對樣本進行等大縮放處理的過程為:將樣本圖片利用雙線性差值方法統一縮放至32×32大小。
4.根據權利要求1所述的一種基于深度學習和極限學習機的交通標志識別方法,其特征在于,步驟2中對數據庫進行增強的過程為:使用平移、隨機旋轉、水平翻轉的方法進行數據擴充,使訓練數據集中不同類別的樣本均衡化。
5.根據權利要求1所述的一種基于深度學習和極限學習機的交通標志識別方法,其特征在于,步驟3中VGG16網絡訓練樣本的過程包括:
步驟31:準備訓練樣本集,其中包括正樣本集和負樣本集;
步驟32:手動裁剪樣本;
步驟33:裁剪得到訓練樣本之后,將所有正樣本放在一個文件夾中,將所有負樣本放在一個文件夾中,并將所有訓練樣本縮放到統一尺寸;
步驟34:提取所有正樣本的Hog特征;
步驟35:提取所有負樣本的Hog特征。
6.根據權利要求1所述的一種基于深度學習和極限學習機的交通標志識別方法,其特征在于,步驟4中采用ELM的分類方法,輸出的誤差可以表示為:
其中,j=1,...N,N為輸入的樣本數,oM為第j個輸入樣本的預測輸出,tM為第j個輸入樣本的標簽;
最小化損失函數為:
其中,N表示輸入的樣本數,L為ELM分類器隱層的神經元數,βL為隱層各神經元的權值,wL為第j個輸入樣本的權值,xj為第j個樣本,bi為隱層第i個神經元的偏置,tj為對應于第j個輸入樣本的標簽;
ELM模型隱藏層輸出H(x)的計算公式如下:
H(x)=[h1(x),...,hL(x)]
H(x)是ELM非線性映射的隱藏層輸出矩陣,hi(x)是第i個隱藏層節點的輸出,隱藏層節點的輸出函數不是唯一的,不同的輸出函數可以用于不同的隱藏層神經元,通常,在實際應用中,hi(x)如下表示:
hi(x)=g(wi,bi,x)=g(wi·x+bi),wi∈RD,bi∈R
其中,g(wi,bi,x)是激活函數。
7.根據權利要求1所述的一種基于深度學習和極限學習機的交通標志識別方法,其特征在于,步驟4中,訓練ELM分類器過程如下:
步驟41:輸入訓練樣本的特征,使用sigmoid函數作為激活函數,表示為:
步驟42:隨機生成隱含層參數(w,b);
步驟43:計算隱含層輸出矩陣H;
步驟44:計算輸出權值β;
β=[β1,…,βL]T
步驟45:計算輸出向量T;
T=[t1,…,tL]T。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海應用技術大學,未經上海應用技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010321962.2/1.html,轉載請聲明來源鉆瓜專利網。





