[發明專利]一種基于車載利用相鄰幀間圖像結合單幀圖像檢測優化方法有效
| 申請號: | 201410655255.1 | 申請日: | 2014-11-17 |
| 公開(公告)號: | CN104376302B | 公開(公告)日: | 2017-12-15 |
| 發明(設計)人: | 左石凱;王明江 | 申請(專利權)人: | 哈爾濱工業大學深圳研究生院 |
| 主分類號: | G06T7/30 | 分類號: | G06T7/30 |
| 代理公司: | 深圳市科吉華烽知識產權事務所(普通合伙)44248 | 代理人: | 熊偉,許建 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 車載 利用 相鄰 圖像 結合 檢測 優化 方法 | ||
技術領域
本發明屬于視頻圖像處理及模式識別技術領域,尤其涉及一種基于車載多幀圖像的行人檢測的優化方法。
背景技術
隨著國民經濟的快速發展和機動車輛的迅猛增加,我國城市交通問題日益嚴峻。在混合交通系統環境中,行人和車輛是交通的主要組成部分。作為影響社會安定的一個重要因素,行車安全越來越受到社會的關注和重視。如果我們把行人檢測和跟蹤應用到智能汽車的輔助駕駛系統中,對車輛前方的行人進行檢測,及時告知駕駛員車輛前方存在行人,并進行安全預警,對減少或避免車輛與行人發生碰撞事故有著重大的意義。
從行人檢測研究方法的切入點來看主要分為兩類:其一是基于背景建模的方法:分割出前景,提取其中的運動目標,然后進一步提取特征,分類判別,在存在下雨、下雪、刮風、樹葉晃動、燈光忽明忽暗等場合,該方法的魯棒性不高,抗干擾能力較差且背景建模方法的模型過于復雜,對參數較為敏感;其二是基于統計學習的方法:根據大量訓練樣本構建行人檢測分類器,提取的特征一般有目標的灰度、邊緣、紋理、形狀、梯度直方圖等信息。
而當前主流的研究方向是從統計學習角度出發,從大量的訓練樣本中抽取特征,建立人體模型,把行人檢測化為一個模式分類的問題。其優點是可以從樣本集中學習人體的不同變化,具有較好的魯棒性,而且合理的選擇訓練樣本和特征,結合結構合理的分類算法,可以較好的克服許多不利條件,如行人多樣性、場景多樣性、光照環境多樣性等的影響。但其不足在于算法的復雜程度較高,對單幀圖像的檢測識別行人時耗時較多,以至于不適合對多幀實時檢測。
發明內容
為了克服現有技術中的缺陷,本發明為基于車載多幀圖像的行人檢測提供了一種優化方法。
本發明提供了利用相鄰幀間圖像結合單幀圖像的檢測優化方案,為了實現該方案,運用了以下技術:
對于單幀圖像,把圖像從上到下依次分為上、中上、中下、下四個區域,并用不同比例的掃描窗口依次對每一區域進行匹配:1)如果掃描窗口的下邊緣坐標小于等于上區域的下邊界時用最小窗口遍歷匹配;2)如果掃描窗口下邊緣坐標大于上區域的下邊界小于等于中上區域的下邊界時用較小窗口遍歷匹配;3)如果掃描窗口下邊緣坐標大于中上區域的下邊界小于等于中下區域的下邊界時用較大窗口遍歷匹配;4)如果掃描窗口下邊緣坐標大于中下區域下邊界時用較大窗口遍歷匹配。
對于多幀圖像,前一幀圖像通過上述單幀圖像方法進行檢測,提取檢測出的矩形框的坐標并保存;然后通過改變矩形框的橫縱坐標值使矩形框放大一定的比例作為當前幀的感興趣區域,當前幀圖像只需對感興趣區域通過上述單幀圖像的方法進行掃描窗口遍歷匹配,并且根據掃描窗口的下邊界區域可以判斷窗口是否會增大。由于實時圖像不斷有新的行人的出現,可根據實際情況對整幅圖像遍歷匹配的頻率進行修改。
本發明的有益效果是:不但對單幀圖像的檢測速度進行了大幅度的提高,而且對相鄰幀間的圖像進行了優化。由于在實際情況中車輛和行人的距離是越來越近的,所以行人的矩形框應該是越來越大的,這恰好符合了本發明方法。實驗結果表明,本發明的方法在降低計算量的前提下,性能非常接近基于統計學習方法對單幀圖像的檢測,但時間相對縮小了近3倍。
附圖說明
圖1是本發明的基于車載利用相鄰幀間圖像結合單幀圖像的檢測優化方法的流程圖;
圖2是本發明的方法中單幀行人檢測的示意圖。
具體實施方式
下面結合附圖說明及具體實施方式對本發明進一步說明。
附圖1是本發明的基于車載利用相鄰幀間圖像結合單幀圖像的檢測優化方法的流程圖,采集車輛前方的圖像并利用單幀進行行人檢測方法對圖像進行掃描窗口匹配檢測,提取檢測結果并保存,然后通過改變矩形框橫縱坐標值使其放大一定的比例作為感興趣區域(ROI),把感興趣區域作為下一幀的檢測區域進行檢測并且根據檢測區域內掃描窗口的下邊界區域可以判斷窗口是否會增大。在進行相鄰幀間檢測的過程中可根據行人更新的頻率判斷是否需要全掃描圖像,如果需要則采集車輛前方圖像,如果不需要則繼續提取檢測結果作為下一幀的感興趣區域。由于實時圖像不斷有新的行人的出現,可根據實際情況改變是否需要全掃描圖像的頻率,一般情況下5幀/次。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學深圳研究生院,未經哈爾濱工業大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410655255.1/2.html,轉載請聲明來源鉆瓜專利網。





