[發(fā)明專利]圖像檢測、行駛控制方法、裝置、電子設備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011187750.6 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112215840A | 公開(公告)日: | 2021-01-12 |
| 發(fā)明(設計)人: | 李祥泰;程光亮;石建萍 | 申請(專利權)人: | 上海商湯臨港智能科技有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/13;G06T9/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京中知恒瑞知識產(chǎn)權代理事務所(普通合伙) 11889 | 代理人: | 吳迪 |
| 地址: | 200232 上海市浦東新區(qū)中國(上海)自*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 檢測 行駛 控制 方法 裝置 電子設備 存儲 介質(zhì) | ||
本公開提供了一種圖像檢測、行駛控制方法、裝置、電子設備及存儲介質(zhì),該方法包括:根據(jù)待檢測圖像生成多通道特征數(shù)據(jù);將所述多通道特征數(shù)據(jù)中每個通道的特征數(shù)據(jù)分別進行壓縮,生成壓縮特征向量;根據(jù)所述壓縮特征向量生成全局特征向量,所述全局特征向量中包含所述待檢測圖像的全局信息;基于所述全局特征向量和所述多通道特征數(shù)據(jù),確定所述待檢測圖像對應的檢測結(jié)果。
技術領域
本公開涉及深度學習技術領域,具體而言,涉及一種圖像檢測、行駛控制方法、裝置、電子設備及存儲介質(zhì)。
背景技術
圖像處理任務可以包括圖像分類、目標物體檢測、語義分割、實例分割等。比如,語義分割是計算機視覺領域的基本問題之一,語義分割的目標是對圖像上的每一個像素進行檢測、分類,將圖像上屬于同一類的像素歸為一類,其中,語義分割有著廣泛的應用場景,比如自動駕駛場景、機器人場景等。
一般的,可以通過非局部Non-Local算法完成圖像處理任務,但是,Non-Local算法的運行效率與輸入圖像的分辨率密切相關,在輸入圖像的分辨率較高時,Non-Local算法的效率較低。
發(fā)明內(nèi)容
有鑒于此,本公開至少提供一種圖像檢測、行駛控制方法、裝置、電子設備及存儲介質(zhì)。
第一方面,本公開提供了一種圖像檢測方法,包括:
根據(jù)待檢測圖像生成多通道特征數(shù)據(jù);
將所述多通道特征數(shù)據(jù)中每個通道的特征數(shù)據(jù)分別進行壓縮,生成壓縮特征向量;
根據(jù)所述壓縮特征向量生成全局特征向量,所述全局特征向量中包含所述待檢測圖像的全局信息;
基于所述全局特征向量和所述多通道特征數(shù)據(jù),確定所述待檢測圖像對應的檢測結(jié)果。
采用上述方法,經(jīng)實驗發(fā)現(xiàn),神經(jīng)網(wǎng)絡最后生成的、用于進行預測的特征圖上,每個類別在通道上面的分布較稀疏,因此,本方案在生成多通道特征數(shù)據(jù)之后,將多通道特征數(shù)據(jù)中每個通道的特征數(shù)據(jù)分別進行壓縮,生成壓縮特征向量,根據(jù)壓縮特征向量生成全局特征向量,該全局特征向量中包含有待檢測圖像的全局信息;最后基于包含有待檢測圖像的全局信息的全局特征向量和多通道特征數(shù)據(jù),確定待檢測圖像對應的檢測結(jié)果時,保障了待檢測圖像的檢測結(jié)果的準確度的同時還由于特征數(shù)據(jù)被壓縮減小了數(shù)據(jù)處理量,從而無需關注待檢測圖像的分辨率信息,在保證圖像檢測準確度的基礎上,提高了圖像檢測的效率。
一種可能的實施方式中,所述將所述多通道特征數(shù)據(jù)中每個通道的特征數(shù)據(jù)分別進行壓縮,生成壓縮特征向量,包括:
對所述多通道特征數(shù)據(jù)進行降維處理,生成降維后的多通道特征數(shù)據(jù);
將所述降維后的多通道特征數(shù)據(jù)中每個通道的特征數(shù)據(jù)分別進行壓縮,生成所述壓縮特征向量。
采用上述方法,可以先對多通道特征數(shù)據(jù)進行降維處理,基于降維后的多通道特征數(shù)據(jù)生成壓縮特征向量時,減少了壓縮特征向量的維度,以便后續(xù)基于壓縮特征向量生成全局特征向量時,可以減少計算量,提高處理效率。
一種可能的實施方式中,將所述降維后的多通道特征數(shù)據(jù)中每個通道的特征數(shù)據(jù)分別進行壓縮,生成所述壓縮特征向量,包括:
基于全局池化操作對所述降維后的多通道特征數(shù)據(jù)中每個通道的特征數(shù)據(jù)分別進行壓縮,生成所述壓縮特征向量。
上述方法中,利用全局池化操作對降維后的多通道特征數(shù)據(jù)中每個通道的特征數(shù)據(jù)分別進行壓縮,生成壓縮特征向量,壓縮處理過程較為簡便。
一種可能的實施方式中,所述對所述多通道特征數(shù)據(jù)進行降維處理,生成降維后的多通道特征數(shù)據(jù),包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海商湯臨港智能科技有限公司,未經(jīng)上海商湯臨港智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011187750.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





