[發(fā)明專利]目標檢測方法、裝置、電子設備以及存儲介質在審
| 申請?zhí)枺?/td> | 202011197358.X | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112307976A | 公開(公告)日: | 2021-02-02 |
| 發(fā)明(設計)人: | 徐昇;張濱;馮原;辛穎;王曉迪;韓樹民;劉靜偉;毛明遠;林書妃;苑鵬程;彭巖;龍翔 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 北京市漢坤律師事務所 11602 | 代理人: | 姜浩然;吳麗麗 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 檢測 方法 裝置 電子設備 以及 存儲 介質 | ||
本公開提供了目標檢測方法、裝置、電子設備以及存儲介質,涉及人工智能領域,具體涉及計算機視覺。所述方法包括:基于待檢測圖像確定分別用于至少兩個目標檢測器的至少兩個輸入圖像,其中所述至少兩個目標檢測器具有互不相同的骨架網(wǎng)絡,對于所述至少兩個目標檢測器中的每個目標檢測器,利用該目標檢測器的骨架網(wǎng)絡對該目標檢測器的輸入圖像進行處理,以得到用于該輸入圖像的不同尺寸的至少兩個圖像特征;基于不同尺寸的至少兩個圖像特征確定該目標檢測器的候選檢測結果;對所述至少兩個目標檢測器的候選檢測結果進行融合,以得到所述待檢測圖像的目標檢測結果。
技術領域
本公開實施例涉及人工智能領域,具體涉及計算機視覺,具體涉及目標檢測方法、裝置、電子設備以及存儲介質。
背景技術
人工智能是研究使計算機來模擬人的某些思維過程和智能行為(如學習、推理、思考、規(guī)劃等)的學科,既有硬件層面的技術也有軟件層面的技術。人工智能硬件技術一般包括如傳感器、專用人工智能芯片、云計算、分布式存儲、大數(shù)據(jù)處理等技術:人工智能軟件技術主要包括計算機視覺技術、語音識別技術、自然語言處理技術以及機器學習/深度學習、大數(shù)據(jù)處理技術、知識圖譜技術等幾大方向。
目標檢測是計算機視覺領域中的一個常見應用,廣泛應用于機器人導航、智能視頻監(jiān)控、工業(yè)檢測、航空航天等諸多領域。在一些情況下,需要檢測的圖像中可能包括尺度較小的目標。這樣尺度較小的目標在采集圖像時具有較低的信噪比,并且在圖像中占據(jù)較少的像素數(shù)量。
發(fā)明內容
根據(jù)本公開示例性實施例的一個方面,提供了一種目標檢測方法,包括:基于待檢測圖像確定分別用于至少兩個目標檢測器的至少兩個輸入圖像,其中至少兩個目標檢測器具有互不相同的骨架網(wǎng)絡,對于至少兩個目標檢測器中的每個目標檢測器,利用該目標檢測器的骨架網(wǎng)絡對該目標檢測器的輸入圖像進行處理,以得到用于該輸入圖像的不同尺寸的至少兩個圖像特征;基于不同尺寸的至少兩個圖像特征確定該目標檢測器的候選檢測結果;對至少兩個目標檢測器的候選檢測結果進行融合,以得到待檢測圖像的目標檢測結果。
根據(jù)本公開實施例的另一個方面,還提供了一種目標檢測器的訓練方法,包括:利用包含預定類別的目標對象的圖像數(shù)據(jù)集對所述目標檢測器進行預訓練,以得到所述目標檢測器的初始參數(shù);利用包含針對所述預定類別的小目標檢測的圖像數(shù)據(jù)集對所述目標檢測器進行訓練,以對所述初始參數(shù)進行調整來得到訓練好的參數(shù)。
根據(jù)本公開示例性實施例的另一個方面,提供了一種目標檢測裝置,包括:輸入圖像確定單元,配置成基于待檢測圖像確定分別用于至少兩個目標檢測器的至少兩個輸入圖像,其中至少兩個目標檢測器具有互不相同的骨架網(wǎng)絡,候選檢測單元,配置成對于所述至少兩個目標檢測器中的每個目標檢測器,利用該目標檢測器的骨架網(wǎng)絡對該目標檢測器的輸入圖像進行處理,以得到用于該輸入圖像的不同尺寸的至少兩個圖像特征;基于不同尺寸的至少兩個圖像特征確定所述該目標檢測器的候選檢測結果;融合單元,配置成對至少兩個目標檢測器的候選檢測結果進行融合,以得到待檢測圖像的目標檢測結果。
根據(jù)本公開示例性實施例的另一個方面,提供了一種電子設備,包括:處理器;以及存儲程序的存儲器,所述程序包括指令,所述指令在由所述處理器執(zhí)行時使所述處理器執(zhí)行根據(jù)本公開一些示例性實施例的方法。
根據(jù)本公開示例性實施例的另一個方面,提供了一種存儲程序的計算機可讀存儲介質。程序包括指令,指令在由服務器的處理器執(zhí)行時,致使處理器執(zhí)行根據(jù)本公開一些示例性實施例的方法。
借助于本公開示例性實施例的目標檢測方法、裝置、服務器以及存儲介質,可以利用不同檢測器中的不同骨架網(wǎng)絡獲取輸入圖像的語義信息,利用根據(jù)不同骨架網(wǎng)絡獲取的語義信息得到的目標檢測結果的融合結果確定最終的目標檢測結果,從而提高了目標檢測的精度。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011197358.X/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





