[發(fā)明專利]目標(biāo)檢測(cè)方法、系統(tǒng)、計(jì)算機(jī)裝置及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202011309432.2 | 申請(qǐng)日: | 2020-11-20 |
| 公開(公告)號(hào): | CN112132164B | 公開(公告)日: | 2021-03-09 |
| 發(fā)明(設(shè)計(jì))人: | 張蓓蓓;秦勇 | 申請(qǐng)(專利權(quán))人: | 北京易真學(xué)思教育科技有限公司 |
| 主分類號(hào): | G06K9/46 | 分類號(hào): | G06K9/46;G06N3/08;G06T3/40;G06T5/50;G06T7/11;G06T7/136;G06T7/187 |
| 代理公司: | 上海知錦知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 31327 | 代理人: | 高彥 |
| 地址: | 100043 北京市石景山區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 目標(biāo) 檢測(cè) 方法 系統(tǒng) 計(jì)算機(jī) 裝置 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)?zhí)峁┠繕?biāo)檢測(cè)方法、系統(tǒng)、計(jì)算機(jī)裝置及存儲(chǔ)介質(zhì),在方法中,通過獲取由原始圖像切分得到的各局部圖像、以及從所述原始圖像提取的至少一信息強(qiáng)化圖像;對(duì)每個(gè)局部圖像和信息強(qiáng)化圖像并行地在每個(gè)分支的特征提取模塊進(jìn)行特征提取,以得到每個(gè)分支的至少一特征提取圖像;將各個(gè)分支的至少一特征提取圖像按在該原始圖像中的對(duì)應(yīng)所在位置進(jìn)行拼接及融合,以形成至少一輸出特征圖像;根據(jù)所述至少一輸出特征圖像形成待檢測(cè)特征圖像;根據(jù)所述待檢測(cè)特征圖像得到目標(biāo)檢測(cè)結(jié)果。所實(shí)現(xiàn)方案中通過將原始圖像進(jìn)行局部劃分且并行地通過特征提取模塊進(jìn)行特征提取,以提升檢測(cè)效率,并且通過多維度的圖像特征提取及融合強(qiáng)化圖像信息,提升目標(biāo)檢測(cè)效果。
技術(shù)領(lǐng)域
本申請(qǐng)實(shí)施例涉及目標(biāo)檢測(cè)技術(shù)領(lǐng)域,尤其涉及目標(biāo)檢測(cè)方法、系統(tǒng)、計(jì)算機(jī)裝置及存儲(chǔ)介質(zhì)。
背景技術(shù)
在眾多計(jì)算機(jī)視覺應(yīng)用場(chǎng)景中,例如目標(biāo)識(shí)別等,目標(biāo)檢測(cè)是其重要的前置步驟。具體的,通過處理所采集圖像中的目標(biāo)相關(guān)特征以定位目標(biāo)所在區(qū)域。
所述目標(biāo)可以是人、物等。在目標(biāo)檢測(cè)中會(huì)用到目標(biāo)檢測(cè)模型,例如神經(jīng)網(wǎng)絡(luò)模型等。
隨著目標(biāo)檢測(cè)模型的技術(shù)在飛速發(fā)展,已在準(zhǔn)確度及效率上有了不少的提升,但是在實(shí)際應(yīng)用中的復(fù)雜情景下,仍然會(huì)有不足之處。
舉例而言,文本檢測(cè)是目標(biāo)檢測(cè)中應(yīng)用廣泛的一種,是很多計(jì)算機(jī)視覺任務(wù)的前置步驟,比如圖像搜索、文字識(shí)別,身份認(rèn)證和視覺導(dǎo)航等,文本檢測(cè)的主要目的是定位文本行或字符在圖像中的位置,文本的精準(zhǔn)定位既十分重要又具備挑戰(zhàn),因?yàn)橄噍^于通用目標(biāo)檢測(cè)來(lái)說,文字具有多方向、不規(guī)則形狀、極端長(zhǎng)寬比、字體、顏色、背景多樣等特點(diǎn),因此,往往在通用目標(biāo)檢測(cè)上較為成功的算法無(wú)法直接遷移到文字檢測(cè)中,但近年來(lái)隨著深度學(xué)習(xí)的再次興起,對(duì)文本檢測(cè)的研究也成為了一大熱點(diǎn),出現(xiàn)了大量專用于文本檢測(cè)的方法,且都取得了不錯(cuò)的檢測(cè)效果。
根據(jù)文本檢測(cè)所用方法的技術(shù)特點(diǎn),目前比較流行的文本檢測(cè)方法可大致分為兩類,第一類是基于滑動(dòng)窗口的文本檢測(cè)方法,它主要是基于通用目標(biāo)檢測(cè)的思想,設(shè)置大量不同長(zhǎng)寬比、不同大小的錨點(diǎn)框,以這些錨點(diǎn)框?yàn)榛瑒?dòng)窗口,在圖像上或者在從圖像上進(jìn)行過卷積操作得到的特征映射圖上進(jìn)行遍歷搜索,對(duì)于每個(gè)搜索到的位置框,進(jìn)行框內(nèi)是否是文本的分類判定,這種方法的優(yōu)點(diǎn)是文本框判定之后,不需要其余的后續(xù)里便可進(jìn)行后續(xù)工作,缺點(diǎn)是計(jì)算量過大,不僅需要耗費(fèi)大量計(jì)算資源,而且耗時(shí)較長(zhǎng);第二類是基于計(jì)算連通域的方法,也稱基于分割思想的方法,它主要是先使用全卷積神經(jīng)網(wǎng)絡(luò)模型提取圖像特征,然后對(duì)特征圖進(jìn)行二值化并計(jì)算其連通域,然后根據(jù)不同地應(yīng)用場(chǎng)景(即不同地訓(xùn)練數(shù)據(jù)集),使用一些特定的方法,判斷文本行位置,這種方法的優(yōu)點(diǎn)是計(jì)算快速,計(jì)算量小;然而缺點(diǎn)是后處理步驟繁瑣,涉及大量的計(jì)算和調(diào)優(yōu),這不僅會(huì)消耗大量時(shí)間,同時(shí),后處理策略是否合理有效也嚴(yán)格制約著算法的性能。
對(duì)于第二種分割思想的方法,有大量的研究在如何簡(jiǎn)化后處理部分做了相當(dāng)多的工作,但是對(duì)于較少文本的場(chǎng)景中的文本檢測(cè)有所作用,例如在一些開放的場(chǎng)景文本檢測(cè)數(shù)據(jù)集上(每張圖像4到5個(gè)文本框)效果尚可,但是針對(duì)文本非常密集的實(shí)際應(yīng)用場(chǎng)景(比如一張圖像上有上百個(gè)文本區(qū)域,如小學(xué)生的算術(shù)練習(xí)冊(cè)等),檢測(cè)速度受文本框數(shù)量的影響非常大,幾乎是隨著文本框數(shù)量的增長(zhǎng),呈線性下降趨勢(shì),無(wú)法滿足實(shí)際應(yīng)用場(chǎng)景的速度需求。
同樣的,可以推知在其它類型的目標(biāo)檢測(cè)中,也會(huì)存在需要在目標(biāo)檢測(cè)模型的檢測(cè)效率上有所提升的需求,故如何找到一種提升目標(biāo)檢測(cè)效率的方案,已成為業(yè)界亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
有鑒于此,本申請(qǐng)實(shí)施例中提供目標(biāo)檢測(cè)方法、系統(tǒng)、計(jì)算機(jī)裝置及存儲(chǔ)介質(zhì),解決現(xiàn)有技術(shù)中的技術(shù)問題。
本申請(qǐng)實(shí)施例提供了一種目標(biāo)檢測(cè)方法,包括:
獲取由原始圖像切分得到的各局部圖像、以及從所述原始圖像提取的至少一信息強(qiáng)化圖像;
通過特征提取模塊對(duì)每個(gè)局部圖像和信息強(qiáng)化圖像進(jìn)行特征提取,以分別得到至少一特征提取圖像;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京易真學(xué)思教育科技有限公司,未經(jīng)北京易真學(xué)思教育科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011309432.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:樣本生成方法及裝置
- 下一篇:一種飛行器及其飛行器控制方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 目標(biāo)檢測(cè)裝置、學(xué)習(xí)裝置、目標(biāo)檢測(cè)系統(tǒng)及目標(biāo)檢測(cè)方法
- 目標(biāo)監(jiān)測(cè)方法、目標(biāo)監(jiān)測(cè)裝置以及目標(biāo)監(jiān)測(cè)程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測(cè)方法和目標(biāo)檢測(cè)裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





