[發(fā)明專利]監(jiān)控邊緣計算中提升視頻目標(biāo)檢測性能的方法及裝置有效
| 申請?zhí)枺?/td> | 202010828519.4 | 申請日: | 2020-08-18 |
| 公開(公告)號: | CN111709407B | 公開(公告)日: | 2020-11-13 |
| 發(fā)明(設(shè)計)人: | 韋虎;涂治國 | 申請(專利權(quán))人: | 眸芯科技(上海)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201210 上海市浦東新區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 監(jiān)控 邊緣 計算 提升 視頻 目標(biāo) 檢測 性能 方法 裝置 | ||
1.一種監(jiān)控邊緣計算中提升視頻目標(biāo)檢測性能的方法,其特征在于包括步驟:
根據(jù)目標(biāo)檢測神經(jīng)網(wǎng)絡(luò)算法的輸入尺寸和原始輸入圖像尺寸確定掃描用的多個矩形滑動窗的尺寸,所述矩形滑動窗能夠按照預(yù)設(shè)的掃描規(guī)則按幀在原始輸入圖像上移動到不同的位置;
每幀檢測時,將原始輸入圖像和各矩形滑動窗中的滑動窗子圖分別按不同比例進(jìn)行縮放處理,處理后的原始輸入圖像的分辨率低于滑動窗子圖的分辨率;
將縮放處理后的各圖像組合拼接成矩形輸入圖像并作為檢測輸入圖像;
通過對應(yīng)輸入尺度的目標(biāo)檢測神經(jīng)網(wǎng)絡(luò)算法對前述檢測輸入圖像進(jìn)行檢測;
其中,根據(jù)目標(biāo)檢測神經(jīng)網(wǎng)絡(luò)算法的輸入尺寸和原始輸入圖像尺寸確定掃描用的多個矩形滑動窗的尺寸的步驟為,
步驟110,根據(jù)當(dāng)前設(shè)備算力確定所采用的目標(biāo)檢測神經(jīng)網(wǎng)絡(luò)算法的輸入尺寸,以及對應(yīng)輸入尺寸下算法能檢測到目標(biāo)的最小檢測尺寸和最大檢測尺寸;
步驟120,按照前述輸入尺寸,將檢測神經(jīng)網(wǎng)絡(luò)算法輸入矩形分割成多個矩形子圖區(qū),每個矩形子圖區(qū)大于等于算法能檢測的最小檢測尺寸;所述矩形子圖區(qū)包括全圖映射子圖區(qū)和滑動窗映射子圖區(qū),所述全圖映射子圖區(qū)的長寬比與原始輸入圖像的長寬比相同,用于顯示縮小到低分辨率的原始輸入圖像,所述滑動窗映射子圖區(qū)用于顯示對應(yīng)的滑動窗子圖;
其中,各矩形子圖區(qū)的分割步驟如下,
步驟121,在檢測神經(jīng)網(wǎng)絡(luò)算法輸入矩形上確定所述全圖映射子圖區(qū)的大小:根據(jù)最近檢測距離L0的目標(biāo)在原始輸入圖像上的大小,選擇一個初始縮放比例,使得所述原始輸入圖像上的最近目標(biāo)縮放后小于等于算法能檢測的最大檢測尺寸,以便在全圖映射子圖區(qū)上檢測到最近距離目標(biāo),同時給各滑動窗映射子圖區(qū)留下足夠空間,所述原始輸入圖像到全圖映射子圖區(qū)的縮放比例確定后,也確定了全圖映射子圖區(qū)上能檢測到的最遠(yuǎn)檢測距離L1;
步驟122,在剩下的空間上,選擇一個矩形大小區(qū)域作為一個滑動窗映射子圖區(qū),使得所述原始輸入圖像上距離L1的目標(biāo)縮小后能夠落在所述滑動窗映射子圖區(qū)內(nèi),并且能夠被檢測算法檢測到;調(diào)整縮放比例,使得原始輸入圖像上最遠(yuǎn)檢測距離L2的目標(biāo)能被檢測到;
步驟123,重復(fù)步驟122以確定其他滑動窗映射子圖區(qū)的大小,將最遠(yuǎn)檢測距離逐步擴(kuò)大,直到?jīng)]有合適的空間用來設(shè)置為滑動窗映射子圖區(qū);
步驟124,重復(fù)執(zhí)行步驟121至步驟123以調(diào)整各矩形子圖區(qū)大小和對應(yīng)的縮放比例,使得檢測距離最遠(yuǎn)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于還包括步驟:將各滑動窗子圖的檢測結(jié)果合并映射到原始輸入圖像上。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于:步驟122中,原始輸入圖像上最遠(yuǎn)檢測距離L2的目標(biāo)在原始圖像上停留所用時間長于滑動窗的一輪掃描時間。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述多個矩形滑動窗的大小和/或長寬比不同;
所述預(yù)設(shè)的掃描規(guī)則為從左往右從上往下順序勻速掃描全圖,或者按照隨機(jī)移動規(guī)則掃描全圖,或者按照用戶制定的順序掃描全圖。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于:獲取各滑動窗子圖的檢測結(jié)果,根據(jù)前述檢測結(jié)果自適應(yīng)調(diào)整矩形滑動窗掃描時的移動速度和/或停留時間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于眸芯科技(上海)有限公司,未經(jīng)眸芯科技(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010828519.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 一種范圍廣、力度大的校內(nèi)監(jiān)控系統(tǒng)
- 一種監(jiān)控的方法及系統(tǒng)
- 設(shè)備的監(jiān)控方法、裝置、系統(tǒng)和空調(diào)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 設(shè)備監(jiān)控方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 風(fēng)險雷達(dá)預(yù)警的監(jiān)控方法及系統(tǒng)
- 區(qū)塊鏈網(wǎng)絡(luò)監(jiān)控系統(tǒng)、裝置及方法
- 基于機(jī)器視覺的車站客流安全智能監(jiān)控系統(tǒng)





