[發(fā)明專利]一種基于yoloV3的calhe直方圖增強型目標識別算法在審
| 申請?zhí)枺?/td> | 202010821792.4 | 申請日: | 2020-08-15 |
| 公開(公告)號: | CN111950475A | 公開(公告)日: | 2020-11-17 |
| 發(fā)明(設(shè)計)人: | 蔡向東;屈新輝 | 申請(專利權(quán))人: | 哈爾濱理工大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 鄭州豫鼎知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 41178 | 代理人: | 魏新培 |
| 地址: | 150000 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 yolov3 calhe 直方圖 增強 目標 識別 算法 | ||
本發(fā)明是一種基于yolov3的calhe直方圖增強型目標識別算法,有效解決了現(xiàn)有檢測設(shè)備不能準確識別的技術(shù)問題,包括步驟一,輸入一張從某一攝像頭采集的包裹圖像,通過灰度變換將包裹檢測圖像變換為灰度圖像,然后提取灰度圖像的長和寬;步驟二,將上述步驟一種的灰度圖像利用傅里葉變換到頻率空間;步驟三,通過函數(shù)cumsum來計算cdf,并將頻率映射到0?255的無符號整數(shù);步驟四,采用calhe直方圖均衡;步驟五,對步驟四中的處理后的直方圖圖像進行傅里葉反變換,轉(zhuǎn)換到空間域;步驟六,選擇多個步驟五得到的圖像和同一幅的原始圖像進行yolo V3目標識別算法檢測,然后進行比較,本發(fā)明能夠有效減少識別時的運行時間,提高了目標識別的準確率。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,具體是一種基于yoloV3的calhe直方圖增強型目標識別算法,能夠?qū)崿F(xiàn)圖像去噪、圖像增強以及神經(jīng)網(wǎng)路算法,可應(yīng)用于目標檢測。
背景技術(shù)
隨著互聯(lián)網(wǎng)科技的快速發(fā)展,人們對網(wǎng)上購物的偏愛越來越熱烈。于是激增了一大批的產(chǎn)業(yè)鏈,其中就包括物流系統(tǒng)。傳統(tǒng)的物流系統(tǒng)靠人力去分揀包裹費時又費力,于是就出現(xiàn)了自動化分揀包裹的流水線作業(yè)。那么包裹的大小以及包裹的重量成為分揀的首要考慮因素。發(fā)明一款可以實現(xiàn)根據(jù)包裹體積大小去完成自動分揀的設(shè)備越來越受到人們的重視,而其最重要的環(huán)節(jié)就是檢測部分的設(shè)計。
傳統(tǒng)的單目攝像頭僅僅只能夠檢測出包裹的上面的物流信息,把包裹分別送達到各個目的地,但是由于對包裹的大小就沒有那么多的考慮,在工人去裝載和卸貨的時候就顯得包裹的位置擺放的雜亂無章,就會出現(xiàn)包裹損壞的現(xiàn)象。
這樣不僅對我們消費者是一種危害,對商家和物流同樣也是一種危害。其二是物流公司在運輸包裹的時候可以根據(jù)包裹的體積大小進行合理的規(guī)劃,提高物流效率,降低物流成本。
比如京東物流在物流配送中除了運用本地倉庫直接取貨,還有就是運用了包裹體積大小檢測設(shè)備,通過檢測設(shè)備的體積大小,可以提高工人在裝運過程中的效率,大大簡化了裝運的復(fù)雜性。
市面上已經(jīng)出現(xiàn)了一部分用于包裹體積檢測的設(shè)備,常見的有基于激光雷達的包裹體積檢測系統(tǒng)。通過激光測距,然后通過仿真生成三維圖像,測量出物體的體積。這類產(chǎn)品的安裝成本比較高,安裝比較復(fù)雜,體積比較大。
本發(fā)明采用的是基于雙目視覺測距原理測量物體的深度信息。成本比較低,安裝簡單,體積比較小。
另外為了提高測試的識別準確性,采用深度學(xué)習(xí)的方式去識別包裹。通常情況下,攝像頭抓取的照片包含了其他的很多信息,比如旁邊的機臺,有時工人們誤操作放在傳送裝置上面的垃圾?;蛘咄砩瞎ぷ鞯臅r候,光照不是很充足的時候,采集的照片清晰度不夠。另外考慮到人為因素對采集裝置的影響,比如在雙十一物流量比較大的時候,包裹不是一個一個單獨放在流水裝置上面,而是被隨機扔放到流水裝置上面的,這樣就會造成對測量包裹的整體輪廓的影響。這些因素都將對包裹的識別有重大的影響,傳統(tǒng)的只靠圖像處理方面的工作遠遠不能滿足當前的要求,那么就需要提出一種有效的分類識別算法去解決。
如果通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),那么這些問題都將得到明顯的解決。但是傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的算法需要很強的運算能力,在嵌入式設(shè)備上面沒有辦法移植到單獨的嵌入式設(shè)備上面去進行運算,只能在性能比較高的電腦上面去運行,本發(fā)明提出了一種輕量級的神經(jīng)網(wǎng)絡(luò)算法,這樣就可以在嵌入式設(shè)備上面去運行一個神經(jīng)網(wǎng)絡(luò)算法的程序,然后就可以對采集到的包裹進行識別。
在此基礎(chǔ)上,本發(fā)明提供一種基于yoloV3的calhe直方圖增強型目標識別算法來解決此問題。
發(fā)明內(nèi)容
為了解決上述的以及其他潛在的技術(shù)問題,一種基于yoloV3的calhe直方圖增強型目標識別算法,有效解決了現(xiàn)有檢測設(shè)備成本高、體積大、安裝復(fù)雜、不能準確識別的技術(shù)問題。
一種基于yoloV3的calhe直方圖增強型目標識別算法,其特征在于,包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱理工大學(xué),未經(jīng)哈爾濱理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010821792.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





