[發(fā)明專利]一種基于YOLO-barQR算法的多碼快速識讀方法在審
| 申請?zhí)枺?/td> | 202010693776.1 | 申請日: | 2020-07-17 |
| 公開(公告)號: | CN111881702A | 公開(公告)日: | 2020-11-03 |
| 發(fā)明(設(shè)計)人: | 章漠松;梁步亮 | 申請(專利權(quán))人: | 深圳牛圖科技有限公司 |
| 主分類號: | G06K7/14 | 分類號: | G06K7/14;G06N3/04 |
| 代理公司: | 深圳市中科創(chuàng)為專利代理有限公司 44384 | 代理人: | 譚雪婷 |
| 地址: | 518000 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 yolo barqr 算法 快速 方法 | ||
本發(fā)明公開了一種基于YOLO?barQR算法的多碼快速識讀方法,包括如下步驟:步驟S1:獲取需要識別圖形的圖片;步驟S2:采用經(jīng)過數(shù)據(jù)集圖片訓(xùn)練后的YOLO?barQR網(wǎng)絡(luò)模型識別圖片中的所有碼;步驟S3:采用所述YOLO?barQR網(wǎng)絡(luò)模型定位出每個碼的坐標(biāo),并評估出每個碼的質(zhì)量權(quán)重;步驟S4:按照質(zhì)量權(quán)重排序,把每個碼的圖形按坐標(biāo)依次截取出圖片,并輸出給解碼模塊進行解碼。本發(fā)明可以一次性識別出圖片中所有碼,準(zhǔn)確定位各個碼,不依賴圖像的分辨率,無需研究每種碼制的特征,節(jié)省大量的研發(fā)投入。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機軟件領(lǐng)域,尤其涉及的是一種基于YOLO-barQR算法的多碼快速識讀方法。
背景技術(shù)
目前,市場上的掃碼應(yīng)用主要針對單個碼進行,例如掃碼設(shè)備拍攝一張包含手機支付碼的圖像,然后將圖像中的支付碼解碼,將解碼結(jié)果發(fā)往云端完成支付。隨著掃碼應(yīng)用的普及,一些行業(yè)需要在同一張圖像中處理多個碼,例如彩票行業(yè)中,一張彩票上需要多個不同的條碼做安全驗證;例如,某些特殊行業(yè)需求大量的信息通過二維碼來承載,傳統(tǒng)的單個碼已經(jīng)不能滿足,必須通過在同一張圖像中包含多個二維碼來擴展二維碼的信息承載。
傳統(tǒng)的解碼模塊一張圖片只能解一個碼,傳統(tǒng)的解碼算法,如果要解多個碼,需經(jīng)過改造,如中國專利公開號CN105787403B,該專利提出:需要外部條件保證捕捉的圖像至少包含一個條碼(比如用高拍儀并限定用戶必須把碼放在指定位置),定位圖片中的多個碼需要掃描整張圖片多次,需要破壞圖像中已掃描出來的碼,耗費時間,而且容易損壞未解出來的碼的圖像;并且,定位圖片中的碼需要根據(jù)某個碼制的某個特征信息來實現(xiàn),比如二維碼QR需要根據(jù)其3個“回”字形排列成L形來定位,這種模式出錯率高,比如多個QR碼成緊密矩陣型排列即有可能定位錯位導(dǎo)致后續(xù)解碼失敗,從而漏碼。
如此,定位圖片中的碼需要根據(jù)某個碼制的某個特征來實現(xiàn),不同的碼制需要專門研究不同的特征,其中有兩方面的問題:一方面一些二維碼的特征比較明顯,差異巨大,專門研究出特征后,還需編寫專門的軟件來實現(xiàn),研發(fā)工作量和周期都巨大;另一方面一些一維碼的特征不明顯,不同一維碼之間差異很微小,根本無法研究出有效的特征,從而導(dǎo)致誤定位或漏定位。需要在高像素圖像中分析某個碼制的某個特征信息,如果像素過低,可能會導(dǎo)致某些特征定位失敗。
因此,現(xiàn)有技術(shù)存在缺陷,需要改進。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是:提供一種可以一次性識別出圖片中所有碼,準(zhǔn)確定位各個碼,不依賴圖像的分辨率,無需研究每種碼制的特征,節(jié)省大量的研發(fā)投入的基于YOLO-barQR算法的多碼快速識讀方法。
本發(fā)明的技術(shù)方案如下:一種基于YOLO-barQR算法的多碼快速識讀方法,包括如下步驟:步驟S1:獲取需要識別圖形的圖片;步驟S2:采用經(jīng)過數(shù)據(jù)集圖片訓(xùn)練后的YOLO-barQR網(wǎng)絡(luò)模型識別圖片中的所有碼;步驟S3:采用所述YOLO-barQR網(wǎng)絡(luò)模型定位出每個碼的坐標(biāo),并評估出每個碼的質(zhì)量權(quán)重;步驟S4:,按照質(zhì)量權(quán)重排序,把每個碼的圖形按坐標(biāo)依次截取出圖片,并輸出給解碼模塊進行解碼。
應(yīng)用上述技術(shù)方案,所述的多碼快速識讀方法中,步驟S4中,是按照質(zhì)量權(quán)重由高到低,把每個碼的圖形按坐標(biāo)依次截取出圖片,并依次輸出給解碼模塊進行解碼。
應(yīng)用各個上述技術(shù)方案,所述的多碼快速識讀方法中,所述步驟S2之前,還訓(xùn)練所述YOLO-barQR網(wǎng)絡(luò)模型,其中,在訓(xùn)練時,把所述數(shù)據(jù)集的圖片進行包括曝光度、飽和度、模糊的數(shù)據(jù)增強,并且,還把訓(xùn)練識別得到的各碼圖形轉(zhuǎn)化為適合YOLO-barQR網(wǎng)絡(luò)模型的圖片。
應(yīng)用各個上述技術(shù)方案,所述的多碼快速識讀方法中,在訓(xùn)練所述YOLO-barQR網(wǎng)絡(luò)模型時,采用均方差作為損失函數(shù)。
應(yīng)用各個上述技術(shù)方案,所述的多碼快速識讀方法中,所述YOLO-barQR網(wǎng)絡(luò)模型的結(jié)構(gòu)為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳牛圖科技有限公司,未經(jīng)深圳牛圖科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010693776.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 基于FPGA的Tiny-yolo卷積神經(jīng)網(wǎng)絡(luò)硬件加速方法及系統(tǒng)
- 一種基于YOLO的Compress-YOLO模型壓縮方法
- 一種面向計算資源局限平臺部署的實時目標(biāo)檢測的方法
- 一種用于星上對艦船目標(biāo)檢測的Tiny-YOLO網(wǎng)絡(luò)的優(yōu)化方法
- 一種基于改進YOLO v3模型的行人檢測方法
- 一種基于改進YOLO v4算法的目標(biāo)檢測方法
- 一種YOLO脈沖神經(jīng)網(wǎng)絡(luò)的優(yōu)化方法
- 圖像識別方法、裝置、計算機可讀存儲介質(zhì)及處理器
- 一種船只檢測方法和裝置
- YOLO神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、行人檢測方法和相關(guān)設(shè)備





