[發(fā)明專利]一種基于自動(dòng)切圖算法的圖像目標(biāo)檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202310637148.5 | 申請(qǐng)日: | 2023-06-01 |
| 公開(公告)號(hào): | CN116664822A | 公開(公告)日: | 2023-08-29 |
| 發(fā)明(設(shè)計(jì))人: | 陳星;梁麗霞 | 申請(qǐng)(專利權(quán))人: | 廣州閱數(shù)科技有限公司 |
| 主分類號(hào): | G06V10/25 | 分類號(hào): | G06V10/25;G06V10/26;G06V10/80;G06V10/82;G06N3/04 |
| 代理公司: | 北京大地智谷知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11957 | 代理人: | 劉洪雨 |
| 地址: | 510700 廣東省廣州市黃*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 自動(dòng) 算法 圖像 目標(biāo) 檢測(cè) 方法 | ||
1.一種基于自動(dòng)切圖算法的圖像目標(biāo)檢測(cè)方法,其特征在于,主要步驟如下:
S1)考慮目標(biāo)物體的尺寸和形狀,圖片切分器將要檢測(cè)的目標(biāo)照片進(jìn)行切分,將其分割成多個(gè)小圖像,并對(duì)切分后的小圖像進(jìn)行重疊;
配置圖片切分器的參數(shù),所述參數(shù)為切分高度、切分寬度、高度重疊率、寬度重疊率;切分流程步驟如下:
S11)計(jì)算圖片y軸重疊像素?cái)?shù):將高度重疊率與切分高度相乘,然后取整數(shù)值;
S12)計(jì)算圖片x軸重疊像素?cái)?shù):將寬度重疊率與切分寬度相乘,然后取整數(shù)值;
S13)初始化圖片y軸最大像素值為0;
S14)進(jìn)行行循環(huán):當(dāng)圖片y軸最大像素值小于圖片高度時(shí),執(zhí)行以下步驟:
A)將圖片x軸最大像素值和圖片x軸最小像素值都初始化為0;
B)計(jì)算圖片y軸最大像素值:將圖片y軸最小像素值與切分高度相加;
C)進(jìn)行列循環(huán):當(dāng)圖片x軸最大像素值小于圖片寬度時(shí),執(zhí)行以下步驟:
i)計(jì)算圖片x軸最大像素值:將圖片x軸最小像素值與切分寬度相加;
ii)如果圖片y軸最大像素值大于圖片高度或圖片x軸最大像素值大于圖片寬度,則:
a)計(jì)算切分圖片x軸最大值:取圖片寬度和圖片x軸最大像素值的最小值;
b)計(jì)算切分圖片y軸最大值:取圖片高度和圖片y軸最大像素值的最小值;
c)計(jì)算切分圖片x軸最小值:取0和切分圖片x軸最大值減去切分寬度的最大值;
d)計(jì)算切分圖片y軸最小值:取0和切分圖片y軸最大值減去切分高度的最大值;
e)將切分區(qū)域的坐標(biāo)(xmin,ymin,xmax,ymax)添加到切分列表中;
iii)如果圖片y軸最大像素值小于圖片高度或圖片x軸最大像素值小于圖片寬度,則:將切分區(qū)域的坐標(biāo)(xmin,ymin,xmax,ymax)添加到切分列表中;
iv)為下一次切分更新圖片x軸最小像素值:將圖片x軸最大像素值減去圖片x軸重疊像素;
v)為下一次切分更新圖片y軸最小像素值:將圖片y軸最大像素值減去圖片y軸重疊像素;
S2)多線程并發(fā)檢測(cè)裝置通過(guò)將圖片切分器生成的多個(gè)小圖像分配給不同的線程或計(jì)算單元進(jìn)行處理,實(shí)現(xiàn)并行計(jì)算;
S3)識(shí)別結(jié)果融合器,識(shí)別結(jié)果融合器將多線程并發(fā)檢測(cè)裝置得到的結(jié)果進(jìn)行匯總和整合,識(shí)別結(jié)果融合器采用加權(quán)融合算法得出識(shí)別結(jié)果,具體如下:
S31)識(shí)別結(jié)果融合器采用加權(quán)融合算法對(duì)圖片切分階段存在的重疊區(qū)域的檢測(cè)結(jié)果進(jìn)行處理以避免目標(biāo)物體的重復(fù)檢測(cè);
S32)識(shí)別結(jié)果融合器對(duì)多線程并發(fā)檢測(cè)裝置返回的檢測(cè)結(jié)果的置信度進(jìn)行權(quán)衡,確保整體的目標(biāo)檢測(cè)效果達(dá)到最優(yōu);
S33)最后,識(shí)別結(jié)果融合器將融合后的結(jié)果輸出,完成整個(gè)目標(biāo)檢測(cè)過(guò)程。
2.根據(jù)權(quán)利要求1所述的一種基于自動(dòng)切圖算法的圖像目標(biāo)檢測(cè)方法,其特征在于,多線程并發(fā)檢測(cè)裝置將YOLO模型轉(zhuǎn)譯為ONNX格式;轉(zhuǎn)譯后的ONNX模型使用JAVA?ONNXruntime加載,使用多線程并發(fā)模型,對(duì)多張分片圖片同時(shí)進(jìn)行檢測(cè);具體如下:
首先,創(chuàng)建一個(gè)固定大小的線程池,大小根據(jù)需要加載的模型數(shù)量和可用的處理器核心來(lái)設(shè)定;然后對(duì)于每一個(gè)模型,創(chuàng)建一個(gè)實(shí)現(xiàn)Callable接口的類,該類負(fù)責(zé)加載和初始化ONNX模型;然后,將這些任務(wù)提交給ExecutorService執(zhí)行,并等待所有任務(wù)完成;最后從Future對(duì)象中獲取加載好的模型,返回檢測(cè)結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州閱數(shù)科技有限公司,未經(jīng)廣州閱數(shù)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310637148.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





