[發(fā)明專利]一種改進(jìn)型RoIAlign區(qū)域特征聚集算法在審
| 申請(qǐng)?zhí)枺?/td> | 201811270899.3 | 申請(qǐng)日: | 2018-10-29 |
| 公開(公告)號(hào): | CN109685064A | 公開(公告)日: | 2019-04-26 |
| 發(fā)明(設(shè)計(jì))人: | 梁燕華;武俊峰;謝子殿;李忠勤;姜艷秋;祁紅巖;周裕;崔懷鵬 | 申請(qǐng)(專利權(quán))人: | 黑龍江科技大學(xué) |
| 主分類號(hào): | G06K9/34 | 分類號(hào): | G06K9/34;G06K9/32 |
| 代理公司: | 北京國坤專利代理事務(wù)所(普通合伙) 11491 | 代理人: | 郭偉紅 |
| 地址: | 150022 黑龍江*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 計(jì)算效率 目標(biāo)圖像 區(qū)域特征 對(duì)齊 改進(jìn)型 浮點(diǎn)運(yùn)算 整數(shù)運(yùn)算 源圖像 算法 中心點(diǎn)坐標(biāo) 插值計(jì)算 乘除運(yùn)算 幾何中心 區(qū)域信息 移位運(yùn)算 硬件需求 映射過程 計(jì)算量 雙線性 特征圖 中心點(diǎn) 轉(zhuǎn)換 重合 池化 減小 像素 優(yōu)化 | ||
本發(fā)明公開了一種改進(jìn)型RoIAlign區(qū)域特征聚集算法,本方法包括如下步驟:首先將源圖像和目標(biāo)圖像幾何中心對(duì)齊,對(duì)齊方法采用改進(jìn)型中心點(diǎn)對(duì)齊;而后進(jìn)行雙線性插值計(jì)算,為提高計(jì)算效率和計(jì)算精度,將浮點(diǎn)運(yùn)算轉(zhuǎn)換成整數(shù)運(yùn)算;本發(fā)明優(yōu)化了RoIAlign區(qū)域特征聚集方法,將源圖像與目標(biāo)圖像的中心點(diǎn)坐標(biāo)進(jìn)行重合,使得映射過程充分并且均勻的利用了源圖的所有像素,避免了特征圖池化時(shí)造成的區(qū)域信息丟失,使得目標(biāo)圖像插值效果更好,通過將浮點(diǎn)運(yùn)算轉(zhuǎn)換成整數(shù)運(yùn)算,極大的減小了計(jì)算量,且由于移位運(yùn)算計(jì)算效率遠(yuǎn)高于普通乘除運(yùn)算,從而提高了計(jì)算效率,降低了硬件需求。
技術(shù)領(lǐng)域
本發(fā)明屬于基于區(qū)域特征聚集方式算法領(lǐng)域,尤其涉及一種改進(jìn)型RoIAlign區(qū)域特征聚集算法。
背景技術(shù)
ROI Align是在Mask-RCNN這篇論文里提出的一種區(qū)域特征聚集方式,很好地解決了ROI Pooling操作中兩次量化造成的區(qū)域不匹配(mis-alignment)的問題。實(shí)驗(yàn)顯示,在檢測(cè)測(cè)任務(wù)中將ROI Pooling替換為ROI Align可以提升檢測(cè)模型的準(zhǔn)確性。
但是現(xiàn)有技術(shù)中,當(dāng)對(duì)整個(gè)目標(biāo)圖像向源圖像映射時(shí),所利用的像素集中在圖像的左上方,右下部分的像素未被利用,而且隨著插值比例的增大,不均勻現(xiàn)象更加明顯,且由于采用浮點(diǎn)運(yùn)算,計(jì)算耗時(shí)長(zhǎng),對(duì)設(shè)備要求高,因此,亟需一種新型技術(shù)對(duì)RoIAlign區(qū)域特征聚集算法進(jìn)行優(yōu)化。
發(fā)明內(nèi)容
本發(fā)明的目的在于提出一種改進(jìn)型RoIAlign區(qū)域特征聚集算法,盡可能減少插值計(jì)算量,實(shí)現(xiàn)了海洋背景下圖像艦船目標(biāo)的快速分割。本發(fā)明的步驟如下:
S1采用中心點(diǎn)對(duì)齊方法將源圖像和目標(biāo)圖像幾何中心對(duì)齊,假設(shè)源圖像尺寸m×n目標(biāo)圖像大小為a×b則兩幅圖像的寬度與高度比例分別為m/a和n/b,則目標(biāo)圖像中某像素點(diǎn)(dstX,dstY)可以通過插值比例映射回源圖像中相應(yīng)像素位置(srcX,srcY),改進(jìn)源圖像與目標(biāo)圖像的對(duì)齊方式,將左上角對(duì)齊改進(jìn)為中心點(diǎn)對(duì)齊,此時(shí)計(jì)算公式為下式:
可將公式進(jìn)一步變形為:
公式的后半部分可視為整個(gè)插值運(yùn)算的控制因子,其取值可正可負(fù),此時(shí)源圖像與目標(biāo)圖像的坐標(biāo)中心為坐標(biāo)系原點(diǎn),將源圖像與目標(biāo)圖像的中心點(diǎn)坐標(biāo)達(dá)到重合,由于該控制因子的存在,使得映射過程充分并且均勻的利用了源圖的所有像素。
S2進(jìn)行雙線性插值計(jì)算,為提高計(jì)算效率和計(jì)算精度,將浮點(diǎn)運(yùn)算轉(zhuǎn)換成整數(shù)運(yùn)算,計(jì)算方法為首先對(duì)目標(biāo)圖像坐標(biāo)點(diǎn)取整,對(duì)小數(shù)部分按照倍率放大后取整,再對(duì)其進(jìn)行向右的移位運(yùn)算,達(dá)到除以放大倍率的目的,從而得到最終插值結(jié)果。
優(yōu)選的,在S2步驟中,對(duì)目標(biāo)圖像坐標(biāo)點(diǎn)取整,對(duì)小數(shù)部分按照倍率放大后取整的方法如下:
為求得目標(biāo)圖像某像素點(diǎn)(x,y)處的像素值f(x,y),假設(shè)該點(diǎn)坐標(biāo)為浮點(diǎn)數(shù)(26.15,25.66),首先對(duì)目標(biāo)圖像坐標(biāo)點(diǎn)取整,對(duì)小數(shù)部分按照倍率放大后取整,如下式:
其中,New_x與New_y為目標(biāo)點(diǎn)浮點(diǎn)坐標(biāo)值的整數(shù)部分,Δx與Δy是浮點(diǎn)數(shù)小數(shù)部分倍率放大后的結(jié)果取整值,inv_x與inv_y表示(1-x)和(1-y),以上數(shù)據(jù)均利用floor()函數(shù)進(jìn)行向下取整。將這些參數(shù)代入下式:
式中參數(shù)均為整數(shù),且已知源圖像在(0,0)、(0.1)、(1,0)以及(1,1)處的像素值f(0,0)、f(0,1),f(0,1)、f(1,0)以及f(1,1)均為整數(shù),得到整數(shù)Integer,再對(duì)其進(jìn)行向右的移位運(yùn)算,移動(dòng)22位,達(dá)到除以放大倍率4194304的目的,得到最終插值結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于黑龍江科技大學(xué),未經(jīng)黑龍江科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811270899.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 在效率手冊(cè)上裝拆自如的計(jì)算機(jī)、效率手冊(cè)及其銷售方法
- 計(jì)算蓄能器效率的方法以及這種效率的應(yīng)用
- 一種精確計(jì)算系統(tǒng)負(fù)載效率方法
- 電源效率計(jì)算系統(tǒng)及計(jì)算方法
- 銅盤管換熱效率計(jì)算方法
- 管理計(jì)算系統(tǒng)的能源效率的方法以及管理能源效率的系統(tǒng)
- 腦網(wǎng)絡(luò)效率計(jì)算方法
- 一種高存貯效率高計(jì)算效率的GPS數(shù)據(jù)結(jié)構(gòu)
- 空壓機(jī)系統(tǒng)運(yùn)行效率的計(jì)算方法
- 利用硬件計(jì)算效率優(yōu)化神經(jīng)網(wǎng)絡(luò)





