[發(fā)明專利]用于產(chǎn)生方向梯度直方圖的方法在審
| 申請(qǐng)?zhí)枺?/td> | 201780044704.0 | 申請(qǐng)日: | 2017-05-19 |
| 公開(公告)號(hào): | CN109478242A | 公開(公告)日: | 2019-03-15 |
| 發(fā)明(設(shè)計(jì))人: | M·C·蒙特亞努;V·吉奧爾吉斯卡;C·扎哈里亞;I·蘇丘 | 申請(qǐng)(專利權(quán))人: | 快圖有限公司 |
| 主分類號(hào): | G06K9/46 | 分類號(hào): | G06K9/46 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 王茂華 |
| 地址: | 愛(ài)爾蘭*** | 國(guó)省代碼: | 愛(ài)爾蘭;IE |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 扇區(qū) 圖像 方向梯度直方圖 圖像像素 關(guān)聯(lián) 像素值差異 垂直梯度 扇區(qū)索引 水平梯度 梯度分配 相鄰扇區(qū) 像素梯度 方位角 累加 像素 延伸 | ||
本發(fā)明提供了一種用于為圖像的至少一部分產(chǎn)生方向梯度直方圖(HOG)的方法,包括:將所述圖像部分分成單元,每個(gè)單元包括多個(gè)圖像像素;然后針對(duì)單元的每個(gè)圖像像素,基于沿著分別包括所述像素的所述圖像的至少一行和所述圖像的列的像素值差異,獲得水平梯度分量gx和垂直梯度分量gy;并且將梯度分配給多個(gè)扇區(qū)中的一者,其中n是扇區(qū)索引,每個(gè)扇區(qū)延伸通過(guò)一系列方位角,并且所述扇區(qū)的至少一些根據(jù)以下不等式從相鄰扇區(qū)劃分:b*16<a*(n+1),其中0≤n≤5,b=gy并且a=gx;以及b*16<a*(13?n),其中7≤n≤12,a=gx+gy并且b=gx?gy;至少一個(gè)扇區(qū)與區(qū)間相關(guān)聯(lián);并且累加與區(qū)間相關(guān)聯(lián)的單元的像素梯度中的每個(gè)實(shí)例以為所述單元提供HOG。
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于產(chǎn)生方向梯度直方圖的方法。
背景技術(shù)
Navneet Dalal和Bill Triggs,“Histograms of Oriented Gradients forHuman Detection”,IEEE Computer Society Conference on Computer Vision andPattern Recognition,第1卷,第886-893頁(yè),2005年6月25-26日;以及Navneet Dalal于2006年7月17日在L'institut National Polytechnique De Grenoble上發(fā)表的博士論文“Finding People in Images and Videos”PhD Thesis,其公開了用于圖像處理(包括用于對(duì)象檢測(cè)和/或分類)的方向梯度直方圖(HOG)描述符。
圖1示出了用于計(jì)算圖像的局部部分的HOG的簡(jiǎn)單示例,在此稱為單元。
在圖1的示例中,采用2×2像素單元。每個(gè)像素值與3×1內(nèi)核結(jié)合以確定單元像素的梯度的相應(yīng)水平分量;并且使用1×3內(nèi)核確定單元像素的梯度的垂直分量。(因此應(yīng)當(dāng)理解,需要來(lái)自2×2單元周圍的一個(gè)像素的邊界的像素值,以便計(jì)算單元的每個(gè)像素的梯度。)在圖1的示例中,邊界拐角的像素值4、0、7和4僅作為信息示出,因?yàn)檫@些對(duì)于圖1的示例性內(nèi)核不是必需的。然而,應(yīng)當(dāng)理解,可以采用其他內(nèi)核,這些內(nèi)核可能需要這些像素或其他像素。
水平和垂直梯度分量被組合以提供單元的每個(gè)像素的矢量梯度。使用梯度,可以計(jì)算單元的每個(gè)像素梯度的幅度和方向。在圖1的示例中,梯度被映射到8個(gè)區(qū)間中的一個(gè),然后可以通過(guò)對(duì)梯度方向的出現(xiàn)計(jì)數(shù)來(lái)確定HOG。在該示例中,3個(gè)矢量在區(qū)間2中,1個(gè)在區(qū)間3中,指示圖像的該部分的梯度大致在區(qū)間2的方向上。(未顯示與樣本輸入圖像中顯示的值對(duì)齊。)然后可以使用每個(gè)像素梯度的幅度值來(lái)確定該方向上的梯度的范圍。
正是HOG和幅度值的這種組合在本文中稱為單元的HOG描述符。
在圖1中,使用的像素值包括亮度值,例如,YCC格式圖像的Y分量。在其他具體實(shí)施中,還可以基于該圖像格式或其他圖像格式計(jì)算顏色梯度。
從圖1的示例可以看出,基于HOG描述符的簡(jiǎn)單應(yīng)用將需要使用:
·乘法器,用于計(jì)算梯度的幅度;并且
·反正切函數(shù),用于計(jì)算梯度方向。
顯然,對(duì)這些計(jì)算中的每一者的優(yōu)化將允許用于提供HOG描述符的更合理的實(shí)施,并且特別地,這將允許在具有有限處理能力的設(shè)備諸如手持式相機(jī)或智能電話中提供HOG描述符的有效硬件實(shí)施。
Ryoji Kadota等人,“Hardware Architecture for HOG Feature Extraction”,Proceedings of 5th International Conference on Intelligent Information Hidingand Multimedia Signal Processing,2009,第1330-1333頁(yè)公開了幾種簡(jiǎn)化HOG描述符計(jì)算的方法,諸如將除法、平方根和反正切轉(zhuǎn)換為更簡(jiǎn)單的操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于快圖有限公司,未經(jīng)快圖有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780044704.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 信息記錄媒質(zhì)、真實(shí)性核對(duì)方法和程序、及扇區(qū)讀取方法和程序
- 無(wú)線通信系統(tǒng)中的干擾控制
- 光盤
- 無(wú)線通信系統(tǒng)中的負(fù)載均衡
- 在中繼輔助蜂窩網(wǎng)絡(luò)中進(jìn)行小區(qū)間干擾協(xié)調(diào)的設(shè)備和方法
- 無(wú)線通信系統(tǒng)中的干擾控制
- 提高存儲(chǔ)器可靠性的方法以及閃存操作方法
- 扇區(qū)配置方法、業(yè)務(wù)切換方法、裝置及基站
- 非易失性存儲(chǔ)器中的存儲(chǔ)器扇區(qū)注銷的方法和系統(tǒng)
- 一種基于實(shí)時(shí)空情的單雷達(dá)責(zé)任扇區(qū)確定方法和系統(tǒng)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





