[發(fā)明專利]圖像處理方法、圖像處理裝置在審
| 申請?zhí)枺?/td> | 201680008800.5 | 申請日: | 2016-02-19 |
| 公開(公告)號: | CN107251091A | 公開(公告)日: | 2017-10-13 |
| 發(fā)明(設(shè)計(jì))人: | 克林格特·馬丁;松原大輔 | 申請(專利權(quán))人: | 株式會(huì)社日立制作所 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06N3/02 |
| 代理公司: | 北京尚誠知識產(chǎn)權(quán)代理有限公司11322 | 代理人: | 龍淳 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 處理 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種使用神經(jīng)網(wǎng)絡(luò)處理圖像的技術(shù)。
背景技術(shù)
對象檢測在許多圖像處理任務(wù)中起著重要的作用。對象檢測的動(dòng)機(jī)是在圖像中找到某個(gè)對象或其一部分。在對象被定位之后,可進(jìn)行例如對象辨識的其它任務(wù)。
對象檢測的一個(gè)實(shí)施例是人臉識別。人臉識別通常需要將臉部在某個(gè)方向上對準(zhǔn),以實(shí)現(xiàn)高識別性能。為了對準(zhǔn)該臉部區(qū)域,可使用臉部的特征,例如眼睛、鼻子、嘴巴等。通過對象檢測,可識別這些臉部特征。能夠使用識別的臉部特征來對準(zhǔn)臉部的方向。
在對象檢測中,使用所謂的滑動(dòng)窗口。該方法從圖像中提取任意區(qū)域,并計(jì)算提取區(qū)域包括特定對象的概率。如果概率超過給定閾值,則在提取的區(qū)域中檢測對象。通過這種滑動(dòng)窗口方法,可實(shí)現(xiàn)高精度。然而,如果關(guān)于可能的對象位置的先驗(yàn)信息不可用,則該方法具有高計(jì)算成本的缺點(diǎn)。這是因?yàn)榇翱诒仨毞胖迷谠S多不同的位置并縮放,直到達(dá)到預(yù)定義的概率閾值。
此外,這種滑動(dòng)窗口方法通常使用模板匹配來計(jì)算特定對象在區(qū)域中的概率。這些模板通常是預(yù)定義的,并且如果對象外觀隨時(shí)間而變化,則不能很好地適用。因此,需要更新模板以實(shí)現(xiàn)高檢測準(zhǔn)確度。
機(jī)器學(xué)習(xí)是適應(yīng)對象變化的一種方法。機(jī)器學(xué)習(xí)方法通過學(xué)習(xí)辨識對象的外部特征元素來提取對象的外部特征,從而識別這些特征。通常,機(jī)器學(xué)習(xí)預(yù)先學(xué)習(xí)已知的圖像數(shù)據(jù)對以及從圖像數(shù)據(jù)中獲取的已知檢測結(jié)果。學(xué)習(xí)器使用學(xué)習(xí)結(jié)果對新的圖像數(shù)據(jù)進(jìn)行對象檢測。也能夠根據(jù)檢測結(jié)果的準(zhǔn)確性來調(diào)整學(xué)習(xí)參數(shù)。
神經(jīng)網(wǎng)絡(luò)通常稱為實(shí)施機(jī)器學(xué)習(xí)的學(xué)習(xí)器。神經(jīng)網(wǎng)絡(luò)包括受人腦中的神經(jīng)元啟發(fā)的人造神經(jīng)元。給定的權(quán)重因子與每個(gè)神經(jīng)元的輸入相乘,然后添加偏差,從而獲取神經(jīng)元的輸出。
下面列出的專利文獻(xiàn)1描述了使用卷積神經(jīng)網(wǎng)絡(luò)來在低分辨率圖像中辨識人的方法。在專利文獻(xiàn)1中,使用要辨識的人的圖像來重復(fù)學(xué)習(xí)過程。
引用列表
專利文獻(xiàn)
專利文獻(xiàn)1:美國專利公開2011/0222724。
發(fā)明內(nèi)容
技術(shù)問題
當(dāng)使用神經(jīng)網(wǎng)絡(luò)進(jìn)行對象檢測時(shí),在學(xué)習(xí)過程中調(diào)整加權(quán)因子和偏差以獲取所需的檢測結(jié)果。使用神經(jīng)網(wǎng)絡(luò)進(jìn)行對象檢測時(shí)的技術(shù)問題之一在于,在獲取所需結(jié)果之前需要較長學(xué)習(xí)時(shí)間。
鑒于上述問題提供了本發(fā)明。本發(fā)明的目的在于提高使用神經(jīng)網(wǎng)絡(luò)檢測對象的過程的效率。
解決問題的方案
本發(fā)明:將對象檢測所需的任務(wù)轉(zhuǎn)換為解決分類問題所需的任務(wù);使用對輸入數(shù)據(jù)進(jìn)行分類的神經(jīng)網(wǎng)絡(luò)將對象檢測處理為分類問題。
本發(fā)明的有益效果
通過本發(fā)明,能夠通過使用對輸入數(shù)據(jù)進(jìn)行分類的神經(jīng)網(wǎng)絡(luò)將對象檢測中所需的任務(wù)有效地處理為分類問題。從以下實(shí)施例的描述中,除上述之外的技術(shù)問題、配置和效果將顯而易見。
附圖說明
圖1是根據(jù)實(shí)施例1的圖像處理裝置100的功能框圖。
圖2是示出區(qū)域定義器110的處理、坐標(biāo)分離器120的處理和量化器130的處理的示圖。
圖3是示出學(xué)習(xí)器150的層配置的示例的示圖。
圖4是說明從分類器160輸出的輸出向量的示圖。
圖5是示出再生器170的處理的示圖。
圖6是根據(jù)實(shí)施例2的圖像處理裝置100的功能框圖。
圖7是示出移位器180的處理的示圖。
圖8是示出圖像數(shù)據(jù)200是從汽車側(cè)面捕獲的行駛汽車的圖像時(shí)的區(qū)域定義器110的處理和量化器130的處理的示圖。
圖9是示出圖像數(shù)據(jù)200是從汽車正面捕獲的汽車的圖像時(shí)的區(qū)域定義器110的處理的示圖。
圖10是示出根據(jù)實(shí)施例4的圖像處理裝置100的硬件配置的示圖。
具體實(shí)施方式
<本發(fā)明的基本概念>
在下文中,為了更好地理解本發(fā)明,將首先描述本發(fā)明的基本概念。然后將描述本發(fā)明的實(shí)施例。
專利文獻(xiàn)1中描述的卷積神經(jīng)網(wǎng)絡(luò)是使用神經(jīng)網(wǎng)絡(luò)檢測對象的一種方法。在專利文獻(xiàn)1的方法中,例如:對于對圖像數(shù)據(jù)應(yīng)用形狀檢測濾波器(卷積),從而檢測對象的形狀;例如最大值池化(Max Pooling)的一些方法應(yīng)用于來自濾波器的輸出,從而稀釋濾波器中的對象的位置誤差。通過連接實(shí)施上述處理的多個(gè)層來形成神經(jīng)網(wǎng)絡(luò)。
神經(jīng)網(wǎng)絡(luò)的其它應(yīng)用在于解決分類問題。在這種情況下,神經(jīng)網(wǎng)絡(luò)預(yù)先學(xué)習(xí)輸入數(shù)據(jù)與輸入數(shù)據(jù)所屬的分類之間的關(guān)系。當(dāng)新輸入數(shù)據(jù)進(jìn)入神經(jīng)網(wǎng)絡(luò)中時(shí),神經(jīng)網(wǎng)絡(luò)根據(jù)先前學(xué)習(xí)的結(jié)果輸出顯示新輸入數(shù)據(jù)所屬分類的值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會(huì)社日立制作所,未經(jīng)株式會(huì)社日立制作所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680008800.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





