[發(fā)明專利]精細(xì)化圖像識(shí)別在審
| 申請(qǐng)?zhí)枺?/td> | 201710592777.5 | 申請(qǐng)日: | 2017-07-19 |
| 公開(kāi)(公告)號(hào): | CN109284749A | 公開(kāi)(公告)日: | 2019-01-29 |
| 發(fā)明(設(shè)計(jì))人: | 傅建龍;梅濤 | 申請(qǐng)(專利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類號(hào): | G06K9/20 | 分類號(hào): | G06K9/20;G06K9/46 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 王茂華;羅利娜 |
| 地址: | 美國(guó)華*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 關(guān)注區(qū)域 局部特征 子網(wǎng)絡(luò) 全局特征 圖像識(shí)別 精細(xì)化 圖像 尺度 精細(xì) 對(duì)象識(shí)別 提取圖像 圖像區(qū)域 準(zhǔn)確定位 網(wǎng)絡(luò) 辨識(shí) 學(xué)習(xí) | ||
根據(jù)本公開(kāi)的實(shí)現(xiàn),提出了一種精細(xì)化圖像識(shí)別的方案。在該方案中,利用第一學(xué)習(xí)網(wǎng)絡(luò)的第一子網(wǎng)絡(luò)提取圖像的全局特征;利用第一學(xué)習(xí)網(wǎng)絡(luò)的第二子網(wǎng)絡(luò)、基于全局特征確定圖像的第一關(guān)注區(qū)域,第一關(guān)注區(qū)域包括圖像中對(duì)象的可辨識(shí)部分;利用第二學(xué)習(xí)網(wǎng)絡(luò)的第一子網(wǎng)絡(luò)提取第一關(guān)注區(qū)域的第一局部特征;以及至少部分基于第一局部特征確定圖像中的對(duì)象的類別。通過(guò)該方案,實(shí)現(xiàn)了對(duì)于更精細(xì)尺度的圖像區(qū)域的準(zhǔn)確定位,從而可以獲得基于精細(xì)尺度上的局部特征用于對(duì)象識(shí)別。
背景技術(shù)
由計(jì)算機(jī)技術(shù)來(lái)識(shí)別圖像的細(xì)化類別一直受到廣泛關(guān)注。精細(xì)化圖像識(shí)別的示例包括但不限于劃分各種生物的具體類別、各種商品的品牌和型號(hào)、醫(yī)學(xué)上的細(xì)胞類型等等。某些細(xì)化類別中的對(duì)象可能僅能夠由領(lǐng)域?qū)<曳直娉鏊麄冎g的細(xì)微差距。例如,有些鳥(niǎo)類的整體特征相似,區(qū)別僅在于某個(gè)部位的顏色、紋路、型態(tài)等等。與一般類別的識(shí)別(例如僅區(qū)分鳥(niǎo)、花、汽車等整體差異較大的對(duì)象類別)相比,精細(xì)化圖像識(shí)別需要定位出不同細(xì)化類別的對(duì)象中具有細(xì)微視覺(jué)差異的區(qū)域并且準(zhǔn)確表征該區(qū)域的特征。精細(xì)化圖像識(shí)別可以被應(yīng)用在多種多樣的場(chǎng)景中,例如專家級(jí)圖像識(shí)別、豐富圖像采集、醫(yī)學(xué)診斷等等。
發(fā)明內(nèi)容
根據(jù)本公開(kāi)的實(shí)現(xiàn),提出了一種用于精細(xì)化圖像識(shí)別的方案。在該方案中,利用第一學(xué)習(xí)網(wǎng)絡(luò)的第一子網(wǎng)絡(luò)提取圖像的全局特征;利用第一學(xué)習(xí)網(wǎng)絡(luò)的第二子網(wǎng)絡(luò)、基于全局特征確定圖像的第一關(guān)注區(qū)域,第一關(guān)注區(qū)域包括圖像中對(duì)象的可辨識(shí)部分;利用第二學(xué)習(xí)網(wǎng)絡(luò)的第一子網(wǎng)絡(luò)提取第一關(guān)注區(qū)域的第一局部特征;以及至少部分基于第一局部特征確定圖像中的對(duì)象的類別。通過(guò)該方案,實(shí)現(xiàn)了對(duì)于更精細(xì)尺度的圖像區(qū)域的準(zhǔn)確定位,從而可以獲得基于精細(xì)尺度上的局部特征用于對(duì)象識(shí)別。
提供發(fā)明內(nèi)容部分是為了簡(jiǎn)化的形式來(lái)介紹對(duì)概念的選擇,其在下文的具體實(shí)施方式中將被進(jìn)一步描述。發(fā)明內(nèi)容部分無(wú)意標(biāo)識(shí)要求保護(hù)的主題的關(guān)鍵特征或主要特征,也無(wú)意限制要求保護(hù)的主題的范圍。
附圖說(shuō)明
圖1示出了能夠?qū)嵤┍竟_(kāi)的多個(gè)實(shí)現(xiàn)的計(jì)算設(shè)備的框圖;
圖2示出了根據(jù)本公開(kāi)的一些實(shí)現(xiàn)的用于圖像識(shí)別的系統(tǒng)的框圖;
圖3示出了根據(jù)本公開(kāi)的另一些實(shí)現(xiàn)的用于圖像識(shí)別的系統(tǒng)的框圖;
圖4示出了根據(jù)本公開(kāi)的一個(gè)實(shí)現(xiàn)的用于圖像識(shí)別的過(guò)程的示意圖;以及
圖5示出了根據(jù)本公開(kāi)一些實(shí)現(xiàn)的用于圖像識(shí)別的學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練過(guò)程的流程圖。
這些附圖中,相同或相似參考符號(hào)用于表示相同或相似元素。
具體實(shí)施方式
現(xiàn)在將參照若干示例實(shí)現(xiàn)來(lái)論述本公開(kāi)。應(yīng)當(dāng)理解,論述了這些實(shí)現(xiàn)僅是為了使得本領(lǐng)域普通技術(shù)人員能夠更好地理解且因此實(shí)現(xiàn)本公開(kāi),而不是暗示對(duì)本主題的范圍的任何限制。
如本文所使用的,術(shù)語(yǔ)“包括”及其變體要被解讀為意味著“包括但不限于”的開(kāi)放式術(shù)語(yǔ)。術(shù)語(yǔ)“基于”要被解讀為“至少部分地基于”。術(shù)語(yǔ)“一個(gè)實(shí)現(xiàn)”和“一種實(shí)現(xiàn)”要被解讀為“至少一個(gè)實(shí)現(xiàn)”。術(shù)語(yǔ)“另一個(gè)實(shí)現(xiàn)”要被解讀為“至少一個(gè)其他實(shí)現(xiàn)”。術(shù)語(yǔ)“第一”、“第二”等等可以指代不同的或相同的對(duì)象。下文還可能包括其他明確的和隱含的定義。
圖1示出了能夠?qū)嵤┍竟_(kāi)的多個(gè)實(shí)現(xiàn)的計(jì)算設(shè)備100的框圖。應(yīng)當(dāng)理解,圖1所示出的計(jì)算設(shè)備100僅僅是示例性的,而不應(yīng)當(dāng)構(gòu)成對(duì)本公開(kāi)所描述的實(shí)現(xiàn)的功能和范圍的任何限制。如圖1所示,計(jì)算設(shè)備100包括通用計(jì)算設(shè)備形式的計(jì)算設(shè)備100。計(jì)算設(shè)備100的組件可以包括但不限于一個(gè)或多個(gè)處理器或處理單元110、存儲(chǔ)器120、存儲(chǔ)設(shè)備130、一個(gè)或多個(gè)通信單元140、一個(gè)或多個(gè)輸入設(shè)備150以及一個(gè)或多個(gè)輸出設(shè)備160。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710592777.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 促進(jìn)圖像處理的基于運(yùn)動(dòng)數(shù)據(jù)的關(guān)注強(qiáng)度度量
- 關(guān)注區(qū)域提取裝置以及關(guān)注區(qū)域提取方法
- 關(guān)注區(qū)域圖像生成裝置
- 獨(dú)立地處理多個(gè)所關(guān)注的區(qū)域
- 關(guān)注區(qū)域跟蹤裝置
- 醫(yī)療圖像處理裝置、內(nèi)窺鏡系統(tǒng)、診斷支持裝置及醫(yī)療服務(wù)支持裝置
- 醫(yī)療圖像處理裝置、醫(yī)療圖像處理方法及內(nèi)窺鏡系統(tǒng)
- 醫(yī)療圖像處理系統(tǒng)
- 醫(yī)療圖像處理系統(tǒng)
- 醫(yī)療圖像處理裝置、醫(yī)療圖像處理方法及程序、診斷輔助裝置
- 一種微電網(wǎng)電磁暫態(tài)實(shí)時(shí)仿真的方法及系統(tǒng)
- 網(wǎng)絡(luò)切片子網(wǎng)的選擇方法及裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)切片的管理方法及系統(tǒng)和存儲(chǔ)介質(zhì)
- 用于雙向網(wǎng)絡(luò)地理信息傳送的系統(tǒng)、方法及設(shè)備
- 多跳異構(gòu)無(wú)線網(wǎng)絡(luò)中多任務(wù)路由的方法、網(wǎng)絡(luò)及節(jié)點(diǎn)
- 基于高精度神經(jīng)網(wǎng)絡(luò)的圖像處理方法、裝置及電子設(shè)備
- 一種前向耗時(shí)的確定方法、裝置及設(shè)備
- 超網(wǎng)絡(luò)參數(shù)更新方法、裝置和電子設(shè)備
- 一種基于網(wǎng)絡(luò)分解的大規(guī)模橋梁網(wǎng)絡(luò)連通概率評(píng)估方法
- 電信網(wǎng)絡(luò)





