[發(fā)明專利]一種基于視覺(jué)語(yǔ)義關(guān)系圖的圖像區(qū)域標(biāo)注方法有效
| 申請(qǐng)?zhí)枺?/td> | 201711387422.9 | 申請(qǐng)日: | 2017-12-20 |
| 公開(kāi)(公告)號(hào): | CN107967494B | 公開(kāi)(公告)日: | 2020-12-11 |
| 發(fā)明(設(shè)計(jì))人: | 張靜;陶提;穆亞昆;王喆;趙賢文;陳美 | 申請(qǐng)(專利權(quán))人: | 華東理工大學(xué) |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62;G06K9/46 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 200237 上海市*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 視覺(jué) 語(yǔ)義 關(guān)系 圖像 區(qū)域 標(biāo)注 方法 | ||
本發(fā)明公開(kāi)了一種基于視覺(jué)和語(yǔ)義的圖像標(biāo)注算法,可實(shí)現(xiàn)對(duì)圖像區(qū)域的自動(dòng)標(biāo)注。提出的基于視覺(jué)語(yǔ)義關(guān)系圖的圖像區(qū)域標(biāo)注算法包括兩個(gè)部分:視覺(jué)語(yǔ)義關(guān)系圖的構(gòu)建和基于視覺(jué)語(yǔ)義關(guān)系圖的圖像標(biāo)注。視覺(jué)語(yǔ)義關(guān)系圖的構(gòu)建考慮了圖像間的全局相似性、區(qū)域相似性、圖像區(qū)域標(biāo)簽的語(yǔ)義關(guān)聯(lián)以及各層次間的關(guān)聯(lián)。然后在構(gòu)建好的視覺(jué)語(yǔ)義關(guān)系圖上進(jìn)行半監(jiān)督學(xué)習(xí),得到未標(biāo)注圖像區(qū)域與圖像區(qū)域標(biāo)簽之間的關(guān)聯(lián)度,對(duì)未標(biāo)注圖像區(qū)域進(jìn)行標(biāo)簽預(yù)測(cè)。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像語(yǔ)義理解領(lǐng)域,具體涉及一種基于視覺(jué)語(yǔ)義關(guān)系圖的圖像區(qū)域標(biāo)注方法。
背景技術(shù)
當(dāng)今社會(huì)圖像數(shù)據(jù)量巨大,圖像自動(dòng)標(biāo)注技術(shù)成為人們對(duì)圖像數(shù)據(jù)檢索和管理的重要途徑,但是由于“語(yǔ)義鴻溝”的存在,嚴(yán)重影響了傳統(tǒng)圖像區(qū)域標(biāo)注算法的準(zhǔn)確性,本發(fā)明提出了一種基于視覺(jué)語(yǔ)義關(guān)系圖的圖像區(qū)域標(biāo)注方法。
圖像全局間具有圖像視覺(jué)特征相似性,圖像區(qū)域間也具有圖像視覺(jué)特征相似性,圖像標(biāo)簽之間則具有語(yǔ)義關(guān)聯(lián)性,這些信息有助于圖像區(qū)域標(biāo)注與理解,因而本發(fā)明提出了一種能夠有效描述上述關(guān)系的視覺(jué)語(yǔ)義關(guān)系圖,并以此圖為基礎(chǔ)實(shí)現(xiàn)跨層次的隨機(jī)游走算法對(duì)圖像區(qū)域進(jìn)行自動(dòng)語(yǔ)義標(biāo)注。
發(fā)明內(nèi)容
本發(fā)明的目的在于提出一種基于視覺(jué)語(yǔ)義關(guān)系圖的圖像區(qū)域標(biāo)注方法,通過(guò)分析圖像間的全局相似性、區(qū)域相似性、圖像區(qū)域標(biāo)簽的語(yǔ)義關(guān)聯(lián),以及各層次之間的關(guān)聯(lián)構(gòu)造視覺(jué)語(yǔ)義關(guān)系圖,提出跨層次的隨機(jī)游走算法對(duì)圖像區(qū)域進(jìn)行自動(dòng)標(biāo)注。
本發(fā)明的技術(shù)方案如下:
(1)圖像全局相似性子圖與圖像區(qū)域相似性子圖的構(gòu)建:提取圖像的全局視覺(jué)特征,并計(jì)算圖像間的特征相似性;提取圖像區(qū)域的視覺(jué)特征,并計(jì)算區(qū)域間的特征相似性。
(2)圖像區(qū)域標(biāo)簽語(yǔ)義相關(guān)性子圖的構(gòu)建:語(yǔ)義相關(guān)性由不同標(biāo)簽之間的語(yǔ)義共現(xiàn)度表示,語(yǔ)義共現(xiàn)度是根據(jù)語(yǔ)義標(biāo)簽在圖像訓(xùn)練集中的共現(xiàn)概率進(jìn)行計(jì)算的。
(3)各子圖間關(guān)聯(lián)的構(gòu)建:圖像全局相似性子圖與圖像區(qū)域相似性子圖的關(guān)聯(lián)由圖像與圖像分割成區(qū)域的所屬關(guān)系確定;圖像全局相似性子圖與圖像區(qū)域標(biāo)簽語(yǔ)義相關(guān)性子圖的關(guān)聯(lián)由已標(biāo)注圖像的全局標(biāo)簽信息確定;圖像區(qū)域相似性子圖與圖像區(qū)域標(biāo)簽語(yǔ)義相關(guān)性子圖的關(guān)聯(lián)由已標(biāo)注圖像的區(qū)域標(biāo)簽信息確定。
(4)跨層次的隨機(jī)游走算法:將未標(biāo)注圖像插入視覺(jué)語(yǔ)義關(guān)系圖,在新構(gòu)建的視覺(jué)語(yǔ)義關(guān)系圖上進(jìn)行跨層次的隨機(jī)游走,從而得到未標(biāo)注圖像區(qū)域的標(biāo)簽。本部分主要分兩步:
(41)將未標(biāo)注圖像分割成區(qū)域,并將圖像和其所包含的區(qū)域插入視覺(jué)語(yǔ)義關(guān)系圖。并根據(jù)未標(biāo)注圖像與已標(biāo)注圖像全局特征的相似性以及未標(biāo)注區(qū)域與已標(biāo)注區(qū)域的局部特征相似性來(lái)確定對(duì)應(yīng)邊的值。
(42)將圖像全局、圖像區(qū)域以及語(yǔ)義標(biāo)簽看作一個(gè)三元組復(fù)合節(jié)點(diǎn),在新構(gòu)建的三層視覺(jué)語(yǔ)義關(guān)系圖上進(jìn)行隨機(jī)游走,得到未標(biāo)注圖像區(qū)域與標(biāo)簽之間的關(guān)聯(lián)值,并選取關(guān)聯(lián)值最高的標(biāo)簽作為圖像區(qū)域的預(yù)測(cè)標(biāo)簽。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施步驟,下面將對(duì)步驟附圖進(jìn)行詳細(xì)介紹
圖1是基于視覺(jué)語(yǔ)義關(guān)系圖的圖像區(qū)域標(biāo)注流程圖
圖2是視覺(jué)語(yǔ)義關(guān)系圖
圖3是圖像全局相似性子圖
圖4是圖像區(qū)域相似性子圖
圖5是圖像區(qū)域標(biāo)簽語(yǔ)義相關(guān)性子圖
具體實(shí)施方式
下面結(jié)合附圖,對(duì)本發(fā)明的技術(shù)方案進(jìn)行具體說(shuō)明。
圖1是本發(fā)明提供的基于視覺(jué)語(yǔ)義關(guān)系圖的圖像區(qū)域標(biāo)注方法流程示意圖,該標(biāo)注方法包括4個(gè)單元。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華東理工大學(xué),未經(jīng)華東理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711387422.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類(lèi)專利
- 專利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類(lèi)方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 關(guān)系視圖
- 位置關(guān)系檢測(cè)裝置以及位置關(guān)系檢測(cè)系統(tǒng)
- 關(guān)系建模
- 關(guān)系分析方法、關(guān)系分析程序、以及關(guān)系分析裝置
- 實(shí)體關(guān)系分類(lèi)裝置和實(shí)體關(guān)系分類(lèi)方法
- 用戶關(guān)系抽取方法和用戶關(guān)系抽取系統(tǒng)
- 融合依存關(guān)系與篇章修辭關(guān)系的事件時(shí)序關(guān)系識(shí)別方法
- 開(kāi)關(guān)系統(tǒng)
- 視頻視覺(jué)關(guān)系檢測(cè)的關(guān)系片段連接方法
- 開(kāi)關(guān)系統(tǒng)





