[發明專利]圖像標注方法及其裝置有效
| 申請號: | 201110197235.0 | 申請日: | 2011-07-14 |
| 公開(公告)號: | CN102880612A | 公開(公告)日: | 2013-01-16 |
| 發明(設計)人: | 曹瓊;劉汝杰;于浩 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 李輝;陶海萍 |
| 地址: | 日本神奈*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 標注 方法 及其 裝置 | ||
技術領域
本發明涉及圖像分類和檢索領域,特別涉及一種圖像標注方法及其裝置。
背景技術
隨著計算機網絡和多媒體技術的發展,互聯網上可獲取的多媒體信息的數量也得到非常快速的增長。多媒體信息的激增給用戶提供豐富資源的同時,如何從海量的信息中快速有效地獲得感興趣的資源也給研究人員帶來巨大的挑戰。由此,圖像分類和檢索技術日益得到重視。
基于內容的圖像檢索(CBIR,Content-Based?Image?Retrieval)技術自上世紀九十年代提出以來得到了廣泛的研究。通過將圖像自身的視覺內容特征(例如顏色、紋理、形狀和空間層次等底層特征)作為其索引,可以檢索視覺特征上相似的其他圖像。從而可以根據圖像低級特征計算的視覺相似度來直接比較和檢索圖像。
但是,由于使用了圖像的底層視覺特征來描述圖像,而這些特征與人們對圖像高層語義的主觀判斷沒有統一規則的相關性。當完全不同類型的圖像有可能具有類似的底層特征時,根據視覺相似度直接比較的方法往往不能得到準確的檢索結果。
另一方面,出現了一些通過基于文本的圖像檢索(TBIR,Text-Based?Image?Retrieval)技術對圖像進行標注的方法。通過低級特征尋找待標注圖像的相似圖像,將相似圖像的標簽分配給待標注圖像,從而可以將圖像視覺和相關文本信息結合進行檢索。
但是在實現本發明的過程中,發明人發現現有技術的缺陷在于:目前由于圖像的低級特征和高級語義之間存在距離,圖像標注的準確度低;而如果僅利用人機交互或者手工方式對圖像進行標注,則效率低且用戶負擔重。
發明內容
本發明實施例提供一種圖像標注方法及其裝置,目的在于同時考慮圖像的低級特征和高級語義,提高圖像標注的準確度;并且實現標簽自動標注,提高標注的效率。
根據本發明實施例的一個方面,提供一種圖像標注方法,所述圖像標注方法包括:
為輸入圖像獲取初始的包括多個標簽的標簽集,其中根據所述多個標簽確定表示所述輸入圖像的語義的準確度;
計算所述輸入圖像的標簽集與存儲在數據庫中的比較圖像的標簽集之間的基于標簽集的相似度;
將所述基于標簽集的相似度和基于視覺的相似度進行合并計算,以獲得所述輸入圖像和所述比較圖像的合并相似度;
基于所述合并相似度更新所述輸入圖像的標簽集。
根據本發明實施例的另一個方面,提供一種圖像標注裝置,所述圖像標注裝置包括:
初始化器,為輸入圖像獲取初始的包括多個標簽的標簽集,其中根據所述多個標簽確定表示所述輸入圖像的語義的準確度;
關系計算器,計算所述輸入圖像的標簽集與存儲在數據庫中的比較圖像的標簽集之間的基于標簽集的相似度;
合并計算器,將所述基于標簽集的相似度和基于視覺的相似度進行合并計算,以獲得所述輸入圖像和所述比較圖像的合并相似度;
標簽集更新器,基于所述合并相似度更新所述輸入圖像的標簽集。
本發明實施例的有益效果在于,通過將基于標簽集的相似度和基于視覺的相似度合并,可以同時考慮圖像的低級特征和高級語義,提高圖像標注的準確度;并且實現標簽自動標注,提高標注的效率。
可以通過相同的方法或類似的方法將針對一種實施方式介紹和/或例示的特征用于一個或更多個其它實施方式,與其它實施方式的特征相組合或者取代其它實施方式的特征。
應強調的是,本說明書中使用的術語“包括”和“包含”用于指出所述的特征、要件、步驟或組件的存在,但并不排除一個或更多個其它特征、要件、步驟、組件或它們的組合的存在或添加。
附圖說明
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,并不構成對本發明的限定。在附圖中:
圖1是本發明實施例的圖像標注方法的一流程圖;
圖2是本發明實施例中進行標注后的圖像的示意圖;
圖3是本發明實施例的獲得初始的標簽集的一示意圖;
圖4是本發明實施例的圖像標注方法的又一流程圖;
圖5是本發明實施例的圖像標注方法的迭代過程的一示意圖;
圖6是本發明實施例中圖像標注裝置的一構成示意圖;
圖7是本發明實施例中圖像標注裝置的又一構成示意圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚明白,下面結合附圖對本發明實施例作進一步詳細說明。在此,本發明的示意性實施例及其說明用于解釋本發明,但并不作為對本發明的限定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110197235.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





