[發明專利]一種圖像標注方法和裝置有效
| 申請號: | 201611262818.6 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN108268510B | 公開(公告)日: | 2022-01-28 |
| 發明(設計)人: | 馮柏嵐;姚春鳳;李德豐 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F16/58 | 分類號: | G06F16/58 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 標注 方法 裝置 | ||
本申請公開了一種圖像標注方法和裝置,在待標注圖像為弱標注圖像的情況下,根據待標注圖像的文本和內容從優質標注數據集中篩選出候選圖像,根據候選圖像中各個圖像的標簽的分布情況,將滿足標簽遷移條件的標簽添加到待標注圖像上,自動將弱標注圖像轉換為強標注圖像,提升圖像標注的效率和準確度。
技術領域
本發明涉及圖像處理領域,尤其涉及一種圖像標注方法和裝置。
背景技術
隨著計算機網絡和多媒體技術的發展,互聯網上可獲取的多媒體信息的數量也得到非常快速的增長。多媒體信息的激增給用戶提供豐富資源的同時,如何從海量的信息中快速有效地獲得感興趣的資源也給研究人員帶來巨大的挑戰。由此,圖像分類和檢索技術日益得到重視。
基于內容的圖像檢索(CBIR,Content-Based Image Retrieval)技術自上世紀九十年代提出以來得到了廣泛的研究。通過將圖像自身的視覺內容特征(例如顏色、紋理、形狀和空間層次等底層特征)作為其索引,可以檢索視覺特征上相似的其他圖像。從而可以根據圖像低級特征計算的視覺相似度來直接比較和檢索圖像。
但是,由于使用了圖像的底層視覺特征來描述圖像,而這些特征與人們對圖像高層語義的主觀判斷沒有統一規則的相關性。當完全不同類型的圖像有可能具有類似的底層特征時,根據視覺相似度直接比較的方法往往不能得到準確的檢索結果。
另一方面,出現了一些通過基于文本的圖像檢索(TBIR,Text-Based ImageRetrieval)技術對圖像進行標注的方法。通過低級特征尋找待標注圖像的相似圖像,將相似圖像的標簽分配給待標注圖像,從而可以將圖像視覺和相關文本信息結合進行檢索。
但是在實現本發明的過程中,發明人發現現有技術的缺陷在于:目前由于圖像的低級特征和高級語義之間存在距離,圖像標注的準確度低;而如果僅利用人機交互或者手工方式對圖像進行標注,則效率低且用戶負擔重。
發明內容
本發明實施例所要解決的技術問題在于,提供一種圖像標注方法。能根據文本和內容,將弱標注圖像自動轉換為強標注圖像,提升圖像標注的準確性和效率。
為了解決上述技術問題,本發明實施例提供了一種圖像標注方法,包括:獲取待標注圖像,識別待標注圖像的標注類型,圖像的標注類型分為無標注圖像、強標注圖像和弱標注圖像,無標注圖像表示圖像的標簽的數量為0,弱標識圖像表示圖像的標簽的數量大于0但是小于某個預設值,強標注圖像表示圖像的標簽的數量大于或等于該預設值,圖像標注裝置可根據待標注圖像的標簽的數量來識別待標注圖像的標注類型。在待標注圖像為弱標注圖像的情況下,確定待標注圖像的標簽的文本,根據標簽的文本在預設的優質標注數據集中進行基于文本的圖像檢索TBIR(Text Based Image Retrieval,基于文本的圖像檢索),根據檢索到的圖像得到第一圖像集,其中,優質數據集中的圖像均為強標注圖像,且各個圖像的標簽的準確度高。根據待標注圖像的內容在第一圖像集合中進行基于內容的圖像檢索CBIR(Content Based Image Retrieval,基于內容的圖像檢索),圖像的內容包括但不限于顏色、紋理、形狀和空間關系中的一種或多種,根據檢索到的圖像得到第二圖像集。在本實施例中待標注圖像為行人圖像,優質數據集為行人數據集,根據圖像的行人身份信息、標簽的語義和圖像內容采用指定的網絡傳播方法計算第二圖像集中的各個圖像的融合相似度值,融合相似度的計算方法可采用網絡傳播方法,例如:隨機游走算法進行計算。圖像標注裝置從第二圖像集中選擇融合相似度大于預設的第一閾值的圖像,兩個圖像之間的相似程度與融合相似度呈正比,融合相似度越大,兩個圖像之間的相似程度越大,反之兩個圖像之間的相似程度越小;圖像標注裝置根據選擇出的圖像得到第一候選圖像集,統計第一候選圖像集中各個圖像的標簽的出現頻率,根據標簽的出現頻率判斷標簽是否滿足預設的標簽遷移條件,將滿足標簽遷移條件的標簽遷移到待標注圖像上,由于待標注圖像為弱標注圖像,添加標簽后得到強標注圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611262818.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:配置數據管理方法和裝置
- 下一篇:基于大數據的網絡用戶分類方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





