[發明專利]圖像語義標注的方法、裝置和客戶端在審

申請號：	201310703723.3	申請日：	2013-12-19
公開（公告）號：	CN103632388A	公開（公告）日：	2014-03-12
發明（設計）人：	潘屹峰;夏添	申請（專利權）人：	百度在線網絡技術（北京）有限公司
主分類號：	G06T11/60	分類號：	G06T11/60
代理公司：	北京清亦華知識產權代理事務所(普通合伙) 11201	代理人：	宋合成
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	圖像語義標注方法裝置客戶端
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及計算機技術領域，尤其涉及一種圖像語義標注的方法、裝置和客戶端。

背景技術

圖像語義自動標注是指利用計算機視覺技術，讓計算機對圖像中的內容進行理解，從而給圖像自動標注出文本語義的過程。也就是說，圖像語義自動標注是使計算機對圖像的語義進行準確地描述和理解的過程，其本質上就是建立圖像和文本語義之間的關聯。圖像語義自動標注通常用于圖像檢索、圖像分類和相冊管理等不同的場景。

目前，圖像語義自動標注方法通常采用模式分類的方法建立圖像和文本語義之間的關聯。具體來說，每個分類類別均對應一個文本關鍵詞（也稱作特定語義類別），同時抽取圖像的低層特征，例如，局部紋理、顏色、結構等特征，作為圖像的特征標識，并且通過機器學習中的分類方法建立圖像和特定語義類別之間的關聯。

目前，現有的圖像語義自動標注的方法存在以下三點問題：1）、現有的圖像語義自動標注方法是將圖像的語義標注作為分類問題來解決的，通常需要人工事先選擇、標注語義類別，才能訓練語義分類器。因此，對每個類別進行圖像的人工標注費時費力，并且其無法窮盡整個語義空間，導致圖像的語義描述很不完整；2）、每個語義類別均對應一個語義分類器，在對圖像進行語義標注時，需要將所有的語義分類器進行測試，從中挑選置信度較高的語義類別作為圖像的語義標注。但是如果語義類別數目巨大，則對圖像進行語義標注時的計算量也會非常巨大，從而使現有的圖像語義自動標注的方法無法在實時性要求較高的場景中應用；3）、在抽取的圖像的低層特征到語義信息之間存在語義鴻溝，因此，現有的圖像語義自動標注的方法在獲取語義類別時，具有的穩定和一致性都很差。

發明內容

本發明旨在至少解決上述技術問題之一。

為此，本發明的第一個目的在于提出一種圖像語義標注的方法。該方法一方面可以省去傳統的圖像語義標注方法中通過人工篩選圖像類別訓練分類器的過程，節省了人力和時間，避免了圖像的低層特征和語義信息之間的語義鴻溝，提高了圖像語義標注的穩定性和一致性。另一方面可以克服語義標簽有限的固有問題，提高圖像語義標識的完整性，使語義標注信息更加精確地描述出圖像中的內容，同時提高了圖像語義標注時的速度。

本發明的第二個目的在于提出一種圖像語義標注的裝置。

本發明的第三個目的在于提出一種客戶端。

為了實現上述目的，本發明第一方面實施例的圖像語義標注的方法，包括以下步驟：提取圖像中的文字信息；根據所述文字信息生成標注信息；以及根據所述標注信息對所述圖像進行標注。

本發明實施例的圖像語義標注的方法，通過提取圖像中的文字信息，并根據文字信息生成的標注信息對圖像語義進行標注，一方面可以省去傳統的圖像語義標注方法中通過人工篩選圖像類別訓練分類器的過程，節省了人力和時間，避免了圖像的低層特征和語義信息之間的語義鴻溝，提高了圖像語義標注的穩定性和一致性。另一方面可以克服語義標簽有限的固有問題，提高圖像語義標識的完整性，使語義標注信息更加精確地描述出圖像中的內容，同時提高了圖像語義標注時的速度。

為了實現上述目的，本發明第二方面實施例的圖像語義標注的裝置，包括：提取模塊，用于提取圖像中的文字信息；生成模塊，用于根據所述文字信息生成標注信息；以及標注模塊，用于根據所述標注信息對所述圖像進行標注。

本發明實施例的圖像語義標注的裝置，通過提取圖像中的文字信息，并根據文字信息生成的標注信息對圖像語義進行標注，一方面可以省去傳統的圖像語義標注方法中通過人工篩選圖像類別訓練分類器的過程，節省了人力和時間，避免了圖像的低層特征和語義信息之間的語義鴻溝，提高了圖像語義標注的穩定性和一致性。另一方面可以克服語義標簽有限的固有問題，提高圖像語義標識的完整性，使語義標注信息更加精確地描述出圖像中的內容，同時提高了圖像語義標注時的速度。

為了實現上述目的，本發明第三方面實施例的客戶端，包括本發明第二方面實施例的圖像語義標注的裝置。

本發明實施例的客戶端，通過提取圖像中的文字信息，并根據文字信息生成的標注信息對圖像語義進行標注，一方面可以省去傳統的圖像語義標注方法中通過人工篩選圖像類別訓練分類器的過程，節省了人力和時間，避免了圖像的低層特征和語義信息之間的語義鴻溝，提高了圖像語義標注的穩定性和一致性。另一方面可以克服語義標簽有限的固有問題，提高圖像語義標識的完整性，使語義標注信息更加精確地描述出圖像中的內容，同時提高了圖像語義標注時的速度。

本發明附加的方面和優點將在下面的描述中部分給出，部分將從下面的描述中變得明顯，或通過本發明的實踐了解到。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術（北京）有限公司，未經百度在線網絡技術（北京）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310703723.3/2.html，轉載請聲明來源鉆瓜專利網。