[發明專利]一種圖像自動標注算法有效
| 申請號: | 201310514942.7 | 申請日: | 2013-10-28 |
| 公開(公告)號: | CN103605667A | 公開(公告)日: | 2014-02-26 |
| 發明(設計)人: | 章東平;李艷潔;楊力;蘆亞飛 | 申請(專利權)人: | 中國計量學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州浙科專利事務所(普通合伙) 33213 | 代理人: | 吳秉中 |
| 地址: | 315470 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 自動 標注 算法 | ||
技術領域
本發明涉及一種圖像自動標注的方法,屬于圖像檢索、分類和識別領域。
背景技術
????隨著數碼相機和其他電子設備越來越流行,圖像的數量正在迅速增加。因此,如何有效地管理和檢索網絡多媒體信息成為一個迫切需要解決的問題。在過去的幾十年里,有大量的研究基于內容的圖像檢索,卻受于語義鴻溝的限制,不能完全滿足用戶的需求。用戶習慣于使用關鍵字進行查詢,但人工標注是一個非常費力的工作,從而催生了圖像自動標注的發展。圖像自動標注是反映語義內容讓計算機自動添加圖像并標注沒有標記的圖像,它的關鍵是實現了圖像的語義檢索領域的研究。
發明內容
為了解決在大數據圖像標注的過程中所耗費的人力和對無標簽數據結構的充分利用等問題,本發明提供一種圖像自動標注算法,包括步驟:
步驟(1)圖像數據集特征提取:通過對數據集中的圖像進行特征提取來獲得圖像的底層信息;
步驟(2)圖像訓練集選擇:通過選擇最權威、最標準的數據集進行圖像自動標注算法的訓練,該數據集要含有多種特征和最豐富的圖像資源,從數據集選取n個數據作為訓練樣本,其中部分樣本已標注,其余樣本無標注;
步驟(3)圖像標注算法訓練:通過對得到的樣本進行特征選擇,并采用約束項來優化標注結果;
步驟(4)圖像自動標注:通過選擇閾值,對預測標簽進行處理。
進一步的,步驟(1)中選用的特征類型包括:顏色直方圖、逐塊顏色矩、邊緣方向直方圖、顏色相關圖、臉部特征、小波紋理和基于SIFT描述詞袋。
進一步的,所述步驟(2)中對圖像訓練集選擇具體為:
1)?共選取n個樣本????????????????????????????????????????????????,其中m個樣本有標簽。從每個樣本中選取上述三種特征作為該樣本的一個特征向量,記為,為特征向量的維數;
2)?是標簽矩陣,是標簽類的數目,其中個樣本有標簽。若屬于第類,則,否則為零;若沒有標簽,則為全0的向量;
進一步的,所述步驟(3)對圖像標注算法訓練具體為:
1)?????????構建線性回歸函數為,是訓練集,?
是標簽集,?是投影矩陣;?定義為有n個全為1的列向量。是偏置量,?是原始特征的維數,?是訓練數據的數目?和?是標簽類的數目;?是為了特征選擇從到的映射矩陣。訓練模型定義為:,是一個邏輯損失函數,是正則化參數;
2)?????????定義一個預測矩陣為:,其中滿
;
3)?????????采用拉普拉斯構圖的流形學習方法:
損失函數最小化定義為:,定義了一個拉普拉斯矩陣為:?,其中是一個對角矩陣,定義式為:,?是權值函數,與?和的關系是:?
;
4)?????????為了提高標簽符合度,即在測試過程中,使預測的標簽更匹配原始標簽:優化項為:,定義了一個對角矩陣,其中若有標簽,則,若沒有標簽,則;
5)?????????由式,即最小二乘表達式可寫為:
,其中和表示有標簽的訓練數據和它們原始真實標簽。若使用半監督的學習方法,即n個樣本中有m個有標簽,則最小二乘殘差可表示為:;
6)?????????由于訓練數據量較大,所以要較有效的表示圖像內容是用
很少的數據來捕獲感興趣目標,所用稀疏表示的定義如下:?;
7)?????????預測標簽理想值為0或1,即:。綜上所
述,最優化的目標函數表達式為:;
8)?????????最優化的目標函數表達式中所用參數有、、,其中參
數和可從中通過實驗測試選取,可通過實驗測得最優解得到;
通過迭代法求解上述的最優化問題,得到矩陣、、b。
進一步的,所述步驟(4)中圖像自動標注具體為:選擇閾值T,對進行閾值處理,即得檢測圖像的標簽,通過閾值后所得的標簽為:
其中,,為檢測的樣本數。
?????本發明的基于稀疏結構特征選擇的圖像標注方法實現了對圖像自動標注,具有開創性意義。
附圖說明
圖1是本發明的圖像標注方法流程圖;
圖2是圖像標注算法結構示意圖;
圖3是圖像標注研究的圖像示例示意圖。
具體實施方式
下面結合附圖對本發明作進一步說明。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國計量學院,未經中國計量學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310514942.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:雙介晶化合物
- 下一篇:一種信道狀態信息的發送、接收方法和裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





