[發明專利]一種基于稀疏因子分析的圖像視覺屬性挖掘方法有效
| 申請號: | 201610035845.3 | 申請日: | 2016-01-19 |
| 公開(公告)號: | CN105718883B | 公開(公告)日: | 2019-01-15 |
| 發明(設計)人: | 鄒煥新;孫浩;周石琳;計科峰;雷琳;李智勇 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 國防科技大學專利服務中心 43202 | 代理人: | 王文惠 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 稀疏 因子分析 圖像 視覺 屬性 挖掘 方法 | ||
本發明提供一種基于稀疏因子分析的圖像視覺屬性挖掘方法。技術方案包括下述步驟:第一步,計算圖像集合的特征矩陣。對圖像集合I中的每一幅圖像Ii計算一個D維的梯度方向直方圖特征向量,得到圖像集合的特征矩陣X。第二步,挖掘圖像集合的視覺屬性。初始化視覺屬性矩陣A為X的前K列,初始化視覺屬性混合系數矩陣Y為單位對角矩陣,采用交替優化進行迭代,得到最優的視覺屬性矩陣A。本發明自動挖掘圖像視覺屬性,避免了屬性學習需要大量人工標記樣本的缺點,通過在視覺屬性混合系數矩陣優化時引入稀疏約束,大大提高了視覺屬性的區分性能。
技術領域
本發明涉及圖像分析技術領域,特別涉及圖像分析中的語義描述技術領域,更具體地說,涉及一種基于稀疏因子分析的圖像視覺屬性挖掘方法。
背景技術
圖像視覺屬性(visual attribute)增進了人與計算機對圖像內容的一致理解。基于圖像視覺屬性的語義描述方法在圖像目標識別、圖像檢索和圖像內容標記等多個領域取得了很大成功。然而現有的圖像視覺屬性學習方法通過圖像附帶的自然語言描述定義視覺屬性,需要大量的人工標記圖像,存在兩方面問題:一是人工標記圖像效率低下,不適用于大規模圖像集合;二是不同的人對同一副圖像的內容理解有差別,引入人工標記偏差。
發明內容
本發明要解決的技術問題是:克服現有圖像視覺屬性學習方法中的人工標記過程效率低下和標記過程中引入的語義偏差問題,基于數據驅動的思想,采用無監督優化方法直接從大規模圖像集合中挖掘同時具有語義性和區分性的圖像視覺屬性。
本發明的技術方案是:一種基于稀疏因子分析的圖像視覺屬性挖掘方法,具體包括下述步驟:
第一步,計算圖像集合的特征矩陣。
對圖像集合I={Ii|i=1,2,...,N}中的每一幅圖像Ii計算一個D維的梯度方向直方圖特征向量xi∈RD,得到圖像集合的特征矩陣X∈RD×N,其中xi表示為列向量,D的取值根據圖像大小和梯度方向直方圖特征提取參數確定。
第二步,挖掘圖像集合的視覺屬性。
設定最大迭代次數(根據經驗值確定),初始化視覺屬性矩陣A∈RD×K(K為屬性的種類數,根據經驗值確定,K<min{D,N})為X的前K列,初始化視覺屬性混合系數矩陣Y∈RK×N為單位對角矩陣,采用交替優化進行迭代:
①固定A不變,調整Y,采用NNQP(non-negative quadratic programming,非負二次規劃)方法優化下式:
其中Y≥0 (公式一)
其中yi為Y的第i列,||||F為計算F范數,||||1為計算1范數,設經過優化Y變為Y′。
②固定Y′不變,調整A,采用NNQP方法優化下式:
其中A≥0 (公式二)
設經過優化A變為A′。
③對A′的列進行范數歸一化得到A″。
④判斷是否滿足最大迭代次數(根據需要確定),是則結束迭代,視覺屬性矩陣A″即為所求結果;否則令A=A″,Y=Y′,返回①。
本發明的有益效果是:
(1)自動挖掘視覺屬性的語義。本發明對基于圖像視覺屬性的生成過程進行建模并利用大規模圖像數據推斷模型參數,自動挖掘圖像視覺屬性,避免了屬性學習需要大量人工標記樣本的缺點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610035845.3/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





