[發(fā)明專利]一種圖像內容檢索系統(tǒng)及其圖像內容稀疏學習方法無效
| 申請?zhí)枺?/td> | 201310181859.2 | 申請日: | 2013-05-16 |
| 公開(公告)號: | CN103226616A | 公開(公告)日: | 2013-07-31 |
| 發(fā)明(設計)人: | 宋曉寧;陳勇;王衛(wèi)東;葉華;石亮;范燕 | 申請(專利權)人: | 南京龍淵微電子科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/46 |
| 代理公司: | 江蘇圣典律師事務所 32237 | 代理人: | 鄧麗 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 內容 檢索系統(tǒng) 及其 稀疏 學習方法 | ||
技術領域
本發(fā)明涉及一種基于內容的圖像檢索的系統(tǒng)和方法,尤其涉及一種圖像內容檢索系統(tǒng)及其圖像內容稀疏學習方法。
背景技術
目前,傳統(tǒng)圖像內容的特征描述大多采用顏色、紋理、形狀等物理特征描述圖像內容,而這些特征對圖像的語義信息不能充分有效表達。同時,描述圖像內容的特征較單一,一幅圖像往往具有多種形態(tài),如顏色、紋理、形狀等,即使是同一形態(tài)特征,也有多種不同的表示方法,只利用單一特征檢索,不能有效組織多種特征從不同角度反映圖像內容。此外,通過構造有效稀疏基信息解決高維圖像樣本的特征表示、抽取及重建的技術還處于起步階段。
傳統(tǒng)的代數(shù)特征描述技術僅保存了模式的全局結構屬性,更多適用于線性可分情況;而研究表明,許多在自然界獲取的圖像尤其因光照、姿態(tài)等因素發(fā)生變化時,會造成圖像的線性不可分。其次,一些圖像位于高維空間的非線性流形結構上,由此帶來特征分析的困難。
上述因素使傳統(tǒng)代數(shù)描述方法不能較好地表示模式的內在結構,從而導致分類識別的效率較低。在已知的現(xiàn)有技術中,典型的基于流形結構的方法有Local?linear?embedding?(LLE),Isomap和Laplacian?eigenmap,并在實驗數(shù)據上取得了良好的效果。然而這些方法所提取的映射關系僅建立在訓練數(shù)據上,對如何評價測試數(shù)據的映射并不精確,這導致它們在圖像識別領域的應用比較少。Locality?Preserving?Projections?(LPP)方法對Laplacian?eigenmap方法近似線性化,從而有效保持了樣本之間的局部結構,在圖像處理等領域取得了較好的結果,但是該方法的缺陷是沒有充分發(fā)現(xiàn)圖像的類別信息。以上流形方法的典型改進模型有Supervised?LPP?(SLPP)和Locally?discriminating?projection?(LDP),然而,這類方法仍然未能強化保持圖像空間的差異信息,它們在描述圖像之間的局部結構時,忽略了樣本之間的非局部屬性和總體信息,從而導致這類方法的魯棒性還不夠高。
?
發(fā)明內容
本發(fā)明要解決的技術問題是現(xiàn)有的圖像內容檢索算法對圖像的語義信息不能充分有效表達。
為解決上述技術問題,本發(fā)明采用的技術方案是:一種圖像內容檢索系統(tǒng),包括:1)分割子系統(tǒng),用于將訓練圖像、測試圖像分別分割為n個示例,包括:A)FCM分割單元:采用模糊C均值算法對訓練圖像和測試圖像分別進行區(qū)域分割;B)金字塔分割單元:采用cvPrySegmentation函數(shù)對訓練圖像和測試圖像重新進行基于“空間金字塔”匹配機制的圖像分割;2)圖像區(qū)域特征提取單元:用于提取各個示例的顏色、紋理、CENTRIST特征及每類平均特征向量;3)計算對比子系統(tǒng),包括:a)提取每個示例的顏色特征和紋理特征;b)統(tǒng)計變換直方圖單元,用于計算一幅圖像所有像素的CT值,統(tǒng)計各示例CT值像素個數(shù)或所占比例,求得CT值直方圖特征,即CENTRIST特征;c)多示例稀疏學習單元,用于對各示例的CENTRIST特征進行稀疏離散度描述,以及計算示例的多樣性密度,并確立目標示例;d)計算每一類圖像的緊湊空間結構特征SSRCT;e)計算每類平均特征向量PACT;f)對比單元,通過歐氏距離度量目標示例與測試圖像在顏色和紋理特征上的相似性并分別排序,同時對圖像緊湊空間結構特征SSRCT的相似度進行排序。
一種圖像內容檢索系統(tǒng)的圖像內容稀疏學習方法,包括以下步驟:步驟一:對訓練圖像進行FCM分割,將其分為n個區(qū)域,每個區(qū)域為一個示例,并分別提取該示例的顏色和紋理特征向量;步驟二:采用“空間金字塔”的2級劃分重新分割訓練圖像,并提取各分塊的CENTRIST特征后進行稀疏離散度描述,得到一個緊湊的空間結構特征SSRCT,并依此計算每類平均特征向量;步驟三:對步驟一得到的各個示例進行多示例稀疏學習,求得示例多樣性密度,并依此選擇出目標示例;步驟四:將步驟一中提取的顏色特征與與步驟三中提取的目標示例的顏色特征求歐氏距離并排序,?排序后得到ColorOrder;步驟五:將步驟一中提取的紋理特征與與步驟三中提取的目標示例的紋理特征求歐氏距離并排序,?排序后得到TextureOrder;步驟六:利用步驟二計算每一類圖像的SSRCT特征矩陣的平均矩陣,對測試圖像與每類平均空間特征矩陣PACT計算歐氏距離,排序后得到PACTOrder;步驟七:將步驟四至七中得到的三組排序結果加權綜合得到最終排序結果,依此得到最終的檢索結果。
作為本發(fā)明的一種改進方案,顏色特征為像素R、G、B顏色均值或HSV顏色直方圖特征,紋理特征由符合人眼視覺感知的Gabor濾波器提取。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京龍淵微電子科技有限公司,未經南京龍淵微電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310181859.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 內容再現(xiàn)系統(tǒng)、內容提供方法、內容再現(xiàn)裝置、內容提供裝置、內容再現(xiàn)程序和內容提供程序
- 內容記錄系統(tǒng)、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統(tǒng)、內容服務器、內容終端及內容服務方法
- 內容分發(fā)系統(tǒng)、內容分發(fā)裝置、內容再生終端及內容分發(fā)方法
- 內容發(fā)布、內容獲取的方法、內容發(fā)布裝置及內容傳播系統(tǒng)
- 內容提供裝置、內容提供方法、內容再現(xiàn)裝置、內容再現(xiàn)方法
- 內容傳輸設備、內容傳輸方法、內容再現(xiàn)設備、內容再現(xiàn)方法、程序及內容分發(fā)系統(tǒng)
- 內容發(fā)送設備、內容發(fā)送方法、內容再現(xiàn)設備、內容再現(xiàn)方法、程序及內容分發(fā)系統(tǒng)
- 內容再現(xiàn)裝置、內容再現(xiàn)方法、內容再現(xiàn)程序及內容提供系統(tǒng)
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





