[發明專利]基于結構語義直方圖的圖像檢索方法有效
| 申請號: | 201310284272.4 | 申請日: | 2013-07-08 |
| 公開(公告)號: | CN103336830B | 公開(公告)日: | 2017-02-08 |
| 發明(設計)人: | 劉廣海 | 申請(專利權)人: | 劉廣海 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 桂林市持衡專利商標事務所有限公司45107 | 代理人: | 陳躍琳 |
| 地址: | 541004 廣西壯族自治區*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 結構 語義 直方圖 圖像 檢索 方法 | ||
技術領域
本發明涉及圖像檢索領域,具體涉及一種基于結構語義直方圖的圖像檢索方法。
背景技術
圖形圖像是人類交流的媒介并能夠提供豐富信息來讓人們認識和理解世界。隨著數字圖像技術和互聯網的發展,越來越多的圖像涌現。如何高效而快速地進行圖像索引和檢索成為日益迫切的需求,因此,圖像檢索成為模式識別和人工智能領域的研究熱點之一。一般而言,圖像檢索主要包括:基于文本的圖像檢索、基于內容的圖像檢索和基于語義的圖像檢索,基于文本的圖像檢索已經不適合時代要求。鑒于目前人工智能和相關技術的局限性,基于語義的圖像檢索仍然是一個公開的難題。因此,基于內容的圖像檢索(CBIR)仍然是非常重要而高效的圖像檢索方法,并且CBIR系統仍然被廣泛應用于學術和工業領域。眾所周知,人類視覺系統通過感受野周邊的神經元競爭機制而產生少量引起視覺注意的關注點并且抑制不相關對象。視覺注意機制和低層次視覺特征之間存在密切的關系,與此同時,人類更加趨向于用類似文字信息來描述物體屬性,主流的Bag-of-visual?word模型借鑒了文本信息處理模式,在一定程度上具備類似文字信息的功能,所以如何應用視覺感知機制和視覺詞匯模型來進行圖像檢索是一個非常重要并且具有挑戰性的問題。
為了充分利用視覺感知機制和視覺詞匯模型的優勢來進行圖像檢索,本發明提出了一種新穎的方法來描述圖像特征,它被稱之為結構語義直方圖(structure?semantic?histogram)。結構語義根據視覺顯著性詞匯和感知顏色詞匯的結構信息來定義,它在一定程度上模擬了人類視覺感知機制,能夠表達語義信息和視覺詞匯的結構空間信息,視覺顯著性信息和均勻顏色信息。結構語義直方圖所包含的信息量明顯地高于主流的Bag-of-visual?word模型,可以視為是Bag-of-visual?word模型的升華。
發明內容
本發明所要解決的技術問題是:提供一種基于結構語義的圖像檢索方法,其能夠利用直方圖來表達語義信息,視覺顯著性信息和均勻顏色信息,并且還能夠表達視覺詞匯所包含的空間結構屬性。
為解決上述問題,本發明是通過以下方案實現的:
一種基于結構語義直方圖的圖像檢索方法,包括如下步驟:
(1)將彩色圖像從RGB顏色空間轉換到HSV顏色空間;在HSV顏色空間中,H分量表示色彩信息,可用于表示不同顏色。在本發明中被稱之為顏色分量。
(2)在HSV彩色空間中,將H,S和V三個分量用于構建高斯金字塔H(σ),S(σ)和V(σ),其中σ∈[0...5]表示尺度,然后通過跨尺度抽樣并產生所謂的特征映射:
F(c,s,H)=|H(c)口H(s)|???????????????(1)
F(c,s,S)=|S(c)口S(s)|???????????????(2)
F(c,s,V)=|V(c)口V(s)|???????????????(3)
式中,F(c,s,H)表示H分量的特征映射,F(c,s,S)表示S分量的特征映射,F(c,s,V)表示V分量的特征映射,H(c)表示H分量細尺度c的高斯金字塔,H(s)表示H分量粗尺度s的高斯金字塔,S(c)表示S分量細尺度c的高斯金字塔,S(s)表示S分量粗尺度s的高斯金字塔,V(c)表示V分量細尺度c的高斯金字塔,V(s)表示V分量粗尺度s的高斯金字塔,口表示中心-周邊差操作,它是在“中心”細尺度c和“周邊”粗尺度之間進行,并產生特征映射圖;
將每個特征映射圖縮小到尺度5,然后進行逐點相加,最后得到3個獨立顯著性圖像映射和
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于劉廣海,未經劉廣海許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310284272.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種烘干卷布機
- 下一篇:過水平生產線用的牽引裝置





