[發(fā)明專利]一種基于顏色特征與倒排索引的海量圖像檢索系統(tǒng)在審
| 申請?zhí)枺?/td> | 201310601630.X | 申請日: | 2013-11-21 |
| 公開(公告)號(hào): | CN103593458A | 公開(公告)日: | 2014-02-19 |
| 發(fā)明(設(shè)計(jì))人: | 董樂;封寧;梁燕;王冉 | 申請(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 成都華典專利事務(wù)所(普通合伙) 51223 | 代理人: | 徐豐;楊保剛 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 顏色 特征 索引 海量 圖像 檢索系統(tǒng) | ||
發(fā)明領(lǐng)域
本發(fā)明屬于模式識(shí)別與信息處理技術(shù)領(lǐng)域,涉及電子商務(wù)平臺(tái)上的海量圖像處理,
尤其涉及一種基于顏色特征與倒排索引的海量圖像檢索的實(shí)現(xiàn)方案。
背景技術(shù)
電子商務(wù)服務(wù)產(chǎn)業(yè)正經(jīng)歷其發(fā)展的黃金年代。預(yù)計(jì)到2015年,中國電子商務(wù)服務(wù)業(yè)營收將突破萬億元規(guī)模,屆時(shí)中國將擁有世界上規(guī)模最大、最為領(lǐng)先的電子商務(wù)服務(wù)產(chǎn)業(yè)。在電子商務(wù)蓬勃發(fā)展的同時(shí),海量商品圖像也在以幾何倍數(shù)的增長速度遞增。因此如何快速有效的對海量的商品圖像進(jìn)行檢索成為了新的研究趨勢。商品圖像內(nèi)容具有很明顯的形狀差別,比如衣服和褲子在形狀上就有很大的差別。顏色特征是最關(guān)鍵也是最常用的特征,但是直接處理彩色圖像的RGB顏色是相當(dāng)耗時(shí)的工作,所以如何降低顏色統(tǒng)計(jì)的復(fù)雜度是海量圖像處理首先面對的難題。本發(fā)明提出了基于顏色空間量化及特征編碼的方法以求快速獲取圖像顏色特征,并用圖像網(wǎng)格化的方法,進(jìn)一步的提取圖像的主顏色信息,并最終經(jīng)過特征編碼建立海量圖像倒排索引。
發(fā)明內(nèi)容
本發(fā)明的目的在于要解決迅速發(fā)展的電子商務(wù)形成的海量圖像下的圖像快速檢索問題,由此消費(fèi)者可以在面臨海量圖像快速檢索所關(guān)心的商品。提供了一種快速有效的電子商務(wù)平臺(tái)海量圖像檢索方法。
為了實(shí)現(xiàn)上述目的本發(fā)明采用以下技術(shù)方案:
一種基于顏色特征與倒排索引的海量圖像檢索系統(tǒng),其特征在于,包括如下步驟:
步驟一:首先為了解決RGB顏色空間計(jì)算顏色特征的維數(shù)災(zāi)難問題,同時(shí)考慮到顏色空間的均勻性問題,選用均勻性好的CIE1976L*a*b*顏色空間,并用K-means聚類方法對CIE1976L*a*b*進(jìn)行聚類,聚類到256種顏色。
步驟二:從電子商務(wù)平臺(tái)獲取所有待檢索的圖像,先將圖像的RGB顏色轉(zhuǎn)化為CIE1976L*a*b*顏色,并將圖像中的每個(gè)像素點(diǎn)顏色根據(jù)色差最小原則和步驟一得到的256種顏色做映射,最終圖像的每個(gè)像素的維度變?yōu)?56維。
步驟三:將步驟二中得到的圖像網(wǎng)格化,網(wǎng)格大小為8*8。在每個(gè)網(wǎng)格單元中統(tǒng)計(jì)顏色主色,并以每個(gè)主色作為這個(gè)網(wǎng)格單元的代表色。最后每張圖像將由64個(gè)代表色組成。
步驟四:將步驟三得到的64個(gè)代表色通過自定義的編碼規(guī)則進(jìn)行字符編碼,最后一張圖像會(huì)對應(yīng)一個(gè)由64個(gè)字符編碼組成的類文本,將此類文本上傳至倒排索引服務(wù)器,完成海量圖像的索引建立,進(jìn)而可以完成圖像檢索功能。
本發(fā)明結(jié)合文本檢索快速有效的特點(diǎn),將圖像特征很好的轉(zhuǎn)化為了文本。解決了海量圖像的快速有效檢索問題,本發(fā)明具有以下優(yōu)點(diǎn):
一、從消費(fèi)者對用戶體驗(yàn)的要求出發(fā),通過圖像特征類文本化的改進(jìn),能夠完成快速有效的圖像檢索效果;
二、本發(fā)明從電子商務(wù)平臺(tái)的角度出發(fā),能夠很好的將平臺(tái)內(nèi)海量的圖像信息通過顏色特征進(jìn)行行之有效的整合。從而給用戶提供更好的消費(fèi)體驗(yàn),帶來更多的網(wǎng)站流量。
三、從信息處理技術(shù)的角度出發(fā),本發(fā)明很好的結(jié)合了文本檢索的優(yōu)點(diǎn),并將圖像進(jìn)行網(wǎng)格化,從而保留了圖像部分的輪廓信息,對于輪廓信息敏感的商品圖像來說具有良好效果。
附圖說明
附圖1是檢索系統(tǒng)框架圖;
附圖2主色圖;
附圖3自定義編碼;
附圖4字符碼文;
附圖5部分實(shí)驗(yàn)結(jié)果。
具體實(shí)施方式
為了使得本發(fā)明的目的、技術(shù)方案和有益效果更加清楚明白,以下結(jié)合具體案例,并參照附圖,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)的說明。
本發(fā)明是用于電子商務(wù)平臺(tái)海量圖像中相似圖像的檢索方法。該方法能夠?qū)D像特征轉(zhuǎn)化為能夠建立索引的類文本關(guān)鍵字特征,從而利用倒排索引搜索引擎,完成對圖像的快速檢索工作。該檢索方法能夠很好的滿足用戶對快速有效檢索方法需求,同時(shí)可在很大程度上增加電子商務(wù)平臺(tái)的用戶體驗(yàn),并在實(shí)踐中很好的驗(yàn)證了圖像檢索和文本檢索這原本不相干的兩種檢索方法結(jié)合的好處。
我們的測試實(shí)驗(yàn)軟硬件環(huán)境為:
硬件環(huán)境:
電腦類型:臺(tái)式機(jī);
CPU:Pentium(R)Dual-Core?CPU?E5600@2.93GHz
內(nèi)存:4.00GB(3.49GB可用)
系統(tǒng)類型:32位操作系統(tǒng)
顯示卡:集成顯卡
軟件環(huán)境:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310601630.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





