[發(fā)明專利]一種基于社區(qū)分析的圖像索引并行構(gòu)建方法在審
| 申請?zhí)枺?/td> | 201510224042.8 | 申請日: | 2015-05-06 |
| 公開(公告)號: | CN104778281A | 公開(公告)日: | 2015-07-15 |
| 發(fā)明(設(shè)計)人: | 束蘭;黃裕新 | 申請(專利權(quán))人: | 蘇州搜客信息技術(shù)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 北京科億知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 215021 江蘇省蘇州市工業(yè)園區(qū)金*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 社區(qū) 分析 圖像 索引 并行 構(gòu)建 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像查詢技術(shù)領(lǐng)域,具體地是涉及一種基于社區(qū)分析的圖像索引并行構(gòu)建方法。
背景技術(shù)
從人類的認(rèn)知角度看,人類對圖像的描述和理解主要是在語義層次上進行。而圖像的底層物理特征(如色彩、紋理、形狀、結(jié)構(gòu)等)難于表達圖像高層語義內(nèi)容,圖像表達的數(shù)字陣列與通常可以被人類所接受的概念化內(nèi)容之間存在著語義鴻溝。如果不對原始圖像進行預(yù)處理,僅僅根據(jù)整幅圖像的底層物理特征進行檢索,圖像中將包含了大量不相關(guān)的信息。這些不相關(guān)的信息直接影響檢索的準(zhǔn)確性,即使采用相關(guān)反饋技術(shù)也難以取得比較令人滿意的檢索結(jié)果。
因此,本發(fā)明的發(fā)明人亟需構(gòu)思一種新技術(shù)以改善其問題。
發(fā)明內(nèi)容
為了解決上述不足,本發(fā)明提供了一種基于社區(qū)分析的圖像索引并行構(gòu)建方法。
為解決上述技術(shù)問題,本發(fā)明的技術(shù)方案是:
一種基于社區(qū)分析的圖像索引并行構(gòu)建方法,包括如下步驟:
S1:采用并行K均值聚類算法對目標(biāo)圖像實現(xiàn)聚類,所述目標(biāo)圖像由多個視覺關(guān)鍵詞構(gòu)成的特征聚類向量表示;
S2:對聚類得到的每個類分別建立索引;
S3:進行圖像查詢。
進一步地,所述步驟S1具體包括:
S11:提取目標(biāo)圖像和圖像數(shù)據(jù)庫中每幅圖像的顏色特征和紋理特征;
S12:對描述圖像內(nèi)容的高維特征進行降維,得到特征子集;
S13:結(jié)合網(wǎng)格的樣本密度,對特征子集構(gòu)成的數(shù)據(jù)集進行聚類。
進一步地,所述步驟S3具體包括:
S31:將目標(biāo)圖像中提取的降維后的特征子集與所述步驟S1最終所得到的各聚類中心進行匹配,選擇最相似的索引樹;
S32:在最相似的索引樹中,根據(jù)目標(biāo)圖像的所述顏色特征和紋理特征進行檢索,得到相似性匹配結(jié)果。
進一步地,所述步驟S13具體包括:
S131:將降維后的低維數(shù)據(jù)空間劃分成固定大小的網(wǎng)格;
S132:計算每個網(wǎng)格中落入的樣本數(shù)目得到每個格點的樣本密度;
S133:將格點按照其樣本密度排序;
S134:根據(jù)排序結(jié)果得到初始聚類的分類數(shù)和各分類的初始中心;
S135:用K均值方法來模擬數(shù)據(jù)點的分布,得到最終的聚類結(jié)果。
進一步地,所述步驟S12中對高維圖像特征進行降維時,選擇全局顏色矩作為表征圖像內(nèi)容的特征向量。
進一步地,選擇全局顏色矩是選取顏色的一階矩、二階矩和三階矩作為表征圖像的特征向量。
采用上述技術(shù)方案,本發(fā)明至少包括如下有益效果:
本發(fā)明所述的基于社區(qū)分析的圖像索引并行構(gòu)建方法,采用并行K均值聚類算法對圖像塊實現(xiàn)聚類,圖像采用由一系列的視覺關(guān)鍵詞構(gòu)成的特征聚類向量表示,在圖像檢索時能避免線性掃描海量、高維和動態(tài)的特征數(shù)據(jù)庫。采用向量空間模型及語言模型計算每個圖像對的語義相似度,構(gòu)建圖像的語義相似度社會網(wǎng)絡(luò),在此基礎(chǔ)上,基于大規(guī)模社區(qū)分析方法構(gòu)建海量圖像的語義索引。在索引構(gòu)建中采用高維聚類索引空間的某些有意義的子空間計算圖像間的相似度,從而克服聚類索引“維度災(zāi)難”的問題,結(jié)合圖像塊物理特征索引與圖像全局層次的語義索引,提升海量圖像檢索的速度和效果。
附圖說明
圖1為本發(fā)明所述的基于社區(qū)分析的圖像索引并行構(gòu)建方法的流程圖。
具體實施方式
下面結(jié)合附圖和實施例對本發(fā)明進一步說明。
如圖1所示,為符合本發(fā)明的一種基于社區(qū)分析的圖像索引并行構(gòu)建方法,包括如下步驟:
S1:采用并行K均值聚類算法對目標(biāo)圖像實現(xiàn)聚類,所述目標(biāo)圖像由多個視覺關(guān)鍵詞構(gòu)成的特征聚類向量表示;
S2:對聚類得到的每個類分別建立索引;
S3:進行圖像查詢。
進一步地,所述步驟S1具體包括:
S11:提取目標(biāo)圖像和圖像數(shù)據(jù)庫中每幅圖像的顏色特征和紋理特征;
S12:對描述圖像內(nèi)容的高維特征進行降維,得到特征子集;
S13:結(jié)合網(wǎng)格的樣本密度,對特征子集構(gòu)成的數(shù)據(jù)集進行聚類。
進一步地,所述步驟S3具體包括:
S31:將目標(biāo)圖像中提取的降維后的特征子集與所述步驟S1最終所得到的各聚類中心進行匹配,選擇最相似的索引樹;
S32:在最相似的索引樹中,根據(jù)目標(biāo)圖像的所述顏色特征和紋理特征進行檢索,得到相似性匹配結(jié)果。
進一步地,所述步驟S13具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州搜客信息技術(shù)有限公司,未經(jīng)蘇州搜客信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510224042.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





