[發(fā)明專利]一種基于多尺度特征提取的圖像檢索方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810298622.5 | 申請(qǐng)日: | 2018-04-03 |
| 公開(公告)號(hào): | CN108764246A | 公開(公告)日: | 2018-11-06 |
| 發(fā)明(設(shè)計(jì))人: | 樊曉東;李建圃 | 申請(qǐng)(專利權(quán))人: | 南昌奇眸科技有限公司 |
| 主分類號(hào): | G06K9/46 | 分類號(hào): | G06K9/46;G06K9/62;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 330000 江西省南昌市南昌高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)高*** | 國省代碼: | 江西;36 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多尺度特征 圖像檢索 檢索系統(tǒng) 圖像特征 梯度方向直方圖 圖像特征數(shù)據(jù)庫 分割圖像區(qū)域 圖像檢索結(jié)果 信息檢索領(lǐng)域 方法提取 檢索結(jié)果 圖像輸入 多尺度 漏檢率 魯棒性 滑窗 匹配 檢索 量化 圖像 模糊 | ||
本發(fā)明涉及信息檢索領(lǐng)域,具體為一種基于多尺度特征提取的圖像檢索方法,該圖像檢索方法包括以下步驟:用戶將待檢索的圖像輸入到檢索系統(tǒng);檢索系統(tǒng)采用多尺度特征提取的方法提取待檢圖像的特征;將提取得到的圖像特征與檢索系統(tǒng)內(nèi)的圖像特征數(shù)據(jù)庫進(jìn)行匹配,得到圖像檢索結(jié)果。本發(fā)明所述的多尺度特征提取具體為用多尺度滑窗分割圖像區(qū)域,然后采用模糊量化法獲取窗口的梯度方向直方圖特征,圖像特征描述更加準(zhǔn)確。因此,采用本發(fā)明所述方法進(jìn)行圖像檢索,漏檢率低、檢索結(jié)果準(zhǔn)確,魯棒性好。
技術(shù)領(lǐng)域
本發(fā)明涉及信息檢索領(lǐng)域,具體為一種基于多尺度特征提取的圖像檢索方法。
背景技術(shù)
隨著科技的飛速發(fā)展,計(jì)算機(jī)和信息網(wǎng)絡(luò)普及,各種信息數(shù)據(jù)的數(shù)量正以驚人的速度增長。如何方便、準(zhǔn)確、高效地從龐大的信息數(shù)據(jù)中準(zhǔn)確獲取所需信息已經(jīng)成為人們關(guān)注的焦點(diǎn)。各大社交平臺(tái)和電商平臺(tái)等存在海量的圖像信息,圖像檢索成為常見的檢索方式。圖像檢索按描述圖像內(nèi)容方式的不同可以分為兩類,一類是基于文本的圖像檢索(TBIR,Text Based Image Retrieval),另一類是基于內(nèi)容的圖像檢索(CBIR,ContentBased Image Retrieval)。基于文本的圖像檢索是指用戶可以根據(jù)自己的興趣提供查詢關(guān)鍵字,檢索系統(tǒng)根據(jù)用戶提供的查詢關(guān)鍵字找出那些標(biāo)注有該查詢關(guān)鍵字對(duì)應(yīng)的圖片,最后將查詢的結(jié)果返回給用戶。這種圖像檢索方式由于易于實(shí)現(xiàn),且在標(biāo)注時(shí)有人工介入,所以其查準(zhǔn)率也相對(duì)較高。基于文本的圖像檢索比較適用于小規(guī)模的圖像搜索,而對(duì)于大量的圖像檢索需耗費(fèi)巨大的人力物力。此外,由于查詢關(guān)鍵詞是用戶自己定義的,很容易出現(xiàn)定義不準(zhǔn)確,圖片與描述不符導(dǎo)致檢索結(jié)果的準(zhǔn)確率低。
基于內(nèi)容的圖像檢索在近十幾年來得到飛速發(fā)展,它利用計(jì)算機(jī)對(duì)圖像進(jìn)行分析,建立圖像特征矢量描述并存入圖像特征庫,當(dāng)用戶輸入一張查詢圖像時(shí),用相同的特征提取方法提取查詢圖像的特征得到查詢向量,然后在某種相似性度量準(zhǔn)則下計(jì)算查詢向量到特征庫中各個(gè)特征的相似性大小,最后按相似性大小進(jìn)行排序并順序輸出對(duì)應(yīng)的圖片。基于內(nèi)容的圖像檢索技術(shù)將圖像內(nèi)容的表達(dá)和相似性度量交給計(jì)算機(jī)進(jìn)行自動(dòng)的處理,克服了采用文本進(jìn)行圖像檢索所面臨的缺陷,并且充分發(fā)揮了計(jì)算機(jī)長于計(jì)算的優(yōu)勢(shì),大大提高了檢索的效率。不過,其缺點(diǎn)也是存在的,主要表現(xiàn)為特征描述以及相似性度量準(zhǔn)則直接影響檢索結(jié)果。因此,準(zhǔn)確描述圖像特征成為圖像檢索的關(guān)鍵。
發(fā)明內(nèi)容
本發(fā)明解決的技術(shù)問題是:現(xiàn)有的圖像檢索方法受主觀判斷的影響大,或者采用的圖像特征描述和相似度度量方法不能檢索得到預(yù)期的結(jié)果,漏檢率高、魯棒性差。
本發(fā)明的目的在于提供一種基于多尺度特征提取的圖像檢索方法,準(zhǔn)確描述圖像特征,提高圖像檢索結(jié)果的可靠性及檢索系統(tǒng)的魯棒性。本發(fā)明所述的圖像檢索方法應(yīng)用于商標(biāo)圖像檢索將大大提高商標(biāo)檢索的速度和準(zhǔn)確性。
具體來說,針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供了如下技術(shù)方案:
一種基于多尺度特征提取的圖像檢索方法,該方法包括以下步驟:
(1)用戶將待檢索的圖像輸入到檢索系統(tǒng);
(2)檢索系統(tǒng)采用多尺度特征提取的方法提取待檢圖像的特征;
(3)將步驟(2)提取得到的待檢圖像特征與檢索系統(tǒng)的圖像特征數(shù)據(jù)庫進(jìn)行匹配,根據(jù)匹配結(jié)果確定檢索結(jié)果,并將結(jié)果提供給用戶。
優(yōu)選的,步驟(2)所述的多尺度特征提取包括采用多尺度滑窗分割圖像區(qū)域,所述多尺度滑窗具有水平和垂直滑動(dòng)步長。
優(yōu)選的,所述滑窗的水平滑動(dòng)步長范圍為0.1w-0.2w,垂直滑動(dòng)步長范圍為0.1h-0.2h。
優(yōu)選的,所述滑窗是以圖像的左上角為起點(diǎn),按照水平滑動(dòng)步長、垂直滑動(dòng)步長,從左到右、從上到下滑動(dòng),得到一系統(tǒng)不同尺度的窗口圖像。
優(yōu)選的,步驟(2)所述的多尺度特征提取得到的圖像特征包括梯度方向直方圖特征。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南昌奇眸科技有限公司,未經(jīng)南昌奇眸科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810298622.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種檢索網(wǎng)站首頁的檢索系統(tǒng)及方法
- 影像檢索系統(tǒng)的光路布局及其達(dá)成方法
- 驗(yàn)證信息存儲(chǔ)和檢索系統(tǒng)的配置的設(shè)備和方法
- 一種信息檢索系統(tǒng)評(píng)測(cè)方法和裝置
- 一種檢索系統(tǒng)的檢測(cè)方法和裝置
- 一種基于網(wǎng)絡(luò)的計(jì)算機(jī)信息檢索系統(tǒng)
- 文本域圖像檢索系統(tǒng)和方法
- 一種數(shù)字病理圖像檢索系統(tǒng)
- 檢索方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 人臉檢索系統(tǒng)的評(píng)價(jià)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)





