[發(fā)明專利]一種基于關(guān)系矩陣正則化增強(qiáng)表示的圖像檢索方法有效
| 申請?zhí)枺?/td> | 201310399734.7 | 申請日: | 2013-09-05 |
| 公開(公告)號: | CN103440332A | 公開(公告)日: | 2013-12-11 |
| 發(fā)明(設(shè)計(jì))人: | 楊育彬;李亞楠 | 申請(專利權(quán))人: | 南京大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 江蘇圣典律師事務(wù)所 32237 | 代理人: | 胡建華 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 關(guān)系 矩陣 正則 增強(qiáng) 表示 圖像 檢索 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于圖像檢索領(lǐng)域,特別是一種基于關(guān)系矩陣正則化增強(qiáng)方法的圖像檢索方法。
背景技術(shù)
在科技日益發(fā)達(dá)的今天,隨著圖像獲取處理設(shè)備和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和普及應(yīng)用,以圖像為代表的新一代信息資源已經(jīng)成為與材料、能源具有同等重要地位的戰(zhàn)略資源,其數(shù)據(jù)量也已達(dá)到海量規(guī)模,成為當(dāng)前信息處理和信息資源建設(shè)的主體。由于圖像具有信息量大、內(nèi)容豐富、表現(xiàn)力強(qiáng)等優(yōu)點(diǎn),因此對海量規(guī)模的圖像進(jìn)行有效的信息處理和應(yīng)用,已成為眾多實(shí)際應(yīng)用領(lǐng)域的核心問題。
由于當(dāng)前圖像數(shù)據(jù)已呈海量規(guī)模,并且在不斷增長,傳統(tǒng)的技術(shù)手段已經(jīng)無法適應(yīng)這種需求,這對圖像的組織、分析、檢索和管理等技術(shù)都提出了全新的挑戰(zhàn)。盡管目前基于內(nèi)容的圖像檢索研究已經(jīng)取得了很大的進(jìn)展,有效克服了基于手工標(biāo)注的文本信息進(jìn)行圖像檢索的局限性,但離真正的實(shí)用階段還有一定的距離,尤其是對圖像的高層語義理解方面。大部分方法還僅僅停留在圍繞圖像的底層特征進(jìn)行語義描述和學(xué)習(xí)這一層次,相對于人類能夠理解和運(yùn)用的豐富多彩的語義概念,底層數(shù)據(jù)特征的表達(dá)能力尚有很大局限,因此底層特征與高層語義之間存在著較大差距,即所謂的“語義鴻溝”(semantic?gap),從而導(dǎo)致在圖像檢索的準(zhǔn)確率和效率上還遠(yuǎn)遠(yuǎn)達(dá)不到實(shí)際應(yīng)用的需要,尤其是對圖像的多種豐富語義進(jìn)行準(zhǔn)確有效的理解和檢索方面。時(shí)至今日,圖像檢索中的“語義鴻溝”問題仍然沒有得到很好的解決,仍然是困擾研究者的關(guān)鍵性難題之一。在解決這一難題的眾多技術(shù)當(dāng)中,基于相關(guān)反饋的圖像檢索技術(shù)提供了一種可行的解決方案。早期的相關(guān)反饋技術(shù)主要集中于基于相關(guān)反饋的信息,修正查詢向量即圖像特征,例如對查詢向量的每一維數(shù)值重新分配權(quán)值,調(diào)整查詢向量的位置等。近年來,由于流形學(xué)習(xí)的興起,許多研究者轉(zhuǎn)向通過流形學(xué)習(xí)技術(shù),將高維的圖像數(shù)據(jù)空間降維來探求圖像特征空間的內(nèi)在結(jié)構(gòu),其主要的理論假設(shè)是將圖像看成是一種流形,目標(biāo)就是發(fā)現(xiàn)其內(nèi)在的結(jié)構(gòu)信息。發(fā)現(xiàn)嵌入在高維數(shù)據(jù)中的低維子空間是學(xué)習(xí)數(shù)據(jù)潛在流形的重要手段,流形學(xué)習(xí)中子空間的學(xué)習(xí)方法都是基于局部分析的。通過流形學(xué)習(xí)的方法學(xué)習(xí)其所對應(yīng)的低維的語義子空間,這與流形學(xué)習(xí)假設(shè)整個(gè)數(shù)據(jù)集只在局部滿足歐氏距離相吻合,因此通過分析圖像數(shù)據(jù)的局部信息,發(fā)掘局部的語義流形結(jié)構(gòu)對圖像檢索來說更加有意義。
發(fā)明內(nèi)容
發(fā)明目的:本發(fā)明為了解決現(xiàn)有技術(shù)中的問題,提出了一種基于關(guān)系矩陣正則化增強(qiáng)表示的圖像檢索方法,有效地解決大規(guī)模數(shù)據(jù)下,圖像的快速準(zhǔn)確檢索問題。
發(fā)明內(nèi)容:本發(fā)明公開了一種基于關(guān)系矩陣正則化增強(qiáng)方法的圖像檢索方法,該方法從圖像實(shí)例庫中檢索圖像,包含如下步驟:
步驟1,輸入待檢索圖像;
步驟2,抽取待檢索圖像和圖像實(shí)例庫中圖像的特征,用N維向量描述每幅圖像,N=112,得到圖像實(shí)例特征庫U=(u1,…,uM),ui為圖像實(shí)例庫第i幅圖像的特征,i=1,…M,M為圖像實(shí)例庫中所包含的圖像數(shù),以及待檢索圖像的特征v,所述圖像實(shí)例庫包括50個(gè)以上的圖像類,每一個(gè)圖像類表示一個(gè)語義類,每個(gè)圖像類包括600幅以上的圖像;
步驟3,從圖像實(shí)例特征庫中選取P個(gè)圖像類,P取值范圍20~50,從每一個(gè)圖像類選取n幅圖像,n取值范圍100~500,P個(gè)圖像類共有n×P張圖像構(gòu)成樣本數(shù)據(jù)X;例如發(fā)明的一個(gè)實(shí)施例中,從中選取30個(gè)圖像類,每一類表示了不同的語義類,每一類有100幅圖像,共有3000張圖像構(gòu)成樣本數(shù)據(jù)X,X=(x1,…,xq),q=n×P,xi為樣本數(shù)據(jù)中第i幅圖像的特征,q為樣本數(shù)據(jù)大小,X為112×q維的矩陣;
步驟4,基于譜圖理論的流形學(xué)習(xí)算法,對樣本數(shù)據(jù)X構(gòu)建增強(qiáng)關(guān)系矩陣W、正例關(guān)系矩陣WP和反例關(guān)系矩陣WN;
步驟5,對構(gòu)建的關(guān)系矩陣W進(jìn)行增強(qiáng),初步建立增強(qiáng)關(guān)系矩陣W′;
步驟6,借助概率轉(zhuǎn)移矩陣正則化增強(qiáng)關(guān)系矩陣W′得到正則化增強(qiáng)關(guān)系矩陣W*;
步驟7,根據(jù)正則化增強(qiáng)關(guān)系矩陣W*構(gòu)建目標(biāo)方程,計(jì)算廣義特征矩陣A;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué),未經(jīng)南京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310399734.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 在集成電路器件中求解線性矩陣
- 矩陣計(jì)算裝置、矩陣計(jì)算方法
- 一種數(shù)據(jù)聚類的方法、裝置及Spark大數(shù)據(jù)平臺
- 適用于黑白圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 矩陣
- 矩陣/密鑰生成裝置、矩陣/密鑰生成系統(tǒng)、矩陣結(jié)合裝置、矩陣/密鑰生成方法、程序
- 矩陣運(yùn)算電路、矩陣運(yùn)算裝置及矩陣運(yùn)算方法
- 矩陣乘法計(jì)算方法和裝置
- 數(shù)據(jù)讀取方法、裝置、介質(zhì)和計(jì)算設(shè)備





