[發(fā)明專利]一種面向低秩圖像特征分析的類別標(biāo)簽恢復(fù)方法在審
| 申請?zhí)枺?/td> | 202010085541.4 | 申請日: | 2020-02-10 |
| 公開(公告)號: | CN111275125A | 公開(公告)日: | 2020-06-12 |
| 發(fā)明(設(shè)計(jì))人: | 時(shí)庭庭;劉浩;應(yīng)曉清;王凱巡;沈港;黃震;廖榮生;魏國林;魏冬;周健;田偉 | 申請(專利權(quán))人: | 東華大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 徐俊 |
| 地址: | 201600 上*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 圖像 特征 分析 類別 標(biāo)簽 恢復(fù) 方法 | ||
本發(fā)明涉及一種面向圖像可靠分類的類別標(biāo)簽恢復(fù)方法,屬于機(jī)器視覺技術(shù)領(lǐng)域。本發(fā)明將標(biāo)簽傳播過程、PCA降維和LDA分類結(jié)合起來,公開了一種面向低秩圖像特征分析的類別標(biāo)簽恢復(fù)方法。所提方法通過引入標(biāo)簽傳播過程,獲得標(biāo)簽恢復(fù)后的數(shù)據(jù)集,隨后執(zhí)行PCA可靠降維,以降低可靠數(shù)據(jù)集的維度,同時(shí)保持可靠數(shù)據(jù)集中對方差貢獻(xiàn)最大的信息,最后提取LDA特征,得到鑒別分析的低秩特征。所提方法通過對含有缺失標(biāo)簽的數(shù)據(jù)集進(jìn)行預(yù)處理,還原缺失的類別標(biāo)簽,并通過可靠降維提取出最具判別性的特征,使得后續(xù)的最近鄰分類器更加精確可靠;提高了樣本標(biāo)簽數(shù)據(jù)的魯棒性,使得分類模型更加有效。
技術(shù)領(lǐng)域
本發(fā)明涉及一種面向低秩圖像特征分析的類別標(biāo)簽恢復(fù)方法,屬于機(jī)器視覺技術(shù)領(lǐng)域。
背景技術(shù)
線性鑒別分析(LDA)可以利用樣本圖像已知的類別標(biāo)簽,尋找最有助于圖像分類的投影子空間,屬于一種有監(jiān)督的機(jī)器學(xué)習(xí)方法。LDA從高維數(shù)據(jù)中提取出最具判別性的低秩特征,這些特征有助于將同一類別的所有樣本聚集在一起、不同類別的樣本盡量分開,即選取使樣本類間散度與樣本類內(nèi)散度比值最大的特征。圖像數(shù)據(jù)集的高效預(yù)處理是相當(dāng)困難的,一般采取的有效方法是盡量保持?jǐn)?shù)據(jù)集中所包含的主要信息,并對其維度進(jìn)行削減。典型地,主成分分析(PCA)能夠在最大限度地保留原始數(shù)據(jù)信息量的基礎(chǔ)上,對數(shù)據(jù)集進(jìn)行有效的降維分析。PCA降維可以快速地確定圖像數(shù)據(jù)集各個(gè)成分的權(quán)重,減少噪聲數(shù)據(jù)對LDA分類的負(fù)面影響。
標(biāo)簽信息在基于LDA的圖像分類中起著至關(guān)重要的作用,但是實(shí)際獲得的數(shù)據(jù)集往往存在標(biāo)簽缺失問題。如果忽視這個(gè)問題,那么訓(xùn)練出來的分類模型可能會(huì)出現(xiàn)各種問題,若舍去不含標(biāo)簽的樣本圖像,則會(huì)導(dǎo)致模型欠擬合或低識(shí)別率。因此,需要在分類前對數(shù)據(jù)集進(jìn)行預(yù)處理,確保盡可能多的樣本都有正確無誤的類別標(biāo)簽。
發(fā)明內(nèi)容
本發(fā)明的目的是為解決在圖像分類前對數(shù)據(jù)集進(jìn)行預(yù)處理,確保盡可能多的樣本都有正確無誤的類別標(biāo)簽的技術(shù)問題,提供一種對缺失標(biāo)簽的數(shù)據(jù)集進(jìn)行恢復(fù)的方法,以便魯棒地執(zhí)行基于LDA的圖像最近鄰分類。
為達(dá)到解決上述問題的目的,本發(fā)明所采取的技術(shù)方案是提供一種面向低秩圖像特征分析的類別標(biāo)簽恢復(fù)方法,包括以下步驟:
步驟1:待處理的原始樣本集A中含有n幅樣本圖像,共有C個(gè)類別,第c類中有Nc個(gè)樣本,c∈{1,2,...,C}。每幅圖像的尺寸均為S×S像素,將這S×S維的圖像矩陣?yán)梢粋€(gè)S2維的向量,n幅圖像組成一個(gè)S2×n維的樣本矩陣X=[x1,x2,...,xn],每幅圖像對應(yīng)的類別標(biāo)簽y1,...,yn∈{1,2,...,C},原始標(biāo)簽矩陣Y=[y1,y2,...,yn];對原始標(biāo)簽矩陣進(jìn)行隨機(jī)丟失操作;產(chǎn)生u個(gè)無重復(fù)的隨機(jī)數(shù),并在原始標(biāo)簽矩陣Y=[y1,y2,...,yn]中將u個(gè)隨機(jī)數(shù)對應(yīng)序號處的標(biāo)簽值丟棄,進(jìn)而將原始樣本集A劃分為有標(biāo)簽樣本和無標(biāo)簽樣本;設(shè)丟失的標(biāo)簽數(shù)為u,保留的標(biāo)簽數(shù)為l,則l+u=n。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東華大學(xué),未經(jīng)東華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010085541.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





