[發(fā)明專利]例外點(diǎn)抑制的數(shù)據(jù)判別降維方法在審
| 申請(qǐng)?zhí)枺?/td> | 201510325234.8 | 申請(qǐng)日: | 2015-06-15 |
| 公開(公告)號(hào): | CN104966098A | 公開(公告)日: | 2015-10-07 |
| 發(fā)明(設(shè)計(jì))人: | 任傳賢 | 申請(qǐng)(專利權(quán))人: | 中山大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 例外 抑制 數(shù)據(jù) 判別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,更具體地,涉及一種例外點(diǎn)抑制的數(shù)據(jù)判別降維方法。
背景技術(shù)
基于子空間學(xué)習(xí)的數(shù)據(jù)降維方法在智能分析與認(rèn)知系統(tǒng)中得到了充分的重視。線性判別分析(LDA)及其各種改進(jìn)方式因?yàn)槠溆斜O(jiān)督的學(xué)習(xí)方式和簡(jiǎn)單的實(shí)現(xiàn)過程受到了更加廣泛的關(guān)注和研究。
然而在現(xiàn)實(shí)場(chǎng)景中,兩個(gè)方面的缺陷限制了LDA的進(jìn)一步應(yīng)用及推廣。首先,獨(dú)立同分布的基本假設(shè)顯得過于苛刻。對(duì)于那些不滿足這一基本假設(shè)的數(shù)據(jù),就無法從理論上保證得到最優(yōu)解。并且對(duì)于高維數(shù)據(jù)而言,怎樣判別獨(dú)立同分布假設(shè)本身就是十分困難的問題。其次,現(xiàn)實(shí)環(huán)境中采集到的數(shù)據(jù)往往帶有一定程度的噪音和例外點(diǎn),它們的存在將導(dǎo)致子空間不夠穩(wěn)健,并且獨(dú)立同分布的數(shù)據(jù)分布假設(shè)使得模型帶有較大的誤差。在這兩種情況下,使用傳統(tǒng)的均值與協(xié)方差矩陣估計(jì)方法將損失子空間的判別信息。
科研人員在數(shù)據(jù)建模與數(shù)值計(jì)算過程中發(fā)現(xiàn),部分?jǐn)?shù)據(jù)在判別子空間學(xué)習(xí)過程中起了較之其他數(shù)據(jù)更加積極的作用。這樣,如果對(duì)于所有數(shù)據(jù)都不加任何區(qū)分的統(tǒng)計(jì)量估計(jì),不僅顯得不夠合理,也在實(shí)際應(yīng)用過程中有著較弱的表現(xiàn)。因此很有必要重新提煉數(shù)據(jù)的局部結(jié)構(gòu)特征,對(duì)數(shù)據(jù)樣本進(jìn)行合理區(qū)分,對(duì)那些起了積極作用的樣本賦予更大的權(quán)值,才能更加有效的挖掘數(shù)據(jù)蘊(yùn)含的判別信息。通過對(duì)費(fèi)歇爾線性判別分析與局部保持投影基本思想的組合,LFDA能夠?qū)W習(xí)出帶有局部結(jié)構(gòu)保持特性的判別子空間。L1-Graph將稀疏表示方法引入到局部近鄰樣本刻畫過程,從而有效挖掘出樣本之間的稀疏表達(dá)特性,然而在此基礎(chǔ)上得到有助于分類的子空間。哈爾濱工業(yè)大學(xué)的徐勇教授提出了兩步驟的LLDA方法。首先對(duì)于任意給定的測(cè)試樣本y,在訓(xùn)練集中通過稀疏表示的方法選出y的一組相關(guān)(近鄰)樣本,然后基于這些相關(guān)樣本執(zhí)行經(jīng)典的費(fèi)歇爾判別準(zhǔn)則,這樣可以進(jìn)一步淘汰冗余樣本,從而減小了計(jì)算復(fù)雜度。最近,Mu?et?al.提出了自適應(yīng)的嵌入框架處理多類別數(shù)據(jù)降維問題。
值得注意的是,以上算法或方法都可以歸結(jié)為“關(guān)系加權(quán)”的基本思路。換言之,通過對(duì)樣本之間的“近鄰關(guān)系”(近鄰,非近鄰)進(jìn)行再次估計(jì)與分析,任意一組樣本之間的關(guān)系(有監(jiān)督的類屬關(guān)系與無監(jiān)督的近鄰關(guān)系)得到了基于局部幾何結(jié)構(gòu)的調(diào)整,從而更加有助于判別分析。然而,這類算法的一個(gè)主要缺陷在于,如果數(shù)據(jù)存在一定程度的例外點(diǎn),那么例外點(diǎn)與正常數(shù)據(jù)點(diǎn)之間的關(guān)系也將因此而放大,從而影響判別子空間的學(xué)習(xí)。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提出一種例外點(diǎn)抑制的數(shù)據(jù)判別降維方法。該方法能夠有效的求解最優(yōu)判別子空間,估計(jì)出各個(gè)樣本在學(xué)習(xí)過程中的貢獻(xiàn)值,能夠較好的處理帶有遮擋和例外點(diǎn)的數(shù)據(jù)。
為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為:
一種例外點(diǎn)抑制的數(shù)據(jù)判別降維方法,包括以下步驟:
S1.輸入帶有類別標(biāo)簽1、2、…、C的原始數(shù)據(jù),C是類別總數(shù);
S2.在第k個(gè)類別內(nèi)部,1≤k≤C,求出其中每一對(duì)數(shù)據(jù)點(diǎn)與之間的關(guān)系權(quán)值其中σ是一個(gè)先驗(yàn)參數(shù);然后求出該類別中第i個(gè)數(shù)據(jù)點(diǎn)與其它數(shù)據(jù)點(diǎn)之間的權(quán)值以及權(quán)值之和其中的nk表示第k個(gè)類別中數(shù)據(jù)點(diǎn)個(gè)數(shù);
S3.列出第k類的數(shù)據(jù)點(diǎn)與所有同類別數(shù)據(jù)點(diǎn)之間的權(quán)值,統(tǒng)一使用S2步驟中的權(quán)值之和做歸一化處理,得到的最終權(quán)值k=1,2,…,C;i=1,2,…,nk,
S4.對(duì)第k個(gè)類別中的數(shù)據(jù)點(diǎn),依據(jù)各自的樣本權(quán)值計(jì)算出該類別的樣本均值向量和協(xié)方差矩陣:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué),未經(jīng)中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510325234.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:智能打車系統(tǒng)
- 下一篇:基于多攝像頭的手指靜脈采集裝置
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 判別設(shè)備、判別方法和計(jì)算機(jī)程序
- 物體檢測(cè)裝置以及物體檢測(cè)方法
- 圖像處理裝置以及圖像處理方法
- 模擬傳感器的種類判別裝置
- 一種水電站砂層土質(zhì)液化評(píng)判方法
- 基于CNN神經(jīng)網(wǎng)絡(luò)的急性心肌梗死定性自動(dòng)判別系統(tǒng)
- 一種基于CNN神經(jīng)網(wǎng)絡(luò)的急性心肌梗死定位自動(dòng)判別系統(tǒng)
- 一種活體人臉的判別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 糖網(wǎng)病眼底圖像的樣本數(shù)據(jù)標(biāo)注系統(tǒng)
- 一種循環(huán)漸進(jìn)式局部放電判別方法





