[發(fā)明專利]一種基于自適應(yīng)圖濾波器下的特征聚類方法在審
| 申請?zhí)枺?/td> | 201810431379.X | 申請日: | 2018-05-08 |
| 公開(公告)號: | CN108875782A | 公開(公告)日: | 2018-11-23 |
| 發(fā)明(設(shè)計)人: | 舒華忠;陳曉鵬;孔佑勇;伍家松;楊淳沨 | 申請(專利權(quán))人: | 東南大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京經(jīng)緯專利商標代理有限公司 32200 | 代理人: | 葛瀟敏 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 濾波器 特征聚類 特征數(shù)據(jù) 先驗知識 自適應(yīng) 構(gòu)建 數(shù)據(jù)結(jié)構(gòu)圖 抽頭 標簽記錄 分類結(jié)果 平滑濾波 數(shù)據(jù)映射 特征要求 數(shù)據(jù)源 降噪 濾波 權(quán)重 數(shù)組 維度 匹配 規(guī)范化 全局 | ||
本發(fā)明公開一種基于自適應(yīng)圖濾波器下的特征聚類方法,包括如下步驟:步驟1,特征數(shù)據(jù)規(guī)范化,同一維度的特征要求單位化;步驟2,特征數(shù)據(jù)標簽記錄,提供一定量的先驗知識;步驟3,構(gòu)建基于數(shù)據(jù)源的圖信號,將數(shù)據(jù)映射到數(shù)據(jù)結(jié)構(gòu)圖上,獲取初始圖信號s(known);步驟4,全變分平滑濾波,獲得降噪后的圖信號s(true);步驟5,圖濾波器自匹配,獲得抽頭數(shù)組h;步驟6,全局濾波,獲得分類結(jié)果s(pred)。此種方法可增強對先驗知識的利用,構(gòu)建新的圖信號權(quán)重邊。
技術(shù)領(lǐng)域
本發(fā)明屬于信號處理技術(shù)領(lǐng)域,涉及圖信號處理理論,特別涉及一種基于自適應(yīng)圖濾波器下的特征聚類方法。
背景技術(shù)
圖信號處理(Graph Signal Processing,GSP)是當前研究非結(jié)構(gòu)化數(shù)據(jù)極為有效的方式,在數(shù)據(jù)分類、壓縮感知、線性預測等方面有著廣泛的應(yīng)用。圖信號理論已經(jīng)建立起一套相對完整的圖信號理論,包括了圖信號定義、圖濾波器、圖的頻率定義等等。在圖理論中,最早由Sandryhaila等人提出用濾波器的方式將傳統(tǒng)機器學習下數(shù)據(jù)分類問題轉(zhuǎn)化為數(shù)字信號處理下(DSP)的濾波器匹配問題。在GF(Graph Filter)算法下解決分類問題時,需要建立索引矩陣,構(gòu)成圖的鄰接矩陣為全連接陣。然而在該方法下,需要圖是無向?qū)嵱驁D(Undirected Real Graph),并且需保證邊的權(quán)重(Weighted Edge)為正值。因此,在構(gòu)圖過程中,有大量計算資源的需求。而且由于濾波器抽頭數(shù)在一開始被限定,也降低了優(yōu)化匹配速度。圖信號下的分類問題是一個復雜的問題。因為圖信號的建立過程不同,因此噪聲環(huán)境也復雜不一。在GF(Graph Filter)算法下,對這一類存在噪聲的圖信號分類效果不是很出色。
發(fā)明內(nèi)容
本發(fā)明的目的,在于提供一種基于自適應(yīng)圖濾波器下的特征聚類方法,其可增強對先驗知識的利用,構(gòu)建新的圖信號權(quán)重邊。
為了達成上述目的,本發(fā)明的解決方案是:
一種基于自適應(yīng)圖濾波器下的特征聚類方法,包括如下步驟:
步驟1,特征數(shù)據(jù)規(guī)范化,同一維度的特征要求單位化;
步驟2,特征數(shù)據(jù)標簽記錄,提供一定量的先驗知識;
步驟3,構(gòu)建基于數(shù)據(jù)源的圖信號,將數(shù)據(jù)映射到數(shù)據(jù)結(jié)構(gòu)圖上,獲取初始圖信號s(known);
步驟4,全變分平滑濾波,獲得降噪后的圖信號s(true);
步驟5,圖濾波器自匹配,獲得抽頭數(shù)組h;
步驟6,全局濾波,獲得分類結(jié)果s(pred)。
上述步驟2的具體過程是:從特征數(shù)據(jù)中隨機抽取一定量的樣本,并賦予一定的標簽值,正例賦+1,負例賦-1,其余位被選中的特征數(shù)據(jù)賦0。
上述步驟3的具體過程是:
步驟3.1,假設(shè)數(shù)據(jù)數(shù)量為N,每條特征為L×K的信息矩陣;索引圖G=(A,V),將數(shù)據(jù)源中每一個獨立數(shù)據(jù)直接映射為獨立的圖頂點,其頂點組成頂點集合V;
步驟3.2,Ui表示圖信號上頂點i的信息矩陣(L×K),dnm表示圖信號中頂點n和頂點m數(shù)據(jù)之間的特征距離,有如下定義:
dnm=‖Un-Um‖F
其中,Un、Um分別表示圖信號上頂點n、m的信息矩陣;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學,未經(jīng)東南大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810431379.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 會員特征數(shù)據(jù)統(tǒng)計方法及特征數(shù)據(jù)統(tǒng)計系統(tǒng)
- 人臉特征數(shù)據(jù)獲取系統(tǒng)
- 生物特征數(shù)據(jù)檢測裝置
- 學生特征數(shù)據(jù)挖掘系統(tǒng)
- 學生特征數(shù)據(jù)挖掘系統(tǒng)
- 時間序列數(shù)據(jù)特征量提取裝置、時間序列數(shù)據(jù)特征量提取方法和時間序列數(shù)據(jù)特征量提取程序
- 特征數(shù)據(jù)庫的更新、數(shù)據(jù)特征的確定方法、裝置及設(shè)備
- 生理特征數(shù)據(jù)測量裝置
- 特征大數(shù)據(jù)提取裝置
- 數(shù)據(jù)特征處理方法及數(shù)據(jù)特征處理裝置





