[發明專利]基于有監督顯式流形學習算法的電子鼻數據挖掘方法有效
| 申請號: | 201210382585.9 | 申請日: | 2012-10-10 |
| 公開(公告)號: | CN102890718A | 公開(公告)日: | 2013-01-23 |
| 發明(設計)人: | 田逢春;賈鵬飛;樊澍;馮敬偉;劉濤;劉穎;趙貞貞 | 申請(專利權)人: | 重慶大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 400044 重慶市*** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 監督 流形 學習 算法 電子 數據 挖掘 方法 | ||
1.基于顯式流形學習算法的電子鼻數據挖掘方法,其特征是,該方法包括以下步驟:
步驟1、氣體樣本的采集
調整實驗室溫、濕度環境,使得電子鼻系統的各傳感器能夠正常工作,對不同種類氣體中的每一個樣本,均進行不少于20次的氣體采集實驗,獲得電子鼻訓練用數據;
步驟2、氣體樣本的特征提取
對獲得的電子鼻訓練數據進行特征提取,并構成特征值矩陣X,矩陣X的維數是[m×n],其中m表示特征值點的總數,在數值上等于氣體采樣實驗的總次數,n表示每一個特征值點的維數,由傳感器陣列中傳感器個數和特征提取方法共同決定,常見的特征提取方法主要包括:
1、基于傳感器原始響應曲線,該類方法主要對氣體傳感器的響應曲線進行特征提取,常用的特征包括:最大值、斜率、響應曲線的積分面積等;
2、基于擬合曲線,該類方法首先使用適當的模型擬合原始響應曲線,然后再提取模型參數作為特征,常見的用于電子鼻數據擬合的模型有多項式模型、指數模型、分式函數模型等;
3、基于變換域的特征提取方法,首先對原始響應進行適當的變換,然后提取變換系數作為特征,常見的電子鼻數據變換域特征提取方法包括:傅里葉變換、小波變換等;
步驟3、確定特征值矩陣中各點的近鄰
確定特征值矩陣中每個點的近鄰,常用的確定近鄰關系有兩種方法:
1、ε-ball法:在以點xi,i=1,..n為圓心,以ε為半徑的范圍內的所有點都是xi的近鄰;
2、k-nearest法:離點xi最近的k個點是xi的近鄰且k<n;
步驟4、計算任意兩特征值點的關系
如果特征值矩陣X中點xj是xi的近鄰點,那么兩者之間的關系wi,j按照某一規則取一個不為零的正數且xi與xj的關系越緊密wi,j的值就越大;如果特征值點xj不是xi的近鄰點,那么兩者之間的關系wi,j=0;
步驟5、顯式流形學習算法的數據降維
YT=AXT
其中,YT是低維目標矩陣Y的轉置形式,矩陣Y的維數是[m×l],m表示點的總數,等于矩陣X中特征值點的總數,l表示每一個點的維數且l<n,A是顯式映射系數矩陣,特征值矩陣中的點xi和點xj的近鄰關系通過wi,j傳遞給目標矩陣Y中的點yi和點yj,常用的近鄰關系傳遞方法如下式所示:
其中,yi和點yj分別是目標矩陣Y中元素且i≠j,若特征值矩陣X中點xi和xj是近鄰且兩者距離越近,其近鄰關系wi,j的值就會越大,此時上式要取最小值,則(yi-yj)2項的值就必須盡量的小,如此,將特征值矩陣中的點xi和點xj的近鄰關系傳遞給了目標矩陣Y中的點yi和點yj,然后通過求解上式所描述的最優化問題得到顯式映射系數矩陣A,得到顯式映射表達式并完成降維。
2.基于有監督顯式流形學習算法的電子鼻數據挖掘方法包括上述全部步驟,并在步驟2后增加一個步驟A:
步驟A、考慮類別信息確定特征值矩陣中各點的近鄰
將近鄰關系的確定限定在特征值矩陣中的同類別點之間進行,如果點xi和xj來源于同一類氣體,則進入步驟3判斷xj是否是xi的近鄰點;如果點xi和xj來源于不同氣體,則跳過近鄰關系判斷,直接令點xi和xj的關系wi,j=0。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210382585.9/1.html,轉載請聲明來源鉆瓜專利網。





