[發明專利]一種微波掃頻數據的二階頻率選擇方法及裝置有效
| 申請號: | 202010542110.6 | 申請日: | 2020-06-15 |
| 公開(公告)號: | CN111812122B | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 韋真博;張津陽;王俊;杜冬冬;程紹明 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G01N22/04 | 分類號: | G01N22/04;G06N3/00 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 應孔月 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 微波 頻數 頻率 選擇 方法 裝置 | ||
1.一種微波掃頻數據的二階頻率選擇方法,其特征在于,包括:
獲取微波掃頻數據;
對微波掃頻數據進行標準化處理,處理后劃分出衰減訓練數據集和相移訓練數據集,兩數據集均以一張數據表的形式存在,數據表的縱向表示頻率域{f1,f2,…,fi,…,fn},橫向表示樣品域{X1,X2,…,Xj,…,Xm},對應的數據元素是衰減值A或者相移值Phi;
使用隨機森林-遞歸特征消除算法在所述微波掃頻數據上進行頻率選擇,將隨機森林-遞歸特征消除算法中的預設參數作為超參數,改變超參數的取值,生成一系列包含不同頻率的候選頻率子集;該步驟包括:
(2.1)使用隨機森林算法在衰減訓練數據集上訓練樣品屬性預測模型;
(2.2)獲取每個頻率所對應衰減特征的重要性,依據特征重要性對頻率進行排序,找出對應特征的重要性最低的頻率;
(2.3)從衰減訓練數據集中移除對應衰減特征的重要性最低的頻率所對應的衰減特征數據,在更新后的衰減訓練數據集上使用隨機森林算法重新訓練樣品屬性預測模型;
(2.4)重復步驟(2.2)和(2.3),直到衰減訓練數據集中僅剩余PreNum個頻率對應的數據,將該PreNum個頻率組成的集合記作頻率集合FA;
(2.5)使用隨機森林算法在相移訓練數據集上訓練樣品屬性預測模型;
(2.6)獲取每個頻率所對應相移特征的重要性,依據特征重要性對頻率進行排序,找出對應特征的重要性最低的頻率;
(2.7)從相移訓練數據集中移除對應相移特征的重要性最低的頻率所對應的相移特征數據,在更新后的相移訓練數據集上使用隨機森林算法重新訓練樣品屬性預測模型;
(2.8)重復步驟(2.6)和(2.7),直到相移訓練數據集中僅剩余PreNum個頻率對應的數據,將該PreNum個頻率組成的集合記作頻率集合FP;
(2.9)對頻率集合FA和頻率集合FP取交集,得到一個候選頻率子集Fsub;
(2.10)改變隨機森林-遞歸特征消除算法的預設參數PreNum的取值,重復步驟(2.1)至(2.9),得到一系列包含不同頻率的候選頻率子集;
基于不同頻率的候選頻率子集對應的衰減-相移掃頻數據集,建立預測模型;該步驟包括:
每個候選的頻率子集對應有頻率序號子集,使用頻率序號子集分別從所述衰減訓練數據集和相移訓練數據集中抽取出相應的數據,將兩部分數據組合成衰減-相移掃頻數據集;
將每個衰減-相移掃頻數據集作為輸入數據,將樣品屬性值作為輸出數據,使用學習算法建立樣品屬性值的預測模型;
其中每個候選的頻率子集對應有頻率序號子集,使用頻率序號子集分別從所述衰減訓練數據集和相移訓練數據集中抽取出相應的數據,將兩部分數據組合成衰減-相移掃頻數據集;包括:
(4.1)搜索候選頻率子集中的各個頻率在標準化處理后的衰減掃頻數據集或者相移掃頻數據集中的序號,組成頻率序號子集;
(4.2)重復步驟(4.1)直至得到每個候選頻率子集對應的頻率序號子集;
(4.3)按照頻率序號子集從衰減訓練數據集中抽取出對應的數據;
(4.4)按照頻率序號子集從相移訓練數據集中抽取出對應的數據;
(4.5)將分別從衰減訓練數據集和相移訓練數據集中抽取出的兩部分數據進行縱向拼接,得到候選頻率子集對應的衰減-相移掃頻數據集;
(4.6)重復步驟(4.3)-(4.5)直至每個候選頻率子集獲得對應的衰減-相移掃頻數據集;
使用10折交叉驗證評價每一個預測模型的性能,計算得到模型性能的評價指標值;
將所述評價指標作為投票的依據,使用多數投票法,選出最優的頻率子集合,包括:
(6.1)使用R2作為投票依據的指標,對T種算法中每一種算法下選出R2值最高的前k個模型,得出每一個模型對應的頻率子集,在T×k個候選結果上使用多數投票法選出得票數最多的頻率子集,記作
(6.2)使用RMSE作為投票依據的指標,對T種算法中每一種算法下選出RMSE值最低的前k個模型,得出每一個模型對應的頻率子集,在T×k個候選結果上使用多數投票法選出得票數最多的頻率子集,記作
(6.3)使用MAE作為投票依據的指標,對T種算法中每一種算法下選出MAE值最低的前k個模型,得出每一個模型對應的頻率子集,在T×k個候選結果上使用多數投票法選出得票數最多的頻率子集,記作
(6.4)使用多數投票法綜合三個回歸評價指標分別選出的最佳頻率集合和選出最終的最優頻率集合Fopt,若出現同票情況,選擇包含頻率數量最少的作為最優頻率集合Fopt。
2.根據權利要求1所述的一種微波掃頻數據的二階頻率選擇方法,其特征在于,將所述評價指標作為投票的依據,使用多數投票法,選出最優的頻率子集合,包括:
將所述評價指標作為投票的依據,使用多數投票法選擇出最優的預測模型,得出最優的預測模型所對應的衰減-相移掃頻數據集,進而獲得該衰減-相移掃頻數據集所對應的頻率子集,即為最優的頻率子集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010542110.6/1.html,轉載請聲明來源鉆瓜專利網。





