[發(fā)明專利]一種多維參數(shù)識別方法及裝置有效
| 申請?zhí)枺?/td> | 201710772738.3 | 申請日: | 2017-08-31 |
| 公開(公告)號: | CN107609582B | 公開(公告)日: | 2023-10-10 |
| 發(fā)明(設計)人: | 蕭偉;劉雪松;凌婭;陳勇;王振中;姜曉紅;畢宇安;李頁瑞;包樂偉;章晨峰;王磊;陳永杰;杜定益 | 申請(專利權)人: | 江蘇康緣藥業(yè)股份有限公司;浙江大學 |
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06F18/24 |
| 代理公司: | 北京律和信知識產權代理事務所(普通合伙) 11446 | 代理人: | 謝清萍 |
| 地址: | 222047 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 多維 參數(shù) 識別 方法 裝置 | ||
1.一種多維參數(shù)識別方法,其特征在于,包括:
采集多個訓練樣本,組成訓練樣本集,每個訓練樣本包括多種過程參數(shù),每種過程參數(shù)具有相應的屬性參數(shù)和類別,其中,所述屬性參數(shù)和類別的組合有多種;
根據(jù)所述訓練樣本集中的類別,獲取所述訓練樣本集的分布傳遞信息值;
根據(jù)所述分布傳遞信息值,獲取每種過程參數(shù)的信息增益;
選擇信息增益最大的過程參數(shù)作為分裂節(jié)點,建立決策樹;
根據(jù)決策樹,對新數(shù)據(jù)進行類別識別。
2.根據(jù)權利要求1所述的方法,其特征在于,所述獲取所述訓練樣本集的分布傳遞信息值包括:通過以下計算公式得到所述分布傳遞信息值:
info(S)=-∑Pi*log2(Pi),其中,info(S)為訓練樣本集的分布傳遞信息值,Pi為訓練樣本屬于第i個類別的概率。
3.根據(jù)權利要求1所述的方法,其特征在于,所述獲取每種過程參數(shù)的信息增益包括:通過以下計算公式得到所述信息增益:
其中,info(S)為訓練樣本集的分布傳遞信息值,info(Sv)為某一屬性參數(shù)的分布傳遞信息值,為所述某一屬性參數(shù)在某一類別的概率,Varies(A)為屬性參數(shù)的集合。
4.根據(jù)權利要求1所述的方法,其特征在于,所述組成訓練樣本集之前還包括:校驗訓練樣本的有效性,包括:檢測每一個訓練樣本中過程參數(shù)和類別是否完整,若否,則剔除該訓練樣本;和/或
組成訓練樣本集之后還包括:校驗訓練樣本集的有效性,包括:檢測過程參數(shù)對應的屬性參數(shù)是否完整,若否,則判定所述訓練樣本集無效。
5.根據(jù)權利要求1所述的方法,其特征在于,所述選擇信息增益最大的過程參數(shù)作為分裂節(jié)點,建立決策樹包括以下步驟:
以信息增益最大的過程參數(shù)作為根節(jié)點,以其對應的屬性參數(shù)為第一枝節(jié)點;
判斷各屬性參數(shù)對應的類別是否一致,若是,則將該類別作為葉節(jié)點,否則將信息增益排序上次大的過程參數(shù)作為第二枝節(jié)點,重復上述步驟,直至得到類別作為葉節(jié)點。
6.根據(jù)權利要求5所述的方法,其特征在于,若根節(jié)點、各枝節(jié)點相同,且葉節(jié)點不同,則統(tǒng)計訓練樣本集中所述根節(jié)點、各枝節(jié)點下的葉節(jié)點數(shù)量,若統(tǒng)計數(shù)量一致,則隨機舍棄其中任意一個葉節(jié)點,否則舍棄數(shù)量較低的葉節(jié)點。
7.根據(jù)權利要求1所述的方法,其特征在于,同一個訓練樣本中的過程參數(shù)為根據(jù)關鍵質量屬性篩選得到的關鍵過程參數(shù),所述關鍵質量屬性為根據(jù)過程知識系統(tǒng)中的工段而選擇的屬性參數(shù)。
8.一種多維參數(shù)識別裝置,其特征在于,包括以下模塊:
數(shù)據(jù)采集模塊,用于采集多個訓練樣本,組成訓練樣本集,每個訓練樣本包括多種過程參數(shù),每種過程參數(shù)具有相應的屬性參數(shù)和類別,其中,所述屬性參數(shù)和類別的組合有多種;
分布傳遞模塊,用于根據(jù)所述訓練樣本集中的類別,獲取所述訓練樣本集的分布傳遞信息值;
增益模塊,用于根據(jù)所述分布傳遞信息值,獲取每種過程參數(shù)的信息增益;
決策樹模塊,用于選擇信息增益最大的過程參數(shù)作為分裂節(jié)點,建立決策樹;
識別模塊,用于根據(jù)決策樹,對新數(shù)據(jù)進行類別識別。
9.根據(jù)權利要求8所述的裝置,其特征在于,還包括:
第一校驗模塊,用于在組成訓練樣本集之前,校驗訓練樣本的有效性,包括:檢測每一個訓練樣本中過程參數(shù)和類別是否完整,若否,則剔除該訓練樣本;和/或
第二校驗模塊,用于在組成訓練樣本集之后,校驗訓練樣本集的有效性,包括:檢測過程參數(shù)對應的屬性參數(shù)是否完整,若否,則判定所述訓練樣本集無效。
10.根據(jù)權利要求8所述的裝置,其特征在于,所述分布傳遞模塊通過以下計算公式得到所述分布傳遞信息值:
info(S)=-∑Pi*log2(Pi),其中,info(S)為訓練樣本集的分布傳遞信息值,Pi為訓練樣本屬于第i個類別的概率;
所述增益模塊通過以下計算公式得到所述信息增益:
其中,info(S)為訓練樣本集的分布傳遞信息值,info(Sv)為某一屬性參數(shù)的分布傳遞信息值,為所述某一屬性參數(shù)在某一類別的概率,Varies(A)為屬性參數(shù)的集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇康緣藥業(yè)股份有限公司;浙江大學,未經(jīng)江蘇康緣藥業(yè)股份有限公司;浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710772738.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





