[發明專利]一種基于隨機森林和word2vec的礦工營養代謝評估方法及系統在審
| 申請號: | 202010437480.3 | 申請日: | 2020-05-21 |
| 公開(公告)號: | CN111613331A | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 周孟然;馬祖長;胡鋒;陳炎炎;卞凱;閆鵬程 | 申請(專利權)人: | 安徽理工大學;合肥博諧電子科技有限公司 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H20/60;G06K9/62;G06F17/18 |
| 代理公司: | 西安銘澤知識產權代理事務所(普通合伙) 61223 | 代理人: | 吳林 |
| 地址: | 232001 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 隨機 森林 word2vec 礦工 營養 代謝 評估 方法 系統 | ||
1.一種基于隨機森林和word2vec的礦工營養代謝評估方法,其特征在于,包括以下步驟:
S1:搭建礦工營養代謝分析系統;
S2:采集礦工代謝數據:利用礦工營養代謝分析系統采集若干個礦工的吸入氣體數據A、呼出氣體數據B、個人信息數據C以及代謝的量化表示Output;
S3:礦工個人信息的數字化:采用word2vec算法對個人信息數據C進行詞向量轉化處理,將原始個人文本信息轉化為詞向量D;
S4:特征融合:將礦工的吸入氣體數據A、呼出氣體數據B以及每個礦工個體個人信息的詞向量表達D組合,形成礦工代謝數據Input;
S5:樣本集劃分:將特征融合后的礦工代謝數據樣本按一定的比例隨機劃分成訓練集和預測集;
S6:建立礦工營養代謝的評估模型:將訓練集的數據輸入到隨機森林模型中進行訓練,將預測集用于礦工營養代謝預測效果的驗證,實現礦工營養代謝的評估。
2.如權利要求1所述的一種基于隨機森林和word2vec的礦工營養代謝評估方法,其特征在于,所述步驟S1中,礦工營養代謝分析系統包括礦工吸入氣體采集模塊、礦工呼出氣體檢測模塊、礦工個人信息輸入模塊以及上位機。
3.如權利要求1所述的一種基于隨機森林和word2vec的礦工營養代謝評估方法,其特征在于,所述步驟S2中,所述吸入氣體數據A包括氧氣含量A1、二氧化碳含量A2以及吸入氣體質量A3;所述呼出氣體數據B包括氧氣含量B1、二氧化碳含量B2以及呼出氣體質量B3;所述個人信息數據C包括姓名、性別、年齡、工作地點以及既往病史,所述代謝的量化表示Output為0-100內的數值。
4.如權利要求1所述的一種基于隨機森林和word2vec的礦工營養代謝評估方法,其特征在于,所述步驟S3中轉化步驟如下:
S31:定義Skip-gram模型在已知給定詞wt的前提下預測該詞的上下文wct,則上下文wct可以表示為:
wct=wt-c,…,wt-1,wt+1,…,wt+c (1)
其中,c是給定詞wt的前后詞語數目;
S32:定義Skip-gram模型的優化目標函數為公式(2)的對數似然函數:
其中C表示的是包含所有詞語的語料庫,k表示的是當前詞wt的窗口大小,即當前詞的前后各取k個詞語;
S33:結合Hierachical Softmax算法和負采樣對式中條件概率p(wt+c|wt)進行優化,得到:
其中,vw和v′w分別表示的是詞w的輸入輸出詞向量,W表示的是詞典大小。
5.如權利要求1或3所述的一種基于隨機森林和word2vec的礦工營養代謝評估方法,其特征在于,所述步驟S4中,將所述礦工的吸入氣體數據A中的氧氣含量A1、二氧化碳含量A2以及重量A3和所述呼出氣體數據B中的氧氣含量B1、二氧化碳含量B2以及重量B3以及每個礦工個體個人信息的詞向量表達D依次連接,形成礦工代謝數據Input。
6.如權利要求1所述的一種基于隨機森林和word2vec的礦工營養代謝評估方法,其特征在于,所述步驟S5中,按照4:1的比例將特征融合后的N個礦工代謝數據隨機劃分成訓練集和預測集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽理工大學;合肥博諧電子科技有限公司,未經安徽理工大學;合肥博諧電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010437480.3/1.html,轉載請聲明來源鉆瓜專利網。





