[發明專利]基于隨機森林的數控機床代碼類型識別與異常檢測方法在審
| 申請號: | 202211575175.6 | 申請日: | 2022-12-08 |
| 公開(公告)號: | CN116088420A | 公開(公告)日: | 2023-05-09 |
| 發明(設計)人: | 陸浩維;李中偉;葉曉虎;王曉鵬;金顯吉;馬梓涵;張龍軒;林娜 | 申請(專利權)人: | 哈爾濱工業大學;綠盟科技集團股份有限公司 |
| 主分類號: | G05B19/4063 | 分類號: | G05B19/4063 |
| 代理公司: | 哈爾濱龍科專利代理有限公司 23206 | 代理人: | 呂洪娟 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 隨機 森林 數控機床 代碼 類型 識別 異常 檢測 方法 | ||
1.一種基于隨機森林的數控機床代碼類型識別與異常檢測方法,其特征在于所述方法包括如下步驟:
S1:根據多個廠商的數控機床的編程手冊制定一套指令關鍵字功能表;
S2:對NC代碼的語法規則進行統計,形成一套語法規則庫;
S3:根據NC代碼的語法規則庫和指令關鍵字功能表內容對NC代碼進行特征提取,得到關鍵字特征和語法特征;
S4:將S3得到的關鍵字特征和語法特征構造成特征值矩陣,訓練隨機森林分類器;
S5:將未知類型NC代碼進行預處理與詞法語法檢查;
S6:將S5預處理與詞法語法檢查后的未知類型NC代碼進行特征處理,建立特征值矩陣,輸入S4訓練好的隨機森林分類器中,對NC代碼進行識別。
2.根據權利要求1所述的基于隨機森林的數控機床代碼類型識別與異常檢測方法,其特征在于所述方法的具體步驟如下:
S1:參考多個廠商的數控機床的編程手冊,將各個數控機床的CNC指令和指令對應各個類型數控機床的功能進行統計,形成一套指令關鍵字功能表;
S2:參考S1中不同廠家編程手冊,收集不同廠家的NC代碼語法特征,建立語法規則庫;
S3:對原始NC代碼進行文本預處理,剔除代碼注釋、代碼說明和控制指令無關的信息;當預處理后的文本已經有空格符號、換行符號、換頁符號、分號符號對整個NC代碼文本各個字符串進行劃分的情況下,以符號為分割標志,對各個指令進行提取,達到分詞的目的;當文本無上述字符分割時,參考編程手冊制定NC代碼指令的正則表達式庫,從文本第一個字符開始到文本最后一個字符結束掃描字符串,匹配NC指令關鍵字,將匹配到的NC指令逐個進行提取,實現分詞;
S4:若S3預處理后的文本中的每個被掃描到的指令能夠覆蓋整個預處理文本,不存在不被匹配的字符,則表明NC代碼不存在詞法錯誤,否則存在詞法錯誤并且報警;
S5:將S3預處理后的文本的每個指令利用指令關鍵字功能表進行分析,根據指令關鍵字和代碼所屬的數控機床類型確定指令關鍵字的功能,將指令關鍵字具體字符串設為代碼的特征索引,關鍵字功能的編號設為特征的值;
S6:根據語法規則庫,將程序結束字符、程序開始字符、順序號間隔作為語法特征索引,程序結束具體字符串、程序開始具體字符串、順序號間隔數信息作為特征的值;
S7:將S5收集到的指令關鍵字特征、S6中的語法特征進行機器學習數據集構造,將機器學習數據集進行重復有放回且隨機地抽樣,輸入到ID3決策樹分類器中進行訓練,訓練出決策樹分類器;
S8:將待測NC代碼進行S3的預處理、文本分詞和基于正則表達式的詞法檢測,基于語法規則庫中的語法規則對NC代碼語法進行檢測,如果出現詞法語法錯誤則報錯,如果代碼符合詞法語法規約,則將待測代碼進行特征提取,形成可被決策樹分類器識別的待測樣本;
S9:將S8得到的待測樣本輸入S7訓練好的決策樹分類器,根據各個決策樹的輸出結果投票選擇出投票數最多的數控代碼類型作為輸出結果,即可識別出NC代碼的類型。
3.根據權利要求2所述的基于隨機森林的數控機床代碼類型識別與異常檢測方法,其特征在于所述指令關鍵字功能表的索引為代碼指令關鍵字和數控機床類型,查詢到的值為功能編號。
4.根據權利要求2所述的基于隨機森林的數控機床代碼類型識別與異常檢測方法,其特征在于所述NC代碼語法特征包括各個指令的組合搭配方式、順序號間隔、參數范圍、程序開始結束標志信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學;綠盟科技集團股份有限公司,未經哈爾濱工業大學;綠盟科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211575175.6/1.html,轉載請聲明來源鉆瓜專利網。





