[發明專利]一種采用機器學習進行圖紙布局分類識別的方法在審
| 申請號: | 202110040792.5 | 申請日: | 2021-01-13 |
| 公開(公告)號: | CN112733735A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 儲琳琳;宗明;張宇俊;肖業凡;朱夏;王經緯;顧志銘;翟清綱;辛洪波;張曉莉 | 申請(專利權)人: | 國網上海市電力公司;上??坡沸畔⒓夹g有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N20/00;G06T5/30;G06T7/11 |
| 代理公司: | 上海兆豐知識產權代理事務所(有限合伙) 31241 | 代理人: | 章蔚強 |
| 地址: | 200122 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 采用 機器 學習 進行 圖紙 布局 分類 識別 方法 | ||
1.一種采用機器學習進行圖紙布局分類識別的方法,其特征在于,包括如下步驟:
步驟1,圖紙布局特征提取,具體步驟如下;
步驟1.1,圖形文件的圖像化轉換,將不同類型的圖紙文件,分頁轉換為圖紙圖像;
步驟1.2,對圖紙圖像進行灰度化處理后,使用OTSU算法完成二值化處理,得到二值化圖紙圖像;
步驟1.3,二值化圖紙圖像,提取圖紙邊框及分割線的線條,通過腐蝕ERODE及膨脹DILATE算法,去除無關圖像、線條噪聲后,使用水平及垂直的單像素寬度矩形形態轉換方法,提取圖形中的水平集垂直線條,合并形成圖紙的線圖圖像;
步驟1.4,對線圖圖像進行歸一化處理,將不同大小的圖紙線條圖像縮放為統一大?。?/p>
步驟1后得到統一大小的灰度圖像,即為圖紙布局特征圖像;
步驟2,機器學習模型訓練,具體步驟如下;
步驟2.1,訓練及驗證數據集的準備,選擇一定數量的各類型圖紙文件,執行第一步的圖紙布局特征提取處理,并進行人工布局分類標簽;通過擦除圖像中部分線條,修改線條顏色灰度的方法,生成擴展訓練及驗證圖像集;得到滿足模型訓練及驗證的一定規模的圖紙布局特征圖像集合;
步驟2.2,模型的選擇與訓練,使用訓練圖像集,測試圖像集數據,基于InceptionResNetV2卷積神經網絡基礎模型,通過多次訓練和驗證,生成模型權重數據,參數如下:
優化器:RMSProp算法;
LOSS函數:Categorical Crossentropy;
步驟3,圖紙區域布局分類,具體步驟如下;
步驟3.1,對待分類的圖紙集合,執行第一步圖紙布局特征提取的預處理過程,得到歸一化的圖紙要素特征圖像集合;
步驟3.2,使用經第二步訓練得到的模型參數,對待分類的圖紙要素特征圖像集合進行分類,獲得圖紙要素布局的分類結果;
圖紙要素布局的分類結果可在匹配相應布局參數后,供后續做圖形邊界,表格文字等處理使用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網上海市電力公司;上??坡沸畔⒓夹g有限公司,未經國網上海市電力公司;上海科路信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110040792.5/1.html,轉載請聲明來源鉆瓜專利網。





