[發明專利]工業圖紙的信息處理方法、裝置、電子設備和存儲介質在審
| 申請號: | 202011208091.X | 申請日: | 2020-11-03 |
| 公開(公告)號: | CN112417996A | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 吳志偉;潘家賢;汪明潔;郭舒寧;祝貞雪 | 申請(專利權)人: | 珠海格力電器股份有限公司;珠海聯云科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/34;G06K9/62;G06N3/12 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 王英 |
| 地址: | 519070 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 工業 圖紙 信息處理 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了一種工業圖紙的信息處理方法、裝置、電子設備和存儲介質。用于解決信息獲取速度慢,在海量數據庫中進行特征匹配效率低下的問題。申請實施例中,首先對工業圖紙進行文字識別,得到工業圖紙內的字符串信息;然后采用預先訓練好的分類模型對字符串信息進行分類識別,得到工業圖紙對應的產品類別;在該產品類別對應的圖紙信息庫中,查找與該字符串信息匹配的指定圖紙信息;若查找到與字符串信息匹配的圖紙信息,則將查找到的指定圖紙信息進行輸出。
技術領域
本申請涉及圖像識別領域,特別涉及一種工業圖紙的信息處理方法、裝置、電子設備和存儲介質。
背景技術
隨著科學技術的不斷進步,人工智能技術越來越深入到實際業務場景中,在實際的業務場景中,對于圖片識別、語義識別等先進的智能技術給人們的實際工作和生活都帶來了很大的便利。
但是,在實際的業務工作中,尤其在工業制圖圖紙信息獲取的方面仍存在技術手段落后。仍存在信息獲取速度慢,準確度無法保證等問題;對于后續工作的開展造成很大的困難。相關技術中的圖紙識別方法已經遠遠不能滿足實際業務的需要。
發明內容
本申請的目的是提供一種工業圖紙的信息處理方法、裝置、電子設備和存儲介質,用于解決以下問題:信息獲取速度慢,在海量數據庫中進行特征匹配效率低下。
第一方面,本申請實施例提供了一種工業圖紙的信息處理方法,所述方法包括:
對所述工業圖紙進行文字識別,得到所述工業圖紙內的字符串信息;
基于預先訓練好的分類模型對所述字符串信息進行分類識別,得到所述工業圖紙對應的產品類別;
在所述產品類別對應的圖紙信息庫中,查找與所述字符串信息匹配的指定圖紙信息;
若查找到與所述字符串信息匹配的圖紙信息,則將查找到的所述指定圖紙信息進行輸出。
在一個實施例中,所述方法還包括:
若查找不到與所述字符串信息匹配的圖紙信息,則將所述字符串信息分配到指定任務集合中。
在一個實施例中,所述對所述工業圖紙進行文字識別,得到所述工業圖紙內的字符串信息,包括:
對所述工業圖紙進行文字區域檢測,得到所述工業圖紙中的文本塊區域;
從所述工業圖紙中裁剪出所述文本塊區域;
將所述文本塊區域輸入至預先訓練好的文字識別模型,得到所述工業圖紙內的所述字符串信息。
在一個實施例中,所述基于預先訓練好的分類模型對所述字符串信息進行分類識別之前,所述方法還包括:
采用遺傳算法模型對所述字符串信息進行信息提取,得到所述字符串信息對應的關鍵詞;
所述基于預先訓練好的分類模型對所述字符串信息進行分類識別,包括:
將所述關鍵詞輸入至所述分類模型對所述字符串信息進行分類識別。
在一個實施例中,所述采用遺傳算法模型對所述字符串信息進行信息提取,得到所述字符串信息對應的關鍵詞,包括:
采用詞嵌入技術將所述字符串信息轉換為文本向量信息;
對所述文本向量信息進行特征提取,得到所述文本向量信息的指定特征;
根據特征與關鍵詞之間的映射關系,獲取所述指定特征對應的關鍵詞。
在一個實施例中,所述方法還包括:
根據以下方法訓練所述遺傳算法模型:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海格力電器股份有限公司;珠海聯云科技有限公司,未經珠海格力電器股份有限公司;珠海聯云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011208091.X/2.html,轉載請聲明來源鉆瓜專利網。





