[發明專利]一種圖表識別方法、裝置、設備及存儲介質有效
| 申請號: | 202210118577.7 | 申請日: | 2022-02-08 |
| 公開(公告)號: | CN114155547B | 公開(公告)日: | 2022-07-12 |
| 發明(設計)人: | 吳珂皓;薛逢源;李博巖 | 申請(專利權)人: | 珠海盈米基金銷售有限公司 |
| 主分類號: | G06V30/413 | 分類號: | G06V30/413;G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣東勰思律師事務所 44609 | 代理人: | 趙賽 |
| 地址: | 519000 廣東省珠海*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖表 識別 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種圖表識別方法、裝置、設備及存儲介質,該方法包括:獲取包含圖表數據的文本文件;將文本文件轉換為預設格式的圖片;將圖片輸入圖表定位檢測器中,輸出圖表數據在圖片中的定位結果;其中,圖表定位檢測器由預設的神經網絡經包含樣本圖表數據的樣本數據集訓練得到。本發明中包含圖表數據的文本文件可以是任意格式種類的文本文件,將該文本文件轉換為圖片,則避免了現有技術中需要使用規范的協議來解析文本定位圖表位置的操作,將轉換后的圖片直接輸入預先訓練完成的圖表定位檢測器中,則可以直接輸出圖表數據在圖片中的定位結果,能夠解決現有技術從文本文件中識別圖表效率低下、且識別圖表準確性較低的技術問題。
技術領域
本發明實施例涉及圖像識別技術,尤其涉及一種圖表識別方法、裝置、設備及存儲介質。
背景技術
在數據分析領域,從圖表數據中獲取有效信息最為直觀,圖表數據的形態分析往往是金融、科研等行業領域中重要的分析方法之一,其數據分析的有效性也在各行各業中得到了廣泛的驗證。
由于圖表數據一般都是附著于文本文件而存在,利用圖表數據進行分析時常需要把各文本文件中的圖表單獨提取出來。然而,傳統的圖表提取方法,一種是基于CPU計算設備進行處理,需要預先解析文本文件,導致時間成本過高,提取速度慢、耗時長,有時還需要基于規范的協議來解析文本,對文本文件自身的格式要求較高;另一種是基于數字圖像處理技術來識別圖表,一般是利用圖像二值化來查找圖表,但極易查找到形狀相似、卻并不是真實圖表的非圖表區域,因而識別精準度不夠、準確性較低,同時現有神經網絡中多采用ReLU、PReLU、FReLU激活函數,對空間不敏感忽略了阻礙視覺任務實現顯著改善,靈活性較差。
發明內容
本發明提供一種圖表識別方法、裝置、設備及存儲介質,能夠解決現有技術從文本文件中識別圖表效率低下、且識別圖表準確性較低的技術問題。
第一方面,本發明實施例提供了一種圖表識別方法,所述方法包括:
獲取包含圖表數據的文本文件;
將所述文本文件轉換為預設格式的圖片;
將所述圖片輸入圖表定位檢測器中,輸出所述圖表數據在所述圖片中的定位結果;其中,所述圖表定位檢測器由預設的神經網絡經包含樣本圖表數據的樣本數據集訓練得到。
可選的,預設的神經網絡為Yolov5s網絡或Yolov5l網絡或Yolov5m網絡或Yolov5x網絡,所述神經網絡采用改進的FReLU激活函數,改進的FReLU激活函數表示為y = max(ax,mT(x))+δ,其中T(·)是二維空間條件空間上下文特征提取器,m為與通道相關的自定義值,a為自定義常數,δ為調節值,x為輸入像素參數化池窗口。
可選的,所述圖表定位檢測器的訓練過程,可以包括:
獲取包含樣本圖表數據的樣本數據集,所述樣本數據集包括訓練樣本集和測試樣本集;
采用所述訓練樣本集訓練預設的神經網絡,在所述神經網絡的反向傳播中更新網絡參數,直到所述神經網絡的訓練次數達到預設的訓練次數;
當所述神經網絡的訓練次數達到預設的訓練次數時,將所述測試樣本集輸入所述神經網絡中,輸出得到網絡損失值;
若所述網絡損失值不符合預設的要求,則返回執行所述采用所述訓練樣本集訓練預設的神經網絡,在所述神經網絡的反向傳播中更新網絡參數,直到所述神經網絡的訓練次數達到預設的訓練次數;
若所述網絡損失值符合預設的要求,則保留所述神經網絡當前的網絡參數,確定所述神經網絡為圖表定位檢測器。
可選的,所述獲取包含樣本圖表數據的樣本數據集,可以包括:
獲取樣本圖表數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海盈米基金銷售有限公司,未經珠海盈米基金銷售有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210118577.7/2.html,轉載請聲明來源鉆瓜專利網。





