[發明專利]一種基于改進EAST算法的柵格地質圖文本檢測方法有效
| 申請號: | 202011184567.0 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112215226B | 公開(公告)日: | 2022-06-07 |
| 發明(設計)人: | 王茂發;韓定良;高光大;王子民;潘明華 | 申請(專利權)人: | 桂林電子科技大學 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06K9/62;G06N3/04;G06T7/11;G06V10/26;G06V10/774;G06V10/764;G06V10/82 |
| 代理公司: | 桂林市華杰專利商標事務所有限責任公司 45112 | 代理人: | 陸夢云 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 east 算法 柵格 地質圖 文本 檢測 方法 | ||
1.一種基于改進EAST算法的柵格地質圖文本檢測方法,其特征是:包括:
(1)提取地質圖像的文本區域一般采用將交叉部分視為矩形的簡化計算方法;S1、S2、S3、S4;每次只需要計算S1-S4部分的面積,其計算可通過公式(1)-(4)得到;而最后總的文本區域S由上述提到的四個梯形S1、S2、S3、S4間相互交疊的部分組成,需對四個梯形面積進行加減法計算,得到的文本區域S的計算公式,如公式(5)所示:
S1=((x3-x0)*(y3+y0))/2 (1)
S2=((x1-x0)*(y1+y0))/2 (2)
S3=((x2-x1)*(y2+y1))/2 (3)
S4=((x2-x3)*(y3+y2))/2 (4)
S=(S2+S3)-(S1+S4) (5)
而pi(i=1,2,3,4)代表矩形的四個頂點,x0至x3為四個頂點的橫坐標,而y0至y3為四個頂點的縱坐標;
對于四邊形的每條邊D(pi,p(imod4)+1),使其每個頂點分別縮進Nri和Nri(i mod 4)+1,其中N是一個超參數,針對不同比例尺的圖像,根據地質圖像的比例尺將N(0.0~1.0)設置為不同的值,優化檢測結果;
(2)按比例尺切割訓練樣本,在訓練過程中,采用多尺度的訓練方法,對于比例尺為1∶N,大小為M*M的地質圖像,在訓練階段為每張圖像設置的尺度為X*X*X,其中X=[M/N];每張圖像選擇對應比例尺的尺度組成多尺度圖像訓練集;
(3)引入Focal-loss損失函數作為分類損失函數用來表示圖像分割預測值和真實值的相似度,公式如下:
FL(pt)=-(1-pt)γlog(pt) (6)
這里的γ稱作focusing parameter,γ>=0,而pt則表示第t個樣本預測為1這個類的概率;
利用動態調整權重的策略對文本區域損失Lg進行改進,使Lg中的權重對不同比例尺的地質圖像中的各個尺度的文字保持一致;對于一張比例尺為1∶N的地質圖像,同一批次訓練樣本中的文本區域都包含相同的權重Wi,圖像中的像素點i應該滿足公式(7):
其中S及Si的定義如前文所述;當圖像樣本中Si的數量增加時,損失的權值會受到抑制;當圖像樣本中Si的數量減少時,尺度較小的文本區域權值會變大,尺度較大的文本區域權值會相應變小,權重會相對一致,改進后的Lg回歸損失如公式(8)所示:
式中:yhard為將文本框中面積大于或等于某個閾值的框設置為困難樣本,表示預測的幾何形狀,R*是其相應的標注框;計算相交矩形的寬度和高度;
(4)在局部感知NMS的基礎上,利用傾斜的NMS處理地質圖像數據集中的傾斜文本,其步驟如下:
1)對網絡輸出的旋轉矩形文本檢測框按照得分進行降序排列,并存儲到一個降序列表里;
2)依次遍歷上述的降序列表,將當前的文本框和剩余的其它文本框進行交集計算的到相應的相交點集合;
3)根據判斷相交點集合組成的凸多邊形的面積,計算每兩個文本檢測框的IOU;對于大于閾值的文本框進行過濾,保留小于閾值的文本框;
4)得到最終的文本矩形檢測框。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林電子科技大學,未經桂林電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011184567.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種建筑施工用腳手架
- 下一篇:一種鱘魚凍干粉的制備方法和鱘魚凍干粉





