[發(fā)明專利]一種文本檢測方法、裝置及計算機存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201910706780.4 | 申請日: | 2019-08-01 |
| 公開(公告)號: | CN110472539B | 公開(公告)日: | 2022-09-30 |
| 發(fā)明(設計)人: | 劉晉;張鑫;任皓亮 | 申請(專利權)人: | 上海海事大學 |
| 主分類號: | G06V30/413 | 分類號: | G06V30/413;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 上海互順專利代理事務所(普通合伙) 31332 | 代理人: | 成秋麗 |
| 地址: | 201306 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 檢測 方法 裝置 計算機 存儲 介質(zhì) | ||
1.一種文本檢測方法,其特征在于,所述方法包括:
獲取待檢測圖片;
采用預設神經(jīng)網(wǎng)絡模型對所述待檢測圖片進行遍歷,生成共享特征圖,并生成錨盒;
將錨盒作為文本提議,采用雙向長短記憶網(wǎng)絡BLSTM訓練文本提議之間的上下文信息,并生成特征向量;
根據(jù)分類模型和回歸模型,對所述特征向量進行判斷是否為文本,并擬合 文本提議具體位置,生成縱坐標方向的平移量和縮放量;
根據(jù)所述平移量和所述縮放量,合并錨盒,并生成文本檢測圖像。
2.如權利要求1所述的文本檢測方法,其特征在于,所述預設神經(jīng)網(wǎng)絡模型的生成步驟,包括:
對采集的圖片進行進行標注,生成所示的用于訓練融合了PVANet的圖像特征抽取網(wǎng)絡的數(shù)據(jù)集標注;
采用數(shù)據(jù)集標注,對神經(jīng)網(wǎng)絡模型進行訓練,獲取每一個圖像特征抽取結果;
根據(jù)圖像特征抽取結果確定神經(jīng)網(wǎng)絡模型是否合格;
將合格后的神經(jīng)網(wǎng)絡模型確定為預設神經(jīng)網(wǎng)絡模型。
3.如權利要求1或2所述的文本檢測方法,其特征在于,所述預設神經(jīng)網(wǎng)絡模型的結構包括:
依次相連的第一卷積層、第二卷積層、第三卷積層;且所述第一卷積層、所述第二卷積層和所述第三卷積層分別帶有C-Relu激活函數(shù);
還包括第四卷積層和第五卷積層,所述第四卷積層和所述第五卷積層Inception結構;
將所述第三卷積層、所述第四卷積層和所述第五卷積層生成的特征圖進行融合生成共享特征圖。
4.如權利要求3所述的文本檢測方法,其特征在于,所述將所述第三卷積層、所述第四卷積層和所述第五卷積層生成的特征圖進行融合生成共享特征圖的步驟,包括:
采用所述第四卷積層對所述第三卷積層輸出的特征圖進行2×2最大池化處理,并輸出至所述第五卷積層;
對所述第五卷積層的輸出的特征圖進行上采樣;
在判斷所述第五卷積層的輸出特征圖分辨率和所述第四卷積層輸出的特征圖分辨率一致后進行通道維度的連接,生成目標數(shù)量個特征圖;
通過卷積核的尺寸為1*1、卷積核個數(shù)為512的卷積層,進行圖像特征抽取獲得共享特征圖;以卷積核中心為錨點,以卷積操作中的步長為錨點間隔,遍歷共享特征圖生成錨盒。
5.如權利要求4所述的文本檢測方法,其特征在于,所述根據(jù)分類模型和回歸模型,對所述特征向量進行判斷是否為文本,并你和文本提議具體位置,生成縱坐標方向的平移量和縮放量的步驟,包括:
將所述特征向量送入垂直錨點回歸機制的錨點回歸擬合錨盒的最優(yōu)高度:
采用邊界回歸計算相對的錨點的邊界框的預測垂直坐標,獲得預測的坐標和真實坐標根據(jù)預測的坐標和真實坐標,獲得平移量和縮放量。
6.如權利要求1所述的文本檢測方法,其特征在于,所述根據(jù)所述平移量和所述縮放量,合并錨盒,并生成文本檢測圖像的步驟,包括:
獲取相鄰的錨盒,并組成一組;
進行錨盒的合并,成文本檢測圖像。
7.如權利要求6所述的文本檢測方法,其特征在于,所述獲取相鄰的錨盒,并組成一組的步驟,包括:
獲取相鄰的錨盒;
判斷相鄰的兩個錨盒Bi和錨盒Bj是否滿足條件:錨盒Bi到錨盒Bj的距離為水平方向的設定值;錨盒Bi和錨盒Bj之間的距離小于預設數(shù)量個像素;錨盒Bi和錨盒Bj的面積重疊率大于預設值。
8.一種文本檢測裝置,其特征在于,所述裝置包括處理器、以及通過通信總線與所述處理器連接的存儲器;其中,
所述存儲器,用于存儲文本檢測程序;
所述處理器,用于執(zhí)行所述文本檢測程序,以實現(xiàn)如權利要求1至7中任一項所述的文本檢測方法的 步驟。
9.一種計算機存儲介質(zhì),其特征在于,所述計算機存儲介質(zhì)存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執(zhí)行,以使所述一個或者多個處理器執(zhí)行如權利要求1至7中任一項所述的文本檢測方法的 步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海海事大學,未經(jīng)上海海事大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910706780.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





