[發(fā)明專利]一種文本檢測方法、裝置及計算機存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201910706780.4 | 申請日: | 2019-08-01 |
| 公開(公告)號: | CN110472539B | 公開(公告)日: | 2022-09-30 |
| 發(fā)明(設(shè)計)人: | 劉晉;張鑫;任皓亮 | 申請(專利權(quán))人: | 上海海事大學(xué) |
| 主分類號: | G06V30/413 | 分類號: | G06V30/413;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 上海互順專利代理事務(wù)所(普通合伙) 31332 | 代理人: | 成秋麗 |
| 地址: | 201306 上海市*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文本 檢測 方法 裝置 計算機 存儲 介質(zhì) | ||
本發(fā)明提供了一種文本檢測方法,應(yīng)用于文本檢測技術(shù)領(lǐng)域,包括:獲取待檢測圖片;采用預(yù)設(shè)神經(jīng)網(wǎng)絡(luò)模型對所述待檢測圖片進行遍歷,生成共享特征圖,并生成錨盒;將錨盒作為文本提議,采用雙向長短記憶網(wǎng)絡(luò)BLSTM訓(xùn)練文本提議之間的上下文信息,并生成特征向量;根據(jù)分類模型和回歸模型,對所述特征向量進行判斷是否為文本,并你和文本提議具體位置,生成縱坐標(biāo)方向的平移量和縮放量;根據(jù)所述平移量和所述縮放量,合并錨盒,并生成文本檢測圖像。以及提供了一種文本檢測裝置及計算機存儲介質(zhì)。應(yīng)用本發(fā)明實施例,能夠很好的保留待處理紅外圖像和待處理可見光圖像中的信息減少圖像的損失,提高文本檢測后的效果。
技術(shù)領(lǐng)域
本發(fā)明涉及文本檢測技術(shù)領(lǐng)域,尤其涉及一種文本檢測方法、裝置及計算機存儲介質(zhì)。
背景技術(shù)
文字作為人類社會信息交流的載體,對整個社會發(fā)展有著十分重要的影響。隨著時代的不斷發(fā)展,人們需要處理的文字信息越來越多,傳統(tǒng)的人工識別與分析難以滿足日益增長的需要。
機器的文字識別和文字的檢測是密不可分的,文字檢測是識別的前提條件,文本檢測不是一項簡單的任務(wù),自然場景下有各種各樣的因素會影響到文字檢測的效果,比如文本存在多種分布、文本存在多個方向、多種語言混合等。
在提高文本檢測的準(zhǔn)確性的同時,通過更快的基于區(qū)域卷積神經(jīng)網(wǎng)絡(luò)Faster-RCNN,連接文本提議網(wǎng)絡(luò)CTPN等方法被提出來解決傳統(tǒng)方法的不足。而連接文本提議網(wǎng)絡(luò)CTPN中引入了循環(huán)網(wǎng)絡(luò),因此模型參數(shù)量較多,運行速度較慢。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)之缺陷,提供了一種文本檢測方法、裝置及計算機存儲介質(zhì),旨在解決現(xiàn)有技術(shù)中模型過大,模型參數(shù)量過多,文本檢測速度慢的不足,提供用于圖像文字檢測的快速有效方法。
本發(fā)明是這樣實現(xiàn)的:
本發(fā)明提供一種文本檢測方法,包括:
獲取待檢測圖片;
采用預(yù)設(shè)神經(jīng)網(wǎng)絡(luò)模型對所述待檢測圖片進行遍歷,生成共享特征圖,并生成錨盒;
將錨盒作為文本提議,采用雙向長短記憶網(wǎng)絡(luò)BLSTM訓(xùn)練文本提議之間的上下文信息,并生成特征向量;
根據(jù)分類模型和回歸模型,對所述特征向量進行判斷是否為文本,并你和文本提議具體位置,生成縱坐標(biāo)方向的平移量和縮放量;
根據(jù)所述平移量和所述縮放量,合并錨盒,并生成文本檢測圖像。
進一步地,所述預(yù)設(shè)神經(jīng)網(wǎng)絡(luò)模型的生成步驟,包括:
對采集的圖片進行進行標(biāo)注,生成所示的用于訓(xùn)練融合了PVANet的圖像特征抽取網(wǎng)絡(luò)的數(shù)據(jù)集標(biāo)注;
采用數(shù)據(jù)集標(biāo)注,對神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練,獲取每一個圖像特征抽取結(jié)果;
根據(jù)圖像特征抽取結(jié)果確定神經(jīng)網(wǎng)絡(luò)模型是否合格;
將合格后的神經(jīng)網(wǎng)絡(luò)模型確定為預(yù)設(shè)神經(jīng)網(wǎng)絡(luò)模型。
進一步地,所述預(yù)設(shè)神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)包括:
依次相連的第一卷積層、第二卷積層、第三卷積層;且所述第一卷積層、所述第二卷積層和所述第三卷積層分別帶有C-Relu激活函數(shù);
還包括第四卷積層和第五卷積層,所述第四卷積層和所述第五卷積層Inception結(jié)構(gòu);
將所述第三卷積層、所述第四卷積層和所述第五卷積層生成的特征圖進行融合生成共享特征圖。
進一步地,所述將所述第三卷積層、所述第四卷積層和所述第五卷積層生成的特征圖進行融合生成共享特征圖的步驟,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海海事大學(xué),未經(jīng)上海海事大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910706780.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





