[發(fā)明專(zhuān)利]一種圖文標(biāo)識(shí)檢測(cè)識(shí)別方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202010497450.1 | 申請(qǐng)日: | 2020-06-03 |
| 公開(kāi)(公告)號(hào): | CN111652219B | 公開(kāi)(公告)日: | 2023-08-04 |
| 發(fā)明(設(shè)計(jì))人: | 鐘藝豪;李百川;蔡銳濤 | 申請(qǐng)(專(zhuān)利權(quán))人: | 有米科技股份有限公司 |
| 主分類(lèi)號(hào): | G06V30/19 | 分類(lèi)號(hào): | G06V30/19;G06V30/146 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 李婷婷 |
| 地址: | 510006 廣東省廣州*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖文 標(biāo)識(shí) 檢測(cè) 識(shí)別 方法 裝置 服務(wù)器 存儲(chǔ) 介質(zhì) | ||
本發(fā)明提供一種圖文標(biāo)識(shí)檢測(cè)識(shí)別方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì),確定待進(jìn)行圖文標(biāo)識(shí)檢測(cè)識(shí)別的圖像;將圖像輸入至預(yù)訓(xùn)練的圖文標(biāo)識(shí)檢測(cè)模型預(yù)測(cè)圖像中的至少一個(gè)第一圖文標(biāo)識(shí)區(qū)域;根據(jù)預(yù)訓(xùn)練的圖文標(biāo)識(shí)識(shí)別模型對(duì)圖像在第一圖文標(biāo)識(shí)區(qū)域的圖像內(nèi)容進(jìn)行圖文標(biāo)識(shí)識(shí)別得到第一圖文標(biāo)識(shí)區(qū)域的第一識(shí)別結(jié)果;利用預(yù)訓(xùn)練的OCR檢測(cè)識(shí)別模型對(duì)圖像進(jìn)行字符類(lèi)圖文標(biāo)識(shí)檢測(cè)識(shí)別得到圖像的至少一個(gè)第二圖文標(biāo)識(shí)區(qū)域和每個(gè)第二圖文標(biāo)識(shí)區(qū)域的第二識(shí)別結(jié)果;基于第一圖文標(biāo)識(shí)區(qū)域、第一識(shí)別結(jié)果、第二圖文標(biāo)識(shí)區(qū)域和第二識(shí)別結(jié)果確定圖像的圖文標(biāo)識(shí)區(qū)域和圖文標(biāo)識(shí)區(qū)域的識(shí)別結(jié)果。本發(fā)明能夠提高網(wǎng)絡(luò)識(shí)別效果和降低網(wǎng)絡(luò)訓(xùn)練消耗。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,更具體地說(shuō),涉及一種圖文標(biāo)識(shí)檢測(cè)識(shí)別方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)。
背景技術(shù)
圖文標(biāo)識(shí)是公司或產(chǎn)品的標(biāo)識(shí)符,一個(gè)設(shè)計(jì)良好的圖文標(biāo)識(shí)既能表現(xiàn)豐富的品牌文化,又能起到良好的推廣作用。圖文標(biāo)識(shí)經(jīng)常見(jiàn)于圖片或視頻廣告中,能為公司或產(chǎn)品帶來(lái)很大的曝光量,而圖文標(biāo)識(shí)檢測(cè)識(shí)別技術(shù)能自動(dòng)檢測(cè)并識(shí)別圖片或視頻中的圖文標(biāo)識(shí)信息,在商品溯源追蹤、廣告營(yíng)銷(xiāo)分析、侵權(quán)查詢等領(lǐng)域有著巨大的應(yīng)用前景。其中,圖文標(biāo)識(shí)可以為具有特定商業(yè)場(chǎng)景的Logo。
傳統(tǒng)通用物體檢測(cè)識(shí)別技術(shù)已有相對(duì)成熟的研究,而圖文標(biāo)識(shí)由于其差異不一(不同品牌可能有類(lèi)似的圖文標(biāo)識(shí)樣式)、大小不一、種類(lèi)繁多等情形,傳統(tǒng)通用物體檢測(cè)識(shí)別技術(shù)對(duì)圖文標(biāo)識(shí)檢測(cè)識(shí)別的效果不盡人意。
目前雖然通過(guò)網(wǎng)絡(luò)模型能夠?qū)崿F(xiàn)對(duì)圖文標(biāo)識(shí)的檢測(cè)識(shí)別,但是大多將圖文標(biāo)識(shí)檢測(cè)和圖文標(biāo)識(shí)識(shí)別放在同一個(gè)網(wǎng)絡(luò)中,同時(shí)輸出圖文標(biāo)識(shí)區(qū)域和圖文標(biāo)識(shí)類(lèi)別。這種圖文標(biāo)識(shí)檢測(cè)識(shí)別技術(shù)當(dāng)圖文標(biāo)識(shí)類(lèi)別基數(shù)非常大時(shí),不僅訓(xùn)練網(wǎng)絡(luò)需要的資源消耗很大、可能造成網(wǎng)絡(luò)不收斂的情況,而且每當(dāng)新增一個(gè)圖文標(biāo)識(shí)類(lèi)別時(shí),都需要重新訓(xùn)練一次網(wǎng)絡(luò),代價(jià)太大。并且,目前的圖文標(biāo)識(shí)檢測(cè)識(shí)別技術(shù)要么側(cè)重于對(duì)圖形類(lèi)圖文標(biāo)識(shí)的檢測(cè)識(shí)別,要么側(cè)重于對(duì)字符類(lèi)的圖文標(biāo)識(shí)的檢測(cè)識(shí)別,檢測(cè)識(shí)別效果單一,圖文標(biāo)識(shí)檢測(cè)識(shí)別效果并不理想。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種圖文標(biāo)識(shí)檢測(cè)識(shí)別方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì),以在提高網(wǎng)絡(luò)識(shí)別效果的基礎(chǔ)上,降低網(wǎng)絡(luò)訓(xùn)練消耗。技術(shù)方案如下:
本發(fā)明第一方面公開(kāi)一種圖文標(biāo)識(shí)檢測(cè)識(shí)別方法,包括:
確定待進(jìn)行圖文標(biāo)識(shí)檢測(cè)識(shí)別的圖像;
將所述圖像輸入至預(yù)訓(xùn)練的圖文標(biāo)識(shí)檢測(cè)模型預(yù)測(cè)所述圖像中的至少一個(gè)第一圖文標(biāo)識(shí)區(qū)域;
根據(jù)預(yù)訓(xùn)練的圖文標(biāo)識(shí)識(shí)別模型對(duì)所述圖像在所述第一圖文標(biāo)識(shí)區(qū)域的圖像內(nèi)容進(jìn)行圖文標(biāo)識(shí)識(shí)別得到所述第一圖文標(biāo)識(shí)區(qū)域的第一識(shí)別結(jié)果;
利用預(yù)訓(xùn)練的OCR檢測(cè)識(shí)別模型對(duì)所述圖像進(jìn)行字符類(lèi)圖文標(biāo)識(shí)檢測(cè)識(shí)別得到所述圖像的至少一個(gè)第二圖文標(biāo)識(shí)區(qū)域和每個(gè)所述第二圖文標(biāo)識(shí)區(qū)域的第二識(shí)別結(jié)果;
基于所述第一圖文標(biāo)識(shí)區(qū)域、所述第一圖文標(biāo)識(shí)區(qū)域的第一識(shí)別結(jié)果、第二圖文標(biāo)識(shí)區(qū)域和所述第二圖文標(biāo)識(shí)區(qū)域的第二識(shí)別結(jié)果確定所述圖像的圖文標(biāo)識(shí)區(qū)域和所述圖文標(biāo)識(shí)區(qū)域的識(shí)別結(jié)果。
可選的,還包括:
從當(dāng)前所述至少一個(gè)第一圖文標(biāo)識(shí)區(qū)域中選取歷史未被選取的面積最小的第三圖文標(biāo)識(shí)區(qū)域;
檢測(cè)當(dāng)前所述至少一個(gè)第一圖文標(biāo)識(shí)區(qū)域中面積大于所述第三圖文標(biāo)識(shí)區(qū)域的各個(gè)第一圖文標(biāo)識(shí)區(qū)域中是否存在第四圖文標(biāo)識(shí)區(qū)域,所述第四圖文標(biāo)識(shí)區(qū)域與所述第三圖文標(biāo)識(shí)區(qū)域之間的重疊程度滿足預(yù)設(shè)重疊條件;
若當(dāng)前所述至少一個(gè)第一圖文標(biāo)識(shí)區(qū)域中面積大于所述第三圖文標(biāo)識(shí)區(qū)域的各個(gè)第一圖文標(biāo)識(shí)區(qū)域中存在第四圖文標(biāo)識(shí)區(qū)域,將所述第三圖文標(biāo)識(shí)區(qū)域從所述至少一個(gè)第一圖文標(biāo)識(shí)區(qū)域中刪除;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于有米科技股份有限公司,未經(jīng)有米科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010497450.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





