[發(fā)明專利]題目識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請?zhí)枺?/td> | 202110069502.X | 申請日: | 2021-01-19 |
| 公開(公告)號(hào): | CN114863456A | 公開(公告)日: | 2022-08-05 |
| 發(fā)明(設(shè)計(jì))人: | 李德健 | 申請(專利權(quán))人: | 廣州視源電子科技股份有限公司 |
| 主分類號(hào): | G06V30/414 | 分類號(hào): | G06V30/414;G06V10/24;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京博思佳知識(shí)產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 王茹 |
| 地址: | 510530 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 題目 識(shí)別 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本申請實(shí)施例提供一種題目識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),所述方法包括:獲取包括有題目的目標(biāo)圖像;檢測所述目標(biāo)圖像中的題目所在位置,獲取有關(guān)于所述題目的第一檢測框;所述第一檢測框?qū)?yīng)有所述題目的傾斜角度;根據(jù)所述傾斜角度對所述第一檢測框進(jìn)行裁剪和旋轉(zhuǎn),獲取有關(guān)于所述題目的第二檢測框;所述第二檢測框小于所述第一檢測框;從所述目標(biāo)圖像中提取所述第二檢測框處的題目內(nèi)容進(jìn)行識(shí)別。本實(shí)施例有利于提高題目識(shí)別的準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種題目識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著技術(shù)的發(fā)展,在教育市場中各種教育產(chǎn)品也逐漸增多,比如有拍攝解題產(chǎn)品等。其中,拍照解題產(chǎn)品的重要一步是能夠?qū)D像中的題目所在位置進(jìn)行準(zhǔn)確地檢測,以便后續(xù)對該位置處的內(nèi)容進(jìn)行有效識(shí)別。
相關(guān)技術(shù)中的一種實(shí)現(xiàn)方式中,在進(jìn)行位置檢測時(shí),通常會(huì)檢測出有關(guān)于題目的坐標(biāo)信息和尺寸信息,并基于坐標(biāo)信息和尺寸信息定位題目所在位置。但由于在拍攝時(shí)書本或者紙張可能會(huì)被卷折,或者用戶在書寫題目時(shí)筆跡傾斜等因素,使得照片中的題目內(nèi)容可能呈現(xiàn)一定的傾斜角度,上述實(shí)現(xiàn)方式并不能準(zhǔn)確定位題目所在位置,導(dǎo)致后續(xù)題目識(shí)別錯(cuò)誤。
發(fā)明內(nèi)容
有鑒于此,本申請?zhí)峁┮环N題目識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
根據(jù)本申請實(shí)施例的第一方面,提供一種題目識(shí)別方法,包括:
獲取包括有題目的目標(biāo)圖像;
檢測所述目標(biāo)圖像中的題目所在位置,獲取有關(guān)于所述題目的第一檢測框;所述第一檢測框?qū)?yīng)有所述題目的傾斜角度;
根據(jù)所述傾斜角度對所述第一檢測框進(jìn)行裁剪和旋轉(zhuǎn),獲取有關(guān)于所述題目的第二檢測框;所述第二檢測框小于所述第一檢測框;
從所述目標(biāo)圖像中提取所述第二檢測框處的題目內(nèi)容進(jìn)行識(shí)別。
可選地,通過預(yù)先訓(xùn)練好的題目檢測模型檢測所述目標(biāo)圖像中的題目所在位置。
可選地,所述第一檢測框還對應(yīng)有尺寸信息和坐標(biāo)信息;
所述根據(jù)所述傾斜角度對所述第一檢測框進(jìn)行裁剪和旋轉(zhuǎn),包括:
根據(jù)所述傾斜角度對所述第一檢測框的尺寸信息進(jìn)行調(diào)整,獲得所述第二檢測框的尺寸信息;所述第二檢測框的尺寸小于所述第一檢測框的尺寸;
根據(jù)所述傾斜角度和所述第二檢測框的尺寸信息,對所述第一檢測框的坐標(biāo)信息進(jìn)行調(diào)整,獲取所述第二檢測框的坐標(biāo)信息。
可選地,所述根據(jù)所述傾斜角度對所述第一檢測框進(jìn)行裁剪和旋轉(zhuǎn),包括:如果所述傾斜角度在預(yù)設(shè)角度范圍內(nèi),根據(jù)所述傾斜角度對所述第一檢測框進(jìn)行裁剪和旋轉(zhuǎn);
所述方法還包括:如果所述傾斜角度不在所述預(yù)設(shè)角度范圍內(nèi),將所述傾斜角度置為0,并從所述目標(biāo)圖像中提取所述第一檢測框處的題目內(nèi)容進(jìn)行識(shí)別。
可選地,所述獲取有關(guān)于所述題目的第一檢測框,包括:
獲取所述題目檢測模型輸出的多個(gè)候選檢測框,并確定每個(gè)所述候選檢測框的DIoU值;其中,每個(gè)所述候選檢測框的DIoU值為基準(zhǔn)框的中心點(diǎn)與該候選檢測框的中心點(diǎn)之間的歐式距離與包含所述基準(zhǔn)框和該候選檢測框的最小矩形的對角線長度之間的比值;每個(gè)所述候選檢測框均對應(yīng)有置信度,所述基準(zhǔn)框基于所述置信度所確定;
根據(jù)所述DIoU值低于預(yù)設(shè)閾值的所述候選檢測框,確定有關(guān)于所述題目的第一檢測框。
可選地,所述從所述目標(biāo)圖像中提取所述第二檢測框處的題目內(nèi)容進(jìn)行識(shí)別,包括:
對所述第二檢測框進(jìn)行仿射變換,獲得變換后的第二檢測框;其中,所述變換后的第二檢測框?yàn)榫匦慰颍?/p>
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州視源電子科技股份有限公司,未經(jīng)廣州視源電子科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110069502.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種問卷邏輯控制方法,及裝置
- 一種自動(dòng)修改題目錯(cuò)誤的方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 電子題目的生成方法、生成裝置及終端
- 一種題目推薦方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 直播搜題方法、裝置、終端設(shè)備和存儲(chǔ)介質(zhì)
- 一種在線教育題目生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 圖像處理方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 題目抽取方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種題目條件替換后的解題方法
- 題目識(shí)別方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





