[發(fā)明專利]場(chǎng)景文字的輪廓擬合和校正方法、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110397696.6 | 申請(qǐng)日: | 2021-04-14 |
| 公開(公告)號(hào): | CN113033540A | 公開(公告)日: | 2021-06-25 |
| 發(fā)明(設(shè)計(jì))人: | 田澤康;蔣文;鄧卉;陳搏 | 申請(qǐng)(專利權(quán))人: | 易視騰科技股份有限公司 |
| 主分類號(hào): | G06K9/20 | 分類號(hào): | G06K9/20;G06K9/42 |
| 代理公司: | 北京聯(lián)創(chuàng)佳為專利事務(wù)所(普通合伙) 11362 | 代理人: | 郭防 |
| 地址: | 214028 江蘇省無(wú)錫市*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 場(chǎng)景 文字 輪廓 擬合 校正 方法 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種場(chǎng)景文字的輪廓擬合和校正方法,其特征在于,包括以下步驟:
對(duì)場(chǎng)景文字的邊界進(jìn)行擬合,獲得文字區(qū)域多邊形;
對(duì)文字區(qū)域多邊形對(duì)應(yīng)的圖像進(jìn)行校正,獲得包含文字的矩形區(qū)域圖像,用于場(chǎng)景文字識(shí)別。
2.根據(jù)權(quán)利要求1所述的場(chǎng)景文字的輪廓擬合和校正方法,其特征在于:所述的對(duì)場(chǎng)景文字的邊界進(jìn)行擬合,獲得文字區(qū)域多邊形,包括:
對(duì)場(chǎng)景文字的整體輪廓擬合一個(gè)最小旋轉(zhuǎn)矩形作為初始矩形;
根據(jù)所述的最小旋轉(zhuǎn)矩形,將文字輪廓分為左右兩部分,然后通過(guò)遞歸調(diào)用分別求取兩部分的擬合多邊形;
將獲得的兩個(gè)擬合多邊形合并為單個(gè)多邊形,進(jìn)而得到文字區(qū)域多邊形。
3.根據(jù)權(quán)利要求2所述的場(chǎng)景文字的輪廓擬合和校正方法,其特征在于:根據(jù)所述的最小旋轉(zhuǎn)矩形,將文字輪廓分為左右兩部分,然后通過(guò)遞歸調(diào)用分別求取兩部分的擬合多邊形,具體包括:
(a)設(shè)初始遞歸深度T=1,場(chǎng)景文字的整體輪廓點(diǎn)集CT=C,當(dāng)前輪廓在其父輪廓中的位置Pos∈{None,Left,Right},初始Pos=None,參考點(diǎn)數(shù)組為從父輪廓分割時(shí)得到的頂邊和底邊參考點(diǎn),分別為初始均為空;
(b)根據(jù)當(dāng)前輪廓CT的最小旋轉(zhuǎn)矩形rboxT,提取其四個(gè)邊界頂點(diǎn)并使左上邊界頂點(diǎn)為第一個(gè)點(diǎn),得到其頂點(diǎn)集合若存在參考點(diǎn)數(shù)組則根據(jù)當(dāng)前輪廓在父輪廓中的位置對(duì)邊界頂點(diǎn)集合PT中的頂點(diǎn)進(jìn)行重新排序:若Pos=Left,則使矩形的右邊到參考點(diǎn)數(shù)組中兩點(diǎn)的距離和最小;若Pos=Right,則使矩形的左邊到參考點(diǎn)數(shù)組中兩點(diǎn)的距離和最小;
(c)取L為rboxT的上下邊中點(diǎn)的連線,用中線L將CT一分為二得到左右兩部分記L與CT的所有交點(diǎn)集合為RT;將RT中距離rboxT的上邊最近和最遠(yuǎn)的點(diǎn)作為新的參考點(diǎn)數(shù)組
(d)對(duì)左邊部分遞歸使用步驟(b)~(c)進(jìn)行擬合,初始條件為:T=T+1,輪廓點(diǎn)集為Pos=Left,參考點(diǎn)數(shù)組為得到左邊的擬合多邊形頂點(diǎn)數(shù)目為2ml;
(e)同理,對(duì)右邊部分進(jìn)行遞歸擬合得到右邊的擬合多邊形頂點(diǎn)數(shù)目為2mr。
4.根據(jù)權(quán)利要求3所述的場(chǎng)景文字的輪廓擬合和校正方法,其特征在于,以下任一條件滿足則遞歸擬合過(guò)程終止:
當(dāng)前輪廓的擬合精度超過(guò)預(yù)設(shè)的第一閾值w1;
當(dāng)前輪廓的擬合精度超過(guò)預(yù)設(shè)的第二閾值w2,w2w1,且寬高比小于1;
當(dāng)前遞歸的深度達(dá)到預(yù)設(shè)的最大遞歸深度T_max;
當(dāng)前輪廓的面積小于預(yù)設(shè)的最小面積Area_min。
5.根據(jù)權(quán)利要求2所述的場(chǎng)景文字的輪廓擬合和校正方法,其特征在于:采用平均合并方法將獲得的兩個(gè)擬合多邊形合并為單個(gè)多邊形,進(jìn)而得到文字區(qū)域多邊形。
6.根據(jù)權(quán)利要求5所述的場(chǎng)景文字的輪廓擬合和校正方法,其特征在于:所述的采用平均合并方法將獲得的兩個(gè)擬合多邊形合并為單個(gè)多邊形,包括:
將左邊多邊形上邊最右頂點(diǎn)與右邊多邊形上邊最左頂點(diǎn)合并為二者中點(diǎn)然后將左右多邊形上邊連接成合并多邊形的上邊;將左邊多邊形下邊最右頂點(diǎn)與右邊多邊形下邊最左頂點(diǎn)合并得到中點(diǎn)然后將左右多邊形下邊連接成合并多邊形的下邊;將合并多邊形的上邊與合并多邊形的下邊連接,構(gòu)成合并后的多邊形,即得到文字區(qū)域多邊形。
7.根據(jù)權(quán)利要求1所述的場(chǎng)景文字的輪廓擬合和校正方法,其特征在于,所述的對(duì)文字區(qū)域多邊形對(duì)應(yīng)的圖像進(jìn)行校正,獲得包含文字的矩形區(qū)域圖像,包括:采用三角網(wǎng)劃分文字區(qū)域多邊形,并對(duì)每個(gè)三角形區(qū)域用仿射變換進(jìn)行插值,得到校正后的包含文字的矩形區(qū)域圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于易視騰科技股份有限公司,未經(jīng)易視騰科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110397696.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 電視場(chǎng)景切換的方法及電視
- 視頻場(chǎng)景控制系統(tǒng)及方法
- 場(chǎng)景開關(guān)及其場(chǎng)景開關(guān)構(gòu)件和場(chǎng)景圖標(biāo)卡組件
- 場(chǎng)景聯(lián)動(dòng)方法及場(chǎng)景聯(lián)動(dòng)系統(tǒng)
- 一種視頻場(chǎng)景分類方法、裝置、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種Unity3D引擎的場(chǎng)景切換方法和系統(tǒng)
- 一種自動(dòng)駕駛場(chǎng)景分類識(shí)別系統(tǒng)及方法
- 一種虛擬場(chǎng)景生成方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種汽車圖像場(chǎng)景庫(kù)數(shù)據(jù)復(fù)雜度度量方法
- 場(chǎng)景識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





