[發(fā)明專利]一種判斷文檔主要文字方向的方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110867589.5 | 申請(qǐng)日: | 2021-07-28 |
| 公開(kāi)(公告)號(hào): | CN113673368A | 公開(kāi)(公告)日: | 2021-11-19 |
| 發(fā)明(設(shè)計(jì))人: | 魏舒;高翔;紀(jì)達(dá)麒;陳運(yùn)文 | 申請(qǐng)(專利權(quán))人: | 達(dá)而觀智能(深圳)有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/20;G06K9/62 |
| 代理公司: | 上海智力專利商標(biāo)事務(wù)所(普通合伙) 31105 | 代理人: | 周濤 |
| 地址: | 518026 廣東省深圳市福田區(qū)福田街道*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 判斷 文檔 主要 文字 方向 方法 | ||
1.一種判斷文檔主要文字方向的方法,其特征在于,所述方法包括如下步驟:
s1對(duì)文字圖像按照主要文字方向進(jìn)行分類;
s2基于分類結(jié)果旋轉(zhuǎn)文字圖像;
s3對(duì)旋轉(zhuǎn)后的文字圖像做文字位置檢測(cè);
s4對(duì)檢測(cè)出的文字位置的文字圖像區(qū)域做文字識(shí)別;
s5判斷文字識(shí)別結(jié)果的語(yǔ)義連貫程度;
s6若語(yǔ)義連貫程度大于等于設(shè)定閾值,將識(shí)別結(jié)果輸出;
s7若語(yǔ)義連貫程度低于設(shè)定閾值,對(duì)s3中檢測(cè)出的文字位置的文字圖像區(qū)域做180°翻轉(zhuǎn)后,針對(duì)翻轉(zhuǎn)后的文字圖像區(qū)域執(zhí)行s4和s5的步驟,比較兩次得到的語(yǔ)義連貫程度,取其中較高的語(yǔ)義連貫程度對(duì)應(yīng)的識(shí)別結(jié)果作為輸出。
2.根據(jù)權(quán)利要求1所述的判斷文檔主要文字方向的方法,其特征在于,s1中對(duì)文字圖像按照主要文字方向進(jìn)行分類之前,先將文字圖像做預(yù)處理。
3.根據(jù)權(quán)利要求2所述的判斷文檔主要文字方向的方法,其特征在于,所述預(yù)處理包括圖像尺寸統(tǒng)一和/或灰度化。
4.根據(jù)權(quán)利要求1所述的判斷文檔主要文字方向的方法,其特征在于,所述s5采用的判斷方法包括:常見(jiàn)字所占比例與統(tǒng)計(jì)概率的比較和/或詞性標(biāo)注的規(guī)律和/或某個(gè)字的前后字是否常見(jiàn)。
5.一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)中保存有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-4中任一的判斷文檔主要文字方向的方法。
6.一種判斷文檔主要文字方向的裝置,其特征在于,所述裝置包括:分類模塊,所述分類模塊用來(lái)對(duì)文字圖像按照主要文字方向進(jìn)行分類;旋轉(zhuǎn)模塊,所述旋轉(zhuǎn)模塊用來(lái)基于分類結(jié)果旋轉(zhuǎn)文字圖像;
文字檢測(cè)模塊,所述文字檢測(cè)模塊用來(lái)對(duì)旋轉(zhuǎn)后的文字圖像做文字位置檢測(cè);
文字識(shí)別模塊,所述文字識(shí)別模塊用來(lái)對(duì)檢測(cè)出的文字位置的文字圖像區(qū)域做文字識(shí)別;
計(jì)算模塊,所述計(jì)算模塊用來(lái)計(jì)算文字識(shí)別結(jié)果的語(yǔ)義連貫程度;
判斷模塊,所述判斷模塊用來(lái)判斷:若語(yǔ)義連貫程度大于等于設(shè)定閾值,將識(shí)別結(jié)果輸出;若語(yǔ)義連貫程度低于設(shè)定閾值,對(duì)檢測(cè)出的文字位置的文字圖像區(qū)域做180°翻轉(zhuǎn)后,針對(duì)翻轉(zhuǎn)后的文字圖像區(qū)域依次執(zhí)行文字識(shí)別和語(yǔ)義連貫程度計(jì)算,比較兩次得到的語(yǔ)義連貫程度,取其中較高的語(yǔ)義連貫程度對(duì)應(yīng)的識(shí)別結(jié)果作為輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于達(dá)而觀智能(深圳)有限公司,未經(jīng)達(dá)而觀智能(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110867589.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫(huà)生成方法、裝置及設(shè)備





