[發(fā)明專利]答案提取方法、裝置、計算機可讀介質(zhì)及電子設(shè)備有效
| 申請?zhí)枺?/td> | 202010922271.8 | 申請日: | 2020-09-04 |
| 公開(公告)號: | CN112036343B | 公開(公告)日: | 2022-02-08 |
| 發(fā)明(設(shè)計)人: | 郝昱;黃燦;文林福 | 申請(專利權(quán))人: | 北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號: | G06V30/40 | 分類號: | G06V30/40;G06V10/22;G06V20/62;G06V10/26;G06V30/148;G06V30/10 |
| 代理公司: | 北京英創(chuàng)嘉友知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11447 | 代理人: | 賈會玲 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 答案 提取 方法 裝置 計算機 可讀 介質(zhì) 電子設(shè)備 | ||
本公開涉及一種答案提取方法、裝置、計算機可讀介質(zhì)及電子設(shè)備。方法包括:識別答案圖像中是否包含預(yù)設(shè)分隔符;在所述答案圖像中包含所述預(yù)設(shè)分隔符的情況下,提取被所述預(yù)設(shè)分隔符前后分隔開的文本區(qū)域的區(qū)域圖像,其中,前后相鄰的兩個所述文本區(qū)域之間被所述預(yù)設(shè)分隔符分隔開;對所述區(qū)域圖像進行文本識別,以得到所述區(qū)域圖像對應(yīng)的答案信息。這樣,通過提取被該預(yù)設(shè)分隔符前后分隔開的文本區(qū)域即可獲取到各作答點對應(yīng)的答案的區(qū)域圖像,可有效提升相鄰作答點的答案分隔的精度和穩(wěn)定性,進而保證后續(xù)基于各作答點對應(yīng)的答案的區(qū)域圖像提取出的答案信息的準(zhǔn)確性。
技術(shù)領(lǐng)域
本公開涉及圖像處理技術(shù)領(lǐng)域,具體地,涉及一種答案提取方法、裝置、計算機可讀介質(zhì)及電子設(shè)備。
背景技術(shù)
隨著在線教育的不斷發(fā)展,在線測試也變得越來越普及。通常情況下,用戶根據(jù)線上展示的題目,給出答案(例如,在紙上手寫),之后,用戶使用圖像采集裝置(例如,智能終端、相機等)拍攝答案圖像,并將其上傳至用于答案提取的電子設(shè)備(例如,服務(wù)器或智能終端);電子設(shè)備對答案圖像的中答案進行識別,并進行對錯判定。當(dāng)一道題目包含多個作答點時(例如:找規(guī)律寫數(shù)字:101、102、103、?、105、106、?、108,其中,“?”代表一個作答點),需要先將每一作答點對應(yīng)的答案提取出來,再將提取到的各作答點對應(yīng)的答案分別與標(biāo)準(zhǔn)答案進行匹配,以進行對錯判定。
現(xiàn)階段,大多使用基于連通組件和連通組件距離的方法進行答案提取。具體來說,首先對答案圖像進行連通域提取,得到多個連通組件;然后將多個連通組件按照其在答案圖像中的前后順序排列,并計算每相鄰兩個連通組件之間的距離。若相鄰兩個連通組件之間的距離小于距離平均值(每相鄰兩個連通組件之間的距離之和的平均值),則將二者合并;最后,得到多個連通組件,其中,每一連通組件與一作答點對應(yīng),從而可將多個作答點的答案提取出來。但當(dāng)答案圖像中相鄰字符之間的間距不明朗時,將無法精準(zhǔn)地將各作答點對應(yīng)的答案分隔開。
發(fā)明內(nèi)容
提供該發(fā)明內(nèi)容部分以便以簡要的形式介紹構(gòu)思,這些構(gòu)思將在后面的具體實施方式部分被詳細描述。該發(fā)明內(nèi)容部分并不旨在標(biāo)識要求保護的技術(shù)方案的關(guān)鍵特征或必要特征,也不旨在用于限制所要求的保護的技術(shù)方案的范圍。
第一方面,本公開提供一種答案提取方法,包括:
識別答案圖像中是否包含預(yù)設(shè)分隔符;
在所述答案圖像中包含所述預(yù)設(shè)分隔符的情況下,提取被所述預(yù)設(shè)分隔符前后分隔開的文本區(qū)域的區(qū)域圖像,其中,前后相鄰的兩個所述文本區(qū)域之間被所述預(yù)設(shè)分隔符分隔開;
對所述區(qū)域圖像進行文本識別,以得到所述區(qū)域圖像對應(yīng)的答案信息。
第二方面,本公開提供一種答案提取裝置,包括:
第一識別模塊,用于識別答案圖像中是否包含預(yù)設(shè)分隔符;
提取模塊,用于在所述第一識別模塊識別出所述答案圖像中包含所述預(yù)設(shè)分隔符的情況下,提取被所述預(yù)設(shè)分隔符前后分隔開的文本區(qū)域的區(qū)域圖像,其中,前后相鄰的兩個所述文本區(qū)域之間被所述預(yù)設(shè)分隔符分隔開;
第二識別模塊,用于對所述提取模塊提取到的所述區(qū)域圖像進行文本識別,以得到所述區(qū)域圖像對應(yīng)的答案信息。
第三方面,本公開提供一種計算機可讀介質(zhì),其上存儲有計算機程序,該程序被處理裝置執(zhí)行時實現(xiàn)本公開第一方面提供的所述方法的步驟。
第四方面,本公開提供一種電子設(shè)備,包括:
存儲裝置,其上存儲有計算機程序;
處理裝置,用于執(zhí)行所述存儲裝置中的所述計算機程序,以實現(xiàn)本公開第一方面提供的所述方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010922271.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





