[發明專利]題目內容識別方法、裝置、可讀存儲介質及計算機設備有效
| 申請號: | 202010096664.8 | 申請日: | 2020-02-18 |
| 公開(公告)號: | CN110956173B | 公開(公告)日: | 2020-06-23 |
| 發明(設計)人: | 趙聰 | 申請(專利權)人: | 江西軟云科技股份有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 彭琰 |
| 地址: | 330096 江西省南昌市高新技術產業*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 題目 內容 識別 方法 裝置 可讀 存儲 介質 計算機 設備 | ||
一種題目內容識別方法、裝置、可讀存儲介質及計算機設備,題目內容識別方法包括:對待識別圖片進行識別,以得到所述待識別圖片中每一行的文字內容及所述文字內容在所述待識別圖片中的位置坐標;根據每一行的所述文字內容和每一行所述文字內容中的起始文字的位置坐標確定所述待識別圖片中各個題目的起始行;根據各個所述題目的起始行的位置對所述文字內容進行劃分,以得到各個題目的題目內容。本發明通過對待識別圖片中各行的文字內容進行識別和分別確定屬于各個題目的行文字內容,可保證題目內容識別的完整性。
技術領域
本發明涉及數據分析處理技術領域,特別是涉及一種題目內容識別方法、裝置、可讀存儲介質及計算機設備。
背景技術
在教育領域,尤其是K12教育階段,作業和考試試題是以紙質形態呈現,學生通過筆寫進行答題。為了掌握學生的學習情況,需要將各個學生的答題信息特別是錯題信息進行分析,生成屬于學生個人的錯題集。
現有技術中,對試卷(或作業)的答題內容收集時,將試卷整頁拍照,并通過模板匹配,劃分試卷中各個試題的區域。再通過OCR識別技術識別拍照答題卡中的內容。通過對試卷進行題目切割生成錯題本將會大大減輕家長和老師整理錯題本的工作量。
然而,與普通的文檔識別不同,學生的作業或考試的圖片包含了大量的手寫痕跡,并且圖片之間有一定的關聯性,例如題目跨頁等情況,導致試卷或作業的識別復雜度過高,如果只是利用劃分試題區域的方法進行簡單的處理,有可能將學生的答題內容和老師的批改痕跡切除,無話獲得完整的試題內容,其效果會非常不理想。
發明內容
鑒于上述狀況,有必要針對現有技術中無法獲取完整的試題內容的問題,提供一種題目內容識別方法、裝置、可讀存儲介質及計算機設備。
一種題目內容識別方法,包括:
獲取答題文件的當前圖片;
通過邊緣檢測算法對所述當前圖片進行分界線檢測;
若檢測到分界線,則根據所述分界線對所述當前圖片進行切割以得到數個子圖片;
按照所述子圖片的讀取順序將各個所述子圖片合并為一張目標圖片,并將所述目標圖片作為待識別圖片;
對所述待識別圖片進行識別,以得到所述待識別圖片中每一行的文字內容及每一行所述文字內容的起始文字在所述待識別圖片中的位置坐標;
比對預設的多個識別因子,提取識別到的每一行的文字內容中的目標識別因子;
根據提取的當前行中的所述目標識別因子的分值和所述目標識別因子的權重計算所述當前行的得分值;
根據所述當前行的起始文字的位置坐標對所述當前行的得分值進行第一次調整,所述第一次調整的規則為,所述當前行的起始文字的位置相對于行平均位置靠左則加權,靠右則降權,所述行平均位置為所有行中的起始文字的位置坐標的平均值;
根據每一行經過調整后的最終得分值確定所述待識別圖片中各個題目的起始行;
根據各個所述題目的起始行的位置對所述文字內容進行劃分,以得到各個題目的題目內容。
進一步的,上述題目內容識別方法,其中,所述得分值的計算公式為:
;
其中, g(l,w)為得分值,lk為第k個目標識別因子的分值,wk為第k個目標識別因子的權重。
進一步的,上述題目內容識別方法,其中,對所述當前行的得分值進行第一次調整的計算公式為:
;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江西軟云科技股份有限公司,未經江西軟云科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010096664.8/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





