[發明專利]文本檢測模型的訓練方法、裝置及可讀存儲介質有效
| 申請號: | 202110397684.3 | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN112801097B | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 王德強;劉霄;熊澤法 | 申請(專利權)人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34;G06K9/62 |
| 代理公司: | 北京開陽星知識產權代理有限公司 11710 | 代理人: | 安偉 |
| 地址: | 100089 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 檢測 模型 訓練 方法 裝置 可讀 存儲 介質 | ||
本公開實施例涉及一種文本檢測模型的訓練方法、裝置及可讀存儲介質,其中,該方法包括:獲取攜帶標準檢測結果的訓練樣本,其中,標準檢測結果包括至少一個標準文本區域;將訓練樣本輸入至初始文本檢測模型,獲取訓練樣本的多個檢測結果,每個檢測結果包括至少一個文本區域;根據預設的損失函數、多個檢測結果及標準檢測結果,獲取第一損失值;根據第一損失值對初始文本檢測模型進行訓練,直至訓練次數滿足預設迭代次數,獲取文本檢測模型。標準文本區域是通過對初始文本區域進行縮小后獲得的,且縮小距離僅與初始文本區域的長和寬中的最小值相關,更加適應于行文本的檢測場景,保證了文本檢測模型訓練的穩定性,提高了文本檢測模型檢測的精確度。
技術領域
本公開涉及計算機技術領域,尤其涉及一種文本檢測模型的訓練方法、裝置及可讀存儲介質。
背景技術
在“人工智能(artificial intelligence,AI)+教育”場景中,對圖像文本進行文本行的定位,以及手寫文本、公式文本等多個文本類型的文本檢測是進行版面還原和內容理解的前置環節。目前,通常采用基于像素分割的文本檢測方式實現不同文本類型的文本檢測。具體地,利用文本檢測模型對圖像文本進行特征提取,并根據提取的特征圖對圖像文本中的像素點進行分類預測;接著,根據分類預測結果提取各文本類型的連通域作為后續文本識別的文本檢測實例。
對于密集型文本,為了避免文本行的粘連問題,文本檢測模型會預測一個或者多個相同形狀但大小不同的文本區域,這些文本區域通常小于真實文本區域?,F有技術中,文本檢測模型是采用多邊形裁剪算法,根據真實文本區域的面積和周長確定縮小距離,并根據確定的縮小距離將真實文本區域進行縮小,從而獲得上述預測的文本區域。
雖然,上述方式通過縮小真實文本區域能夠改善相鄰文本行的粘連問題,但是,采用多邊形裁剪算法確定的縮小距離是根據真實文本區域的面積和周長共同確定的;當不同文本行的寬度相同,長度不同時,不同文本行的縮小距離差異較大,易導致文本檢測模型訓練不穩定。
發明內容
為了解決上述技術問題或者至少部分地解決上述技術問題,本公開提供了一種文本檢測模型的訓練方法、裝置及可讀存儲介質。
第一方面,本公開提供一種文本檢測模型的訓練方法,包括:
獲取訓練樣本,其中,所述訓練樣本的標準檢測結果包括:至少一個標準文本區域以及各所述標準文本區域所屬的文本類型標識;所述標準文本區域是通過對初始文本區域進行縮小后獲得的,且縮小距離是根據所述初始文本區域的長和寬中的最小值確定的;
將所述訓練樣本輸入至初始文本檢測模型,獲取所述訓練樣本的多個檢測結果,每個所述檢測結果包括至少一個文本區域以及各所述文本區域所屬的文本類型標識;
根據預設的損失函數、所述多個檢測結果以及所述標準檢測結果,獲取第一損失值;
根據所述第一損失值對所述初始文本檢測模型進行訓練,直至訓練次數滿足預設迭代次數,獲取文本檢測模型。
在一些可能的設計中,對所述初始文本區域進行縮小時的縮小距離滿足公式:
其中,d表示縮小距離;w表示所述初始文本區域的長;h表示所述初始文本區域的寬;a表示超參數。
在一些可能的設計中,所述初始文本檢測模型包括特征提取子模型、特征融合子模型以及分類預測子模型;所述將所述訓練樣本輸入至初始文本檢測模型,獲取所述訓練樣本的多個檢測結果,包括:
將所述訓練樣本輸入至所述特征提取子模型,提取所述訓練樣本的多個尺度不同的第一特征圖、所述訓練樣本的多個尺度不同的第二特征圖以及第一檢測結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京世紀好未來教育科技有限公司,未經北京世紀好未來教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110397684.3/2.html,轉載請聲明來源鉆瓜專利網。





