[發明專利]形態學先驗約束的甲骨文字檢測的圖像數據集構建方法有效
| 申請號: | 202110822165.7 | 申請日: | 2021-07-20 |
| 公開(公告)號: | CN113362361B | 公開(公告)日: | 2023-09-05 |
| 發明(設計)人: | 宋傳鳴;何熠輝;王一琦;洪飏;王相海 | 申請(專利權)人: | 遼寧師范大學 |
| 主分類號: | G06T7/155 | 分類號: | G06T7/155;G06T7/62;G06T7/70;G06T5/40 |
| 代理公司: | 大連非凡專利事務所 21220 | 代理人: | 閃紅霞 |
| 地址: | 116000 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 形態學 先驗 約束 甲骨 文字 檢測 圖像 數據 構建 方法 | ||
本發明公開一種形態學先驗約束的甲骨文字檢測的圖像數據集構建方法,是從實甲骨拓片圖像中提取不含噪聲的單字圖像以及含有點狀噪聲、片狀斑紋和固有紋理的干擾元素圖像,分別組成單字字形圖像數據集和干擾元素數據集;利用二值掩膜提取有效字形區域的像素,以甲骨文字形態學特征為約束,通過隨機旋轉、縮放和基于二值掩膜的位運算,生成無噪聲的甲骨拓片模擬圖像;然后,通過直方圖掃描來定位文字區域的包圍盒,進而生成符合VOC2007規范的XML標注文件;通過隨機旋轉、縮放、二值掩膜的方式,將干擾元素與單字圖像進行疊加,構建了面向甲骨卜辭文字檢測的圖像數據集。
技術領域
本發明涉及數字圖像處理和古文字信息處理的交叉領域,尤其是一種可有效解決甲骨卜辭拓片圖像數據集有限、甲骨文字檢測數據集匱乏且標注困難的問題,能反映真實甲骨拓片圖像的文字、噪聲和固有紋理的特點,構建效率高、可擴展能力強、具備自動標注能力、標注精度高、形態學先驗約束的面向甲骨文字檢測的圖像數據集構建方法。
背景技術
甲骨文字檢測是計算甲骨學的重要基礎研究領域之一,其根本目的是借助計算機視覺技術,在甲骨拓片圖像上自動定位甲骨卜辭文字的區域位置,進而為刻辭文本識別及語義釋讀等環節提供字形圖像或字形圖像集合。它對于保證后續的文字分割和字形復原質量、提高字形特征提取和自動識別精度具有基礎且重要的意義,亦是計算機輔助甲骨文字形研究、碎片綴合、文意釋讀等研究工作的基礎任務。為了實現高效率的基于計算機視覺技術的甲骨卜辭文字檢測以及對其檢測結果進行公平測試和客觀評價,建立具有一定規模的甲骨拓片圖像數據集是必不可少的基礎研究步驟之一。然而,具有權威性的甲骨卜辭圖像公開數據集目前十分有限,公開的甲骨卜辭文字檢測數據集更是極其匱乏。
一方面,研究者普遍認可的數據大多源自1978-1982年郭沫若主編的《甲骨文合集》一書,書中選錄了殷墟出土的甲骨拓本、照片和摹本共41956片。遺憾的是,該數據集經過數字化后,并不具備滿足深度學習要求的訓練條件,其數據規模有限且未提供文本標注。而且,傳統的可視化標注工具對標注者的業務能力有較高要求,標注者既須非常熟悉甲骨文字形,明確區分固有紋理、溝壑裂痕、鉆鑿坑洞等干擾元素與字形本身,還需具備一定的甲骨文釋讀能力,能夠大體區分特定場景下形態相似的多個單體字抑或是上下、左右結構的合體字。在這種近乎苛刻的嚴格要求下,即使研究人員花費大量精力對該圖像數據集進行手工標注,由于個人素質、技能程度等因素所導致的訓練數據標注標準不統一、標注精度無法保證、標注效率低下等問題也是尤為突出的。另一方面,盡管文檔分析與識別國際會議(International?Conference?on?Document?Analysis?and?Recognition,ICDAR)面向文本檢測和識別公開了一種ICDAR數據集,但是該數據集卻僅包含現代文字,它呈現出與真實甲骨拓片完全不同的特征,根本無法實際應用于甲骨卜辭文字的檢測任務。與ICDAR提供的數據相比,甲骨卜辭文字的拓片圖像夾雜著更為顯著的噪聲干擾,既含有在甲骨拓取、拍攝、掃描過程中由于技術設備等因素造成的噪聲,又存在大量的由于鉆鑿、炙烤、風蝕、腐化等原因造成的空洞、裂痕甚至碎裂現象,而且龜甲和獸骨本身還具有齒縫、兆紋、盾紋、刻痕等紋理。這些明顯有別于自然環境下文本檢測場景的復雜干擾,導致甲骨卜辭文字往往被大量的點狀噪聲、片狀斑紋和固有紋理所污染。顯然,ICDAR數據集既不能勝任甲骨卜辭文字檢測的訓練任務,又無法為甲骨卜辭文字自動檢測提供一個標準的測試平臺。
綜上所述,基于計算機視覺的甲骨文字檢測領域仍然面臨圖像數據集匱乏且標注困難的問題,尚缺少能反映真實甲骨拓片圖像的文字、噪聲和固有紋理的特點,構建效率高、具備自動標注能力或者對標注人員的知識技能依賴程度低、標注精度高,尤其是可擴展能力強的面向甲骨文字檢測的圖像數據集構建方法。
發明內容
本發明是為了解決現有技術所存在的上述技術問題,提供一種可有效解決甲骨卜辭拓片圖像數據集有限、甲骨文字檢測數據集匱乏且標注困難的問題,能反映真實甲骨拓片圖像的文字、噪聲和固有紋理的特點,構建效率高、可擴展能力強、具備自動標注能力、標注精度高、形態學先驗約束的面向甲骨文字檢測的圖像數據集構建方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于遼寧師范大學,未經遼寧師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110822165.7/2.html,轉載請聲明來源鉆瓜專利網。





