[發(fā)明專利]手寫數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202111344936.2 | 申請(qǐng)日: | 2021-11-15 |
| 公開(公告)號(hào): | CN114332305A | 公開(公告)日: | 2022-04-12 |
| 發(fā)明(設(shè)計(jì))人: | 程謙;龍軍;高海潮 | 申請(qǐng)(專利權(quán))人: | 深圳技德智能科技研究院有限公司 |
| 主分類號(hào): | G06T11/60 | 分類號(hào): | G06T11/60;G06F16/583;G06F16/51;G06V30/164;G06V30/146 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518055 廣東省深圳市南山區(qū)桃源街道福*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 手寫 數(shù)據(jù) 生成 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明公開了一種手寫數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì),獲取手寫單字?jǐn)?shù)據(jù)集;將數(shù)據(jù)集中的每類字符的圖片依次進(jìn)行編號(hào);對(duì)數(shù)據(jù)集中的每類字符的圖片進(jìn)行圖像處理,再進(jìn)行層次聚類,濾除不符合要求的圖片;獲取中文語料庫(kù),對(duì)語料庫(kù)先分割、切分,再對(duì)語料庫(kù)的語料進(jìn)行字符數(shù)量均衡處理;遍歷語料庫(kù)的每條語料,對(duì)每條語料的字符獲取單字?jǐn)?shù)據(jù)集中的字符圖片,并對(duì)字符圖片進(jìn)行處理,形成手寫數(shù)據(jù)行,最終形成以行為單位的手寫數(shù)據(jù)集。能夠快速生成百萬量級(jí)的手寫文本數(shù)據(jù)。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)操作系統(tǒng)領(lǐng)域,尤其涉及一種手寫數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著深度學(xué)習(xí)和OCR技術(shù)的不斷發(fā)展與進(jìn)步,手寫識(shí)別需求也在不斷增加,數(shù)據(jù)集的質(zhì)量和數(shù)量也直接影響到模型的識(shí)別性能。無監(jiān)督的深度學(xué)習(xí)對(duì)數(shù)據(jù)標(biāo)注要求較低,但無法適應(yīng)大多數(shù)工業(yè)場(chǎng)景;有監(jiān)督的深度學(xué)習(xí)可以滿足大多數(shù)場(chǎng)景需求,但強(qiáng)依賴于有標(biāo)注的數(shù)據(jù)集。因此,真實(shí)場(chǎng)景下的手寫標(biāo)注數(shù)據(jù)變得越來越重要。
傳統(tǒng)的手寫數(shù)據(jù)集采用“人工收集—人工處理—人工標(biāo)注”的方式進(jìn)行,最常見的例如:MNIST,CASIA-HWDB2.0。根據(jù)文字呈現(xiàn)形式,可以將手寫數(shù)據(jù)集分為character-level和page-level兩種: character-level表示每個(gè)樣本包含一個(gè)字符,標(biāo)注就是該字符的類別;page-level則包含一個(gè)完整的文本頁,標(biāo)注是每一行的位置以及文本信息。這類數(shù)據(jù)集一般的生成方式為:(1)召集志愿者書寫文本;(2)收集并處理文本圖片;(3)人工標(biāo)注每張文本圖片。數(shù)據(jù)集的特點(diǎn)是:標(biāo)注準(zhǔn)確,數(shù)據(jù)分布符合場(chǎng)景需求,但標(biāo)注效率低下、生成周期長(zhǎng)、數(shù)據(jù)量少,難以滿足深度學(xué)習(xí)對(duì)數(shù)據(jù)量的需求。
針對(duì)傳統(tǒng)人工標(biāo)注的缺點(diǎn),一些學(xué)者和科研機(jī)構(gòu)嘗試?yán)蒙疃葘W(xué)習(xí)的方式來完成數(shù)據(jù)標(biāo)注,例如:目標(biāo)檢測(cè)領(lǐng)域常使用成熟的預(yù)訓(xùn)練模型對(duì)特定目標(biāo)做位置和類別標(biāo)注,OCR領(lǐng)域使用通用場(chǎng)景模型對(duì)特殊場(chǎng)景做標(biāo)注。利用深度學(xué)習(xí)的方式能較大程度提升標(biāo)注效率,它的一般實(shí)現(xiàn)方式可以分成兩步:(1)收集場(chǎng)景數(shù)據(jù);(2)算法輔助人工標(biāo)注數(shù)據(jù)。所謂算法輔助人工指的是:在標(biāo)注時(shí)首先利用通用場(chǎng)景算法基于數(shù)據(jù)粗略標(biāo)注,然后通過人工手動(dòng)調(diào)整標(biāo)注,提升標(biāo)注精度。深度學(xué)習(xí)智能標(biāo)注方法的特點(diǎn)是:標(biāo)注準(zhǔn)確,但依賴人工校正導(dǎo)致效率較低,且嚴(yán)格依賴于通用預(yù)訓(xùn)練模型。
除了使用已有數(shù)據(jù)做標(biāo)注來產(chǎn)生數(shù)據(jù)集以外,還可以利用GAN (GenerativeAdversarial Networks,生成對(duì)抗網(wǎng)絡(luò))模型根據(jù)標(biāo)注逆向生成圖片,這種方式以深度學(xué)習(xí)模型作為基礎(chǔ),模型輸入是文本類字符串,輸出是GAN算法書寫的文字圖像。該方式生成效率高,但是由于GAN模型的訓(xùn)練較難收斂,其生成的數(shù)據(jù)質(zhì)量也參差不齊,同真實(shí)人類手寫數(shù)據(jù)有較大差距,難以滿足真實(shí)場(chǎng)景需求。
發(fā)明內(nèi)容
為了解決手寫識(shí)別數(shù)據(jù)集生成效率低下、數(shù)據(jù)質(zhì)量難以滿足真實(shí)場(chǎng)景需求的問題,本發(fā)明提供了一種手寫數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。
第一方面,本發(fā)明提供一種手寫數(shù)據(jù)生成方法,所述方法為:
獲取手寫單字?jǐn)?shù)據(jù)集;所述數(shù)據(jù)集為字符圖片的集合,每類字符對(duì)應(yīng)一個(gè)字符索引值,數(shù)據(jù)集的每類字符包含一定數(shù)量的字符圖片;每類字符與字符索引值形成字符索引表;
將數(shù)據(jù)集中的每類字符的圖片依次進(jìn)行編號(hào);
對(duì)數(shù)據(jù)集中的每類字符的圖片進(jìn)行圖像處理,再進(jìn)行層次聚類,濾除不符合要求的圖片;
獲取中文語料庫(kù),對(duì)語料庫(kù)先分割、切分,再對(duì)語料庫(kù)的語料進(jìn)行字符數(shù)量均衡處理;
遍歷語料庫(kù)的每條語料,對(duì)每條語料的字符獲取單字?jǐn)?shù)據(jù)集中的字符圖片,并對(duì)字符圖片進(jìn)行處理,形成手寫數(shù)據(jù)行,最終形成以行為單位的手寫數(shù)據(jù)集。
進(jìn)一步地,所述對(duì)每條語料的字符獲取單字?jǐn)?shù)據(jù)集中的字符圖片,并對(duì)字符圖片進(jìn)行處理,形成手寫數(shù)據(jù)行,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳技德智能科技研究院有限公司,未經(jīng)深圳技德智能科技研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111344936.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種能光學(xué)表現(xiàn)平面手寫面上書寫信息的工具
- 通過使用手寫數(shù)據(jù)再現(xiàn)手寫消息的裝置和方法
- 一種手寫筆跡電子化方法和系統(tǒng)
- 一種發(fā)送手書消息和再現(xiàn)手書消息的方法
- 一種新型無線手寫板
- 一種手寫能力量化評(píng)估系統(tǒng)及方法
- 手寫內(nèi)容去除方法、手寫內(nèi)容去除裝置、存儲(chǔ)介質(zhì)
- 文本圖像中手寫內(nèi)容去除方法、裝置、存儲(chǔ)介質(zhì)
- 一種手寫識(shí)別方法、裝置、電子設(shè)備及介質(zhì)
- 第三方手寫軟件快速手寫的實(shí)現(xiàn)方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





