[發(fā)明專(zhuān)利]樣本生成方法、裝置及設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201910233792.X | 申請(qǐng)日: | 2019-03-26 |
| 公開(kāi)(公告)號(hào): | CN111753859A | 公開(kāi)(公告)日: | 2020-10-09 |
| 發(fā)明(設(shè)計(jì))人: | 張鵬 | 申請(qǐng)(專(zhuān)利權(quán))人: | 杭州??低晹?shù)字技術(shù)股份有限公司 |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京博思佳知識(shí)產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 310051 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 樣本 生成 方法 裝置 設(shè)備 | ||
本發(fā)明提供一種樣本生成方法、裝置及設(shè)備,樣本生成方法包括:獲取指定標(biāo)準(zhǔn)字的特征描述向量,特征描述向量用于指示所述指定標(biāo)準(zhǔn)字的內(nèi)容;利用所述特征描述向量和指定的非標(biāo)準(zhǔn)特征向量將指定標(biāo)準(zhǔn)字轉(zhuǎn)換成目標(biāo)樣本,所述目標(biāo)樣本對(duì)應(yīng)的風(fēng)格與非標(biāo)準(zhǔn)特征向量表示的風(fēng)格相同。無(wú)需采集所需字體風(fēng)格的字符圖像便可生成該字體風(fēng)格的樣本,提升樣本生成效率。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,尤其涉及的是一種樣本生成方法、裝置及設(shè)備。
背景技術(shù)
隨著科學(xué)技術(shù)的發(fā)展,深度學(xué)習(xí)算法在分類(lèi)、檢測(cè)、識(shí)別等任務(wù)中表現(xiàn)優(yōu)異。但該性能的取得依賴(lài)于計(jì)算機(jī)算力的提升、大量的訓(xùn)練樣本等多個(gè)方面因素,其中訓(xùn)練樣本作為“燃料”是算法開(kāi)發(fā)中不可或缺的一環(huán)。在文本識(shí)別技術(shù)中,同樣需要大量的包含字符的樣本來(lái)實(shí)現(xiàn)訓(xùn)練。
相關(guān)的樣本生成方式中,通過(guò)將字符圖像貼到背景圖像合成為樣本,在真實(shí)場(chǎng)景中,文本字符的字體是多樣化的,為了使得算法能夠更準(zhǔn)確地識(shí)別真實(shí)場(chǎng)景中的文本字符,需要生成訓(xùn)練所需的各種字體風(fēng)格的樣本,該方式中,每需要一種字體風(fēng)格的樣本,就需要采集相應(yīng)字體風(fēng)格的字符圖像來(lái)合成所需的樣本,樣本生成效率過(guò)低。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種樣本生成方法、裝置及設(shè)備,無(wú)需采集所需字體風(fēng)格的字符圖像便可生成該字體風(fēng)格的樣本,提升樣本生成效率。
本發(fā)明第一方面提供一種樣本生成方法,包括:
獲取指定標(biāo)準(zhǔn)字的特征描述向量,特征描述向量用于指示所述指定標(biāo)準(zhǔn)字的內(nèi)容;
利用所述特征描述向量和指定的非標(biāo)準(zhǔn)特征向量將指定標(biāo)準(zhǔn)字轉(zhuǎn)換成目標(biāo)樣本,所述目標(biāo)樣本對(duì)應(yīng)的風(fēng)格與非標(biāo)準(zhǔn)特征向量表示的風(fēng)格相同。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述獲取指定標(biāo)準(zhǔn)字的特征描述向量,包括:
將包含有所述指定標(biāo)準(zhǔn)字的第一圖像輸入至已訓(xùn)練的學(xué)生網(wǎng)絡(luò)中的第一神經(jīng)網(wǎng)絡(luò),以由所述第一神經(jīng)網(wǎng)絡(luò)對(duì)輸入的所述第一圖像進(jìn)行特征提取得到特征描述向量。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述第一神經(jīng)網(wǎng)絡(luò)對(duì)輸入的所述第一圖像進(jìn)行特征提取得到特征描述向量,包括:
所述第一神經(jīng)網(wǎng)絡(luò)至少通過(guò)用于執(zhí)行卷積處理的卷積層、及用于執(zhí)行非線性變換處理的第一非線性變換層對(duì)所述第一圖像進(jìn)行特征提取得到特征描述向量。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,利用所述特征描述向量和指定的非標(biāo)準(zhǔn)特征向量將指定標(biāo)準(zhǔn)字轉(zhuǎn)換成目標(biāo)樣本,包括:
將所述特征描述向量與所述非標(biāo)準(zhǔn)特征向量輸入至已訓(xùn)練的學(xué)生網(wǎng)絡(luò)中的第二神經(jīng)網(wǎng)絡(luò),以由所述第二神經(jīng)網(wǎng)絡(luò)將所述特征描述向量與所述非標(biāo)準(zhǔn)特征向量進(jìn)行融合得到融合向量,利用所述融合向量生成第二圖像;
將所述第二圖像確定為所述目標(biāo)樣本。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述第二神經(jīng)網(wǎng)絡(luò)包括融合層;所述特征描述向量與所述非標(biāo)準(zhǔn)特征向量的維度相同;
所述第二神經(jīng)網(wǎng)絡(luò)將所述特征描述向量與所述非標(biāo)準(zhǔn)特征向量進(jìn)行融合得到融合向量,包括:
所述第二神經(jīng)網(wǎng)絡(luò)利用融合層將所述特征描述向量與所述非標(biāo)準(zhǔn)特征向量執(zhí)行疊加處理得到所述融合向量。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述第二神經(jīng)網(wǎng)絡(luò)包括全連接層和融合層;所述特征描述向量與所述非標(biāo)準(zhǔn)特征向量的維度不同;
所述第二神經(jīng)網(wǎng)絡(luò)將所述特征描述向量與所述非標(biāo)準(zhǔn)特征向量進(jìn)行融合得到融合向量,包括:
所述第二神經(jīng)網(wǎng)絡(luò)利用全連接層將所述非標(biāo)準(zhǔn)特征向量映射為維度與所述特征描述向量的維度相同的參考向量;
所述第二神經(jīng)網(wǎng)絡(luò)利用融合層將所述特征描述向量與參考向量執(zhí)行疊加處理得到所述融合向量。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于杭州海康威視數(shù)字技術(shù)股份有限公司,未經(jīng)杭州??低晹?shù)字技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910233792.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測(cè)系統(tǒng)
- 樣本分析裝置、樣本檢測(cè)設(shè)備及樣本檢測(cè)方法
- 樣本檢測(cè)方法、樣本檢測(cè)裝置及樣本檢測(cè)系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





