[發(fā)明專利]一種無色差立體字符圖像采集方法、增強(qiáng)方法及識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110391817.6 | 申請(qǐng)日: | 2021-04-12 |
| 公開(公告)號(hào): | CN113076940A | 公開(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計(jì))人: | 王鵬;李紅云;陳軍希 | 申請(qǐng)(專利權(quán))人: | 福建省德騰智能科技有限公司 |
| 主分類號(hào): | G06K9/20 | 分類號(hào): | G06K9/20;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06T5/00;B65G43/08 |
| 代理公司: | 泉州協(xié)創(chuàng)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 35231 | 代理人: | 鄭浩 |
| 地址: | 362200 福建省泉州市晉江*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 色差 立體 字符 圖像 采集 方法 增強(qiáng) 識(shí)別 | ||
1.一種無色差立體字符圖像采集方法,其特征在于,包括以下步驟:
將具有無色差立體字符的目標(biāo)物體置于預(yù)定的采集位置;
通過表面光源從無色差立體字符的正面照亮目標(biāo)物體,通過線性光源從無色差立體字符的斜側(cè)面照亮目標(biāo)物體;
通過攝影設(shè)備從無色差立體字符的正面拍攝被照亮的目標(biāo)物體;
通過計(jì)算機(jī)獲取攝影設(shè)備拍攝到的無色差立體字符的二維圖像。
2.根據(jù)權(quán)利要求1所述的無色差立體字符圖像采集方法,其特征在于:通過輸送機(jī)構(gòu)將具有無色差立體字符的目標(biāo)物體輸送至預(yù)定的采集位置;所述輸送機(jī)構(gòu)為帶式輸送機(jī)、鏈?zhǔn)捷斔蜋C(jī)或板式輸送機(jī)。
3.根據(jù)權(quán)利要求1所述的無色差立體字符圖像采集方法,其特征在于:所述計(jì)算機(jī)通過控制器控制攝影設(shè)備進(jìn)行拍攝;所述控制器為PLC;所述攝影設(shè)備為照相機(jī)或攝像機(jī)。
4.根據(jù)權(quán)利要求1所述的無色差立體字符圖像采集方法,其特征在于:所述線性光源的兩端側(cè)面垂直于采集位置所處的平面。
5.根據(jù)權(quán)利要求1所述的無色差立體字符圖像采集方法,其特征在于:所述線性光源的照射方向與表面光源的照射方向之間形成30~60°夾角。
6.根據(jù)權(quán)利要求1所述的無色差立體字符圖像采集方法,其特征在于:所述表面光源為白色表面光源,所述線性光源為白色線性光源。
7.一種基于卷積神經(jīng)網(wǎng)絡(luò)的無色差立體字符圖像增強(qiáng)方法,其特征在于,包括:
對(duì)具有無色差立體字符的目標(biāo)物體進(jìn)行圖像采集,得到無色差立體字符的原始圖像;
其中,所述圖像采集的采集方法包含:
將具有無色差立體字符的目標(biāo)物體置于預(yù)定的采集位置;
通過表面光源從無色差立體字符的正面照亮目標(biāo)物體,通過線性光源從無色差立體字符的斜側(cè)面照亮目標(biāo)物體;
通過攝影設(shè)備從無色差立體字符的正面拍攝被照亮的目標(biāo)物體;
通過計(jì)算機(jī)獲取攝影設(shè)備拍攝到的無色差立體字符的二維圖像,即得到無色差立體字符的原始圖像;
采用卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)無色差立體字符的原始圖像進(jìn)行增強(qiáng)處理,提高無色差立體字符所在區(qū)域與周圍背景的對(duì)比度,得到無色差立體字符的增強(qiáng)圖像;
其中,所述卷積神經(jīng)網(wǎng)絡(luò)模型包含依次連接的輸入層、若干個(gè)用于特征提取的卷積層和輸出層,每個(gè)卷積層的輸入端均設(shè)置有泄漏整流線性單元,輸出層采用SoftMax函數(shù)作為激活函數(shù)以產(chǎn)生最終的分類結(jié)果;首先輸入無色差立體字符的原始圖像,然后利用若干個(gè)所述卷積層依次對(duì)無色差立體字符的原始圖像進(jìn)行特征提取,最后輸出無色差立體字符的增強(qiáng)圖像。
8.根據(jù)權(quán)利要求4所述的一種基于卷積神經(jīng)網(wǎng)絡(luò)的無色差立體字符增強(qiáng)方法,其特征在于:所述卷積神經(jīng)網(wǎng)絡(luò)模型是在包含預(yù)定數(shù)量原始圖像的數(shù)據(jù)集上訓(xùn)練的,將原始圖像的數(shù)據(jù)集進(jìn)行手動(dòng)標(biāo)注,得到標(biāo)注圖像的數(shù)據(jù)集;將標(biāo)注圖像的數(shù)據(jù)集分為標(biāo)注訓(xùn)練集和標(biāo)注測(cè)試集;將原始圖像的數(shù)據(jù)集分為原始訓(xùn)練集和原始測(cè)試集;
訓(xùn)練采用優(yōu)化的均方損失平均數(shù)的數(shù)學(xué)模型:
其中,I表示輸入標(biāo)注圖像,F(xiàn)(I)表示訓(xùn)練過程中的輸出,Y表示真實(shí)值,W是與輸入標(biāo)注圖像大小相同的權(quán)重矩陣,i、j表示坐標(biāo),N表示輸入標(biāo)注圖像大小;矩陣W是一個(gè)置信度權(quán)重,用于衡量地面真理具有的確定性程度,由以下得出:
其中,D表示一個(gè)距離圖,該距離圖標(biāo)注了原始圖像的每個(gè)像素,并具有到原始圖像中最接近的輪廓像素的距離;d是模擬標(biāo)簽偏差的閾值;w是代表標(biāo)簽確定性的參數(shù);
在每個(gè)卷積層中使用5×5的內(nèi)核大小,并使用學(xué)習(xí)率10-4的Adam優(yōu)化訓(xùn)練網(wǎng)絡(luò);
具體訓(xùn)練方法包括:
在標(biāo)注訓(xùn)練集上執(zhí)行卷積神經(jīng)網(wǎng)絡(luò)算法,生成卷積神經(jīng)網(wǎng)絡(luò)模型;
在標(biāo)注測(cè)試集上執(zhí)行卷積神經(jīng)網(wǎng)絡(luò)模型,生成增強(qiáng)圖像;
將增強(qiáng)圖像與標(biāo)記圖像進(jìn)行比較,評(píng)估增強(qiáng)處理的準(zhǔn)確性。
9.一種基于卷積神經(jīng)網(wǎng)絡(luò)的無色差立體字符圖像識(shí)別方法,其特征在于,包括:
對(duì)具有無色差立體字符的目標(biāo)物體進(jìn)行圖像采集,得到無色差立體字符的原始圖像;
其中,所述圖像采集的采集方法包含:
將具有無色差立體字符的目標(biāo)物體置于預(yù)定的采集位置;
通過表面光源從無色差立體字符的正面照亮目標(biāo)物體,通過線性光源從無色差立體字符的斜側(cè)面照亮目標(biāo)物體;
通過攝影設(shè)備從無色差立體字符的正面拍攝被照亮的目標(biāo)物體;
通過計(jì)算機(jī)獲取攝影設(shè)備拍攝到的無色差立體字符的二維圖像,即得到無色差立體字符的原始圖像;
采用卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)無色差立體字符的原始圖像進(jìn)行增強(qiáng)處理,提高無色差立體字符所在區(qū)域與周圍背景的對(duì)比度,得到無色差立體字符的增強(qiáng)圖像;
其中,所述卷積神經(jīng)網(wǎng)絡(luò)模型包含依次連接的輸入層、若干個(gè)用于特征提取的卷積層和輸出層,每個(gè)卷積層的輸入端均設(shè)置有泄漏整流線性單元,輸出層采用SoftMax函數(shù)作為激活函數(shù)以產(chǎn)生最終的分類結(jié)果;首先輸入無色差立體字符的原始圖像,然后利用若干個(gè)所述卷積層依次對(duì)無色差立體字符的原始圖像進(jìn)行特征提取,最后輸出無色差立體字符的增強(qiáng)圖像;
采用常規(guī)的OCR算法對(duì)無色差立體字符的增強(qiáng)圖像進(jìn)行識(shí)別,提取出字符信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建省德騰智能科技有限公司,未經(jīng)福建省德騰智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110391817.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種具備三防功能的指靜脈門鎖
- 下一篇:像素驅(qū)動(dòng)電路
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 色差分量視訊的顯示方法以及支持多種時(shí)序色差分量的顯示裝置
- 編碼設(shè)備、編碼方法、記錄介質(zhì)和圖像處理裝置
- 一種綜合目測(cè)、ICC標(biāo)準(zhǔn)和自定義標(biāo)準(zhǔn)的數(shù)碼打樣質(zhì)量評(píng)估方法
- 不同色差等級(jí)彩色樣品的色差評(píng)價(jià)及計(jì)算方法
- 顯示裝置及調(diào)整顯示裝置色差的方法
- 色差儀輔助工具及色差測(cè)量裝置
- 內(nèi)窺鏡光學(xué)系統(tǒng)及物鏡光學(xué)組件
- 一種在線檢測(cè)滌綸長絲色澤系統(tǒng)
- 色差檢測(cè)儀固定裝置
- 三維物體色差計(jì)算方法及裝置、三維物體色差計(jì)算系統(tǒng)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





