[發(fā)明專利]基于部首的書法字檢索方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201210123122.0 | 申請(qǐng)日: | 2012-04-24 |
| 公開(公告)號(hào): | CN102663127A | 公開(公告)日: | 2012-09-12 |
| 發(fā)明(設(shè)計(jì))人: | 莊越挺;吳江琴;夏洋;高鵬程;林媛 | 申請(qǐng)(專利權(quán))人: | 浙江大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 張法高 |
| 地址: | 310027 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 部首 書法 檢索 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及書法字相關(guān)信息庫(kù)的建立,尤其涉及一種基于部首的書法字檢索的方法。
背景技術(shù)
書法是中國(guó)土生土長(zhǎng)的藝術(shù),有著悠久、深厚的文化底蘊(yùn)。古代大量的優(yōu)秀書法作品都是全人類寶貴的歷史文化遺產(chǎn)。數(shù)字化的書法作品可以通過作品名稱、作者和朝代等信息進(jìn)行檢索,?但這遠(yuǎn)遠(yuǎn)滿足不了人們的需求,而書法作品圖像難以通過OCR識(shí)別,基于內(nèi)容的書法字檢索相對(duì)較難,原因在于書法字具有如下特性:1)筆劃變形。橫筆不平,豎筆不直,折筆拐角變圓弧。有時(shí)是為美感而故意扭曲筆畫,如枯筆字。2)復(fù)雜性。書法字風(fēng)格各異。與印刷體相比,該連接的筆畫沒接上,不該接的卻連接在一起。3)模糊性。由于原始作品飽經(jīng)歷史滄桑,或受自然因素影響,有許多腐蝕和污染的地方,嚴(yán)重的甚至出現(xiàn)部分筆畫缺失的現(xiàn)象。目前書法字檢索技術(shù)的研究成果很少。?MultiMedia?2004年(Retrieval?of?Chinese?calligraphic?charcter?image?2004:?17-24)提出一種對(duì)書法字的檢索多采用基于輪廓相似性的方法。為了加快檢索速度,第十五屆ACM?International?Conference?on?Information?and?Knowledge?Management?2006,(Towards?interactive?indexing?for?large?Chinese?calligraphic?character?databases?2006:?884-885)對(duì)書法字?jǐn)?shù)據(jù)庫(kù)的高維特征建理論上,?基于內(nèi)容的書法字檢索與基于內(nèi)容的圖像檢索(?content?based?image?retrieval,?CBIR)?十分接近。CBIR?通常是通過比較顏色、紋理和形狀等特征實(shí)現(xiàn)的。?但是對(duì)于書法字來說,?在這3個(gè)特征中,?僅形狀特征是有意義的。?《計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào)》2009年(基于骨架相似性的書法字檢索)提出一種基于骨架的書法字檢索方法,將書法字進(jìn)行細(xì)化形成骨架,再對(duì)骨架進(jìn)行特征提取及匹配,達(dá)到檢索目的,但是真正實(shí)施起來書法字的骨架提取難度特別大,而且提取出來的骨架并不規(guī)整,檢索速度比較慢。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,結(jié)合中國(guó)人對(duì)漢字的理解,提供一種基于部首的書法字檢索的方法。
基于部首的書法字檢索方法包括以下步驟:
1)應(yīng)用書法作品切割工具切割書法字,首先將書法作品二值化并且進(jìn)行平滑降噪處理,然后運(yùn)用最小包圍盒的方法對(duì)二值化后的圖片進(jìn)行切割記錄書法字位置信息,最后根據(jù)書法字位置信息將書法字從原作品切割出來,建立書法字圖片庫(kù);
2)應(yīng)用標(biāo)注系統(tǒng)對(duì)書法字圖片進(jìn)行語(yǔ)義標(biāo)注,利用步驟1)切割過程中產(chǎn)生的位置信息在書法作品中標(biāo)記當(dāng)前書法字,對(duì)照原作品上下文對(duì)書法字圖片進(jìn)行語(yǔ)義標(biāo)注,建立書法字信息庫(kù),語(yǔ)義標(biāo)注內(nèi)容包括:語(yǔ)義、繁簡(jiǎn)體、書體,書體包括楷書、草書、行書、篆書、隸書;
3)根據(jù)GB2312-80規(guī)范建立擁有一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè)的漢字信息索引庫(kù);
4)基于部首的書法字檢索,用戶首先選擇偏旁部首筆畫,然后選擇部首,書法字檢索系統(tǒng)根據(jù)所選部首查詢漢字信息索引庫(kù),檢索所有擁有該部首的漢字,再根據(jù)檢索到的漢字查詢書法字信息庫(kù),檢索漢字對(duì)應(yīng)的書法字,并將檢索到的書法字圖片展示給用戶。
所述步驟1)為:
2.1)將輸入的書法作品轉(zhuǎn)化為灰度圖:
Gray?=?R*0.299?+?G*0.587?+?B*0.114;
其中R為紅色像素值,G為綠色像素值,B為藍(lán)色像素值,Gray為灰度值。
2.2)計(jì)算灰度圖的閾值,首先計(jì)算出圖片中所有像素的最高灰度值iMaxGrayValue和最低灰度值iMinGrayValue:
iMinGrayValue=MIN(Gray.?getColor(i,j,c)|0?<i<?Gray.getWidth(),0<j<Gray.getHeight());
iMaxGrayValue=MAX?(Gray.?getColor(i,j,c)|0?<i<?Gray.getWidth(),0<j<Gray.getHeight());
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210123122.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:SO8塑料封裝傳感器
- 下一篇:微米顆粒體復(fù)合納米碳酸鈣的制備方法
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 書法字識(shí)別方法
- 書法碼生成方法及系統(tǒng)、解析方法及系統(tǒng)以及書法碼標(biāo)簽
- 文化場(chǎng)館書法體驗(yàn)系統(tǒng)
- 探尋數(shù)字書法互動(dòng)體驗(yàn)設(shè)備及體驗(yàn)方法
- 探尋數(shù)字書法互動(dòng)體驗(yàn)設(shè)備
- 構(gòu)建書法浮雕深度學(xué)習(xí)網(wǎng)絡(luò)的方法及構(gòu)建書法浮雕的方法
- 個(gè)人風(fēng)格書法字字庫(kù)生成方法及系統(tǒng)
- 基于書法資源數(shù)字化體驗(yàn)的智慧教學(xué)平臺(tái)及其使用方法
- 一種智慧書法管理系統(tǒng)
- 書法作品風(fēng)格遷移系統(tǒng)、方法及終端





