[發明專利]一種基于距離優化降維的手寫字體識別系統有效
| 申請號: | 201610048955.3 | 申請日: | 2016-01-25 |
| 公開(公告)號: | CN105740784B | 公開(公告)日: | 2019-01-08 |
| 發明(設計)人: | 康琦;張華巍;曹貽社;郝進偉;曲毅 | 申請(專利權)人: | 毅康科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京中濟緯天專利代理有限公司 11429 | 代理人: | 馬國冉 |
| 地址: | 264006 山東省煙臺*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 距離 優化 手寫 字體 識別 系統 | ||
本發明屬于圖像處理與識別技術領域,尤其涉及一種基于距離優化降維的手寫字體識別系統,包括手寫字體庫、手寫字體識別平臺、手寫字體輸出模塊,所述手寫字體識別平臺包括采用的識別方法包括第一步驟、第二步驟、第三步驟、第四步驟、第五步驟、第六步驟,本發明解決了數據挖掘、處理手段往往對低維數據有效,高維數據由于經常包含大量冗余信息、對結果影響較小的變量、與其他變量相關性較強的變量,降低了算法的效率和數據處理分析的準確性的問題,具有有利于距離的計算、保證了旋轉、縮放、平移的不變性、能夠對手寫字體圖像進行有效處理、去除不相干變量,突出幾個隱含變量的有益技術效果。
技術領域
本發明屬于圖像處理與識別技術領域,尤其涉及一種基于距離優化降維的手寫字體識別系統。
背景技術
數據降維是針對高維數據處理問題提出的有效解決辦法。在實際數據采集的過程中,一個觀察對象往往需要用多個變量表示,這些信息抽象出來便成為了高維數據,如圖像處理中,人像、位姿、字體等圖像對應的高維數據。現有的數據挖掘、處理手段往往對低維數據有效,高維數據由于經常包含大量冗余信息,例如對結果影響較小的變量、與其他變量相關性較強的變量,降低了算法的效率和數據處理分析的準確性,如何把數據的維數降低到一個合理的大小,把高維數據變成低維數據,同時盡可能保留原始數據的關鍵信息,是對手寫字體圖像進行有效識別的關鍵,現有技術存在數據挖掘、處理手段往往對低維數據有效,高維數據由于經常包含大量冗余信息、對結果影響較小的變量、與其他變量相關性較強的變量,降低了算法的效率和數據處理分析的準確性的問題。
發明內容
本發明提供一種基于距離優化降維的手寫字體識別系統,以解決上述背景技術中提出存在數據挖掘、處理手段往往對低維數據有效,高維數據由于經常包含大量冗余信息、對結果影響較小的變量、與其他變量相關性較強的變量,降低了算法的效率和數據處理分析的準確性的問題。
本發明所解決的技術問題采用以下技術方案來實現:一種基于距離優化降維的手寫字體識別系統,包括手寫字體庫、手寫字體識別平臺、手寫字體輸出模塊,所述手寫字體識別平臺包括:查找模塊、重建模塊、嵌入模塊;
所述查找模塊用于確定每個樣本點的個近鄰點;
所述確定每個樣本點的個近鄰點包括:
第一步驟:計算低維度距離矩陣的距離元素:
所述xi為第一樣本點,所述第一樣本點為樣本矩陣中任一樣本點;
所述xj為第二樣本點,所述第二樣本點為樣本矩陣中除第一樣本點外另一樣本點;
所述M(i)為第一樣本點與樣本庫其余樣本點之間距離的平均值;
所述M(j)為第二樣本點與樣本庫其余樣本點之間距離的平均值;
所述為第一樣本點和第二樣本點之間的距離;
第二步驟:根據距離元素確定樣本點相應的K個近鄰點,所述K為預設定值;
所述重建模塊用于根據每個樣本點的近鄰點計算出該樣本點的局部重建權值矩陣;
計算出該樣本點的局部重建權值矩陣包括:
第三步驟:建立局部協方差矩陣:
Zjm=(xi-xij)T(xi-xim)
所述Zjm為樣本點xi的局部協方差矩陣;
所述xij為樣本點xi的K個近鄰點;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于毅康科技有限公司,未經毅康科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610048955.3/2.html,轉載請聲明來源鉆瓜專利網。





